La fórmula estructural para un compuesto da la misma información que su fórmula molecular (los tipos y números de átomos en la molécula), pero además muestra cómo los átomos están conectados en la molécula… por ello son vitales en la química. Pero, ¿qué pasa si las computadoras no entienden esos garabatos?
Investigadores han creado DECIMER.ai «Deep Learning for Chemical Image Recognition» (aprendizaje profundo para el reconocimiento químico de imágenes), una herramienta que convierte esas fórmulas en un lenguaje inteligible por la máquina. Además, no beneficia solo a la química, sino a múltiples campos como medicina, biología molecular y más.
Desde imágenes a códigos
Hablemos de OCSR (Reconocimiento Óptico de Estructuras Químicas). Durante décadas, ha habido avances, pero muchos de estos son propietarios o simplemente inaccesibles. Lo bueno de DECIMER.ai es que no solo reconoce, sino que segmenta e identifica estructuras químicas en literatura científica. Además, no depende de reglas preestablecidas; ¡todo se basa en el entrenamiento a partir de más 450 millones imágenes con fragmentos de estructuras que se han utilizado!
DECIMER.ai en acción
Lo interesante de esta plataforma es su enfoque tridimensional: segmentación, clasificación y traducción. Incluye herramientas como DECIMER Segmentation, que detecta y segmenta estructuras; DECIMER Image Classifier, que identifica imágenes con estructuras químicas; y DECIMER Image Transformer, que las convierte en un formato legible por máquina. Todo ello sin necesidad de reglas preestablecidas, confiando únicamente en los datos de entrenamiento.
Por si no fuera poco, lo mejor es que DECIMER.ai es de código abierto. Cualquiera puede acceder, modificar y redistribuir. Está disponible tanto en GitHub como en una aplicación web en decimer.ai. Además, al estar diseñado en Python, su implementación es muy sencilla para los aficionados a la programación.
Mirando hacia el futuro
Con herramientas como DECIMER, el horizonte de la química digital se ve más brillante que nunca. No solo simplifica y acelera la recopilación de datos, sino que también asegura que la información esté disponible de manera más accesible para la comunidad global.
1589