Vés al contingut

Estudis

Reconeixement digital d’estructures químiques dibuixades a mà

17 juny 2021

IQS Tech Transfer i l’empresa Vision Aracanum col·laboren en un projecte per aconseguir el reconeixement digital d’estructures químiques dibuixades a mà, en pantalla tàctil o en paper, utilitzant modernes tècniques de visió per ordinador (Modern Computer Vision Techniques) basades en Machine Learning.

IQS Tech Transfer i l’empresa Vision Arcanum col·laboren en un projecte amb l’objectiu d’aconseguir el reconeixement digital d’estructures químiques dibuixades a mà, en pantalla tàctil o en paper, utilitzant modernes tècniques de visió per ordinador (Modern Computer Vision Techniques) basades en Machine Learning.

El dibuix d’estructures químiques és una representació gràfica, compacta i expressiva, dels compostos químics. La notació és estàndard i ben interpretada en diversos camps d’aplicació. Per a un químic, les fórmules estructurals són a tot arreu:  apunts, textos, anotacions de laboratori, publicacions científiques, pissarres, tovallons, etc. Estan escrites a mà o generades utilitzant eines de software. En certs casos, és necessari convertir una fórmula estructural, que transmet molta informació a un ésser humà, a un format apte per ordinador. De forma ideal, desitjaríem que l’ordinador reconegués i  entengués les fórmules estructurals, però això no és sempre una tasca senzilla.

Quan es tracta de reconeixement d’estructures, existeixen tres nivells de dificultat. En el cas més simple, l’estructura a reconèixer ha estat originalment generada per un ordinador, procedent, per exemple, d’un pdf d’un article científic, o escanejada d’un llibre o document. Poden ser imatges ‘amb soroll’, però les línies seran típicament rectes i els nivells clarament llegibles. En aquest cas, el reconeixement pot, fins a cert punt, realitzar-se mitjançant eines com OSRA, Imago, ChemOCR, etc.

El següent nivell de dificultat és el reconeixement d’estructures dibuixades a mà en una pantalla. La informació que procedeix del llapis digital ajuda a desxifrar possibles ambigüitats de la interpretació i és especialment rellevant per a la detecció de les etiquetes atòmiques. Actualment, aquest tipus de reconeixement és més notable, quan els sistemes d’escriptura de notes digitals són més comuns, gràcies a dispositius com Apple iPad o Microsoft Surface.

El cas més difícil és el reconeixement d’estructures dibuixades a mà utilitzant llapis i paper. Les fotos o escanejos dels dibuixos sempre presenten soroll visual addicional. Combinat amb l’escriptura a mà desordenada, aquesta situació és el repte més dur. És en aquesta complexa tasca on sorgeix la col·laboració entre Vision Arcanum i IQS.

Vision Arcanum és una petita empresa especialitzada en el desenvolupament de sistemes de reconeixement d’estructures mitjançant suports digitals, amb l’objectiu posat en els dos darrers nivells de dificultat: estructures dibuixades a mà en pantalla tàctil o en paper. Aquesta aproximació permet resoldre la variabilitat de “les entrades” dibuixades a mà, però requereix de grans quantitats de dades d’alta qualitat. En paraules d’Ismael Zamora, “creiem que un dibuix a mà és la forma més natural de recuperar la informació química, ja que es pot utilitzar directament tant en educació, com en un entorn professional en reunions de conceptualització, així com generar les entrades per a càlculs i cerques en bases de dades”.

Col·laboració amb IQS Tech Transfer

El projecte de col·laboració amb IQS Tech Transfer té com a objectiu recopilar les dades necessàries per a l’entrenament de sistemes basats en Machine Learning. Amb la col·laboració dels professors del Departament de Bioenginyeria d’ IQS School of Engineering, la Dra. Magda Faijes, el Dr. Xevi Biarnés i el Dr. Antoni Planas – coordinadors de l’assaig per a la recollida de dades de dibuix de molècules en una pantalla tàctil –, es van mobilitzar els recursos necessaris – tauletes tàctils i llapis digitals – i es va implicar a una quantitat important de participants voluntaris, amb una gran varietat de perfils: des d’estudiants universitaris de primer any fins a professors d’IQS.

Amb l’aportació de dades des de la col·laboració amb IQS, podrem millorar la precisió dels nostres models i augmentar el rendiment global del reconeixement”, són paraules dels responsables de Vision Arcanum.

Per a IQS, ha representat una oportunitat d’oferir a la indústria el talent dels seus professors i estudiants i professors. El projecte ha permès conèixer de primera mà el desenvolupament d’una de les tecnologies d’intel·ligència artificial aplicada al reconeixement d’estructures químiques”, afirmen els coordinadors d’IQS.

Un dels col·lectius que ha participat en l’estudi ha estat el dels estudiants de doctorat d’IQS. Una de les participants, investigadora del Laboratori de Disseny Molecular del Grup de Química Farmacèutica d’IQS, afirma. “Participar com a voluntària en la recollida de dades d’aquest projecte ha estat molt enriquidor, alhora que il·luminador. Els que ens dediquem a implementar Machine Learning als nostres estudis sabem el gran valor que suposen unes bases de dades extenses i amb fonts diverses, per així millorar i validar els nostres models. De manera que IQS, amb la seva plantilla plural, suposava una població ideal per a l’assaig. Considero que l’eina que està desenvolupant Vision Arcanum serà de gran vàlua per als químics, de manera que ha estat un honor formar part d’aquest estudi”.