DESARROLLO DE UN MODELO PREDICTIVO IN SILICO PARA LA ESTIMACIÓN DE LA TOXICIDAD DE MOLÉCULAS UTILIZANDO DATOS PÚBLICOS E INTELIGENCIA ARTIFICIAL
DOI:
https://doi.org/10.51891/rease.v12i1.23728Palabras clave:
Toxicidad molecular. Inteligencia artificial. Modelo predictivo in sílico.Resumen
Este artículo buscó desarrollar un modelo predictivo in silico, implementado en Python, para estimar la toxicidad de pequeñas moléculas orgánicas utilizando datos públicos y técnicas de Inteligencia Artificial. Se construyó un conjunto de datos con 200 moléculas que contienen hasta 10 átomos de carbono a partir del repositorio PubChem, priorizando compuestos halogenados y amínicos estructuralmente relacionados con cloraminas y halometanos. Se extrajeron descriptores estructurales y fisicoquímicos, incluyendo masa molar, tipo de cadena, número de halógenos, proporción halógeno/carbono, anillos alifáticos y aromáticos, carbonos quirales y función orgánica principal, además de una variable objetivo binaria de toxicidad. El modelado se realizó en Google Colab utilizando Random Forest y regresión logística, con el desbalance de clases tratado mediante SMOTENC y el desempeño evaluado por holdout (70/30) y validación cruzada estratificada. El modelo Random Forest presentó un desempeño global superior (accuracy 0,9333; balanced accuracy 0,8693; ROC-AUC 0,9673), mientras que la regresión logística maximizó el recall (0,9804) y ofreció mayor interpretabilidad, indicando mayor riesgo asociado a la halogenación y a la aromaticidad y un efecto protector de los anillos alifáticos y de un mayor número de hidrógenos unidos al nitrógeno. Se concluye que el pipeline propuesto es prometedor para el cribado toxicológico preliminar, aunque la ampliación y la validación externa de la base de datos son esenciales para aumentar la robustez y la capacidad de generalización de los modelos.
Descargas
Descargas
Publicado
Cómo citar
Número
Sección
Categorías
Licencia
Atribuição CC BY