DESARROLLO DE UN MODELO PREDICTIVO IN SILICO PARA LA ESTIMACIÓN DE LA TOXICIDAD DE MOLÉCULAS UTILIZANDO DATOS PÚBLICOS E INTELIGENCIA ARTIFICIAL

Autores/as

DOI:

https://doi.org/10.51891/rease.v12i1.23728

Palabras clave:

Toxicidad molecular. Inteligencia artificial. Modelo predictivo in sílico.

Resumen

Este artículo buscó desarrollar un modelo predictivo in silico, implementado en Python, para estimar la toxicidad de pequeñas moléculas orgánicas utilizando datos públicos y técnicas de Inteligencia Artificial. Se construyó un conjunto de datos con 200 moléculas que contienen hasta 10 átomos de carbono a partir del repositorio PubChem, priorizando compuestos halogenados y amínicos estructuralmente relacionados con cloraminas y halometanos. Se extrajeron descriptores estructurales y fisicoquímicos, incluyendo masa molar, tipo de cadena, número de halógenos, proporción halógeno/carbono, anillos alifáticos y aromáticos, carbonos quirales y función orgánica principal, además de una variable objetivo binaria de toxicidad. El modelado se realizó en Google Colab utilizando Random Forest y regresión logística, con el desbalance de clases tratado mediante SMOTENC y el desempeño evaluado por holdout (70/30) y validación cruzada estratificada. El modelo Random Forest presentó un desempeño global superior (accuracy 0,9333; balanced accuracy 0,8693; ROC-AUC 0,9673), mientras que la regresión logística maximizó el recall (0,9804) y ofreció mayor interpretabilidad, indicando mayor riesgo asociado a la halogenación y a la aromaticidad y un efecto protector de los anillos alifáticos y de un mayor número de hidrógenos unidos al nitrógeno. Se concluye que el pipeline propuesto es prometedor para el cribado toxicológico preliminar, aunque la ampliación y la validación externa de la base de datos son esenciales para aumentar la robustez y la capacidad de generalización de los modelos.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Casimiro Waete Agostinho, Centro Universitário Única

Discente do curso de Ciência de Dados e Inteligência Artificial do Centro Universitário Única.

Grazielly Honorio Rodrigues de Freitas, Centro Universitário Única

Discente do curso de Química do Centro Universitário Única.

John Henrique Soares Costa, Centro Universitário Única

Discente do curso de Farmácia do Centro Universitário Única.

Maria Eduarda de Melo Pretes, Centro Universitário Única

Discente do curso de Farmácia do Centro Universitário Única.

William Argolo Saliba, Centro Universitário Única

Docente do Centro Universitário Única - Prof. Orientador. Centro Universitário Única – UNIÚNICA.

 

Publicado

2026-01-20

Cómo citar

Agostinho, C. W., Freitas, G. H. R. de, Costa, J. H. S., Pretes, M. E. de M., & Saliba, W. A. (2026). DESARROLLO DE UN MODELO PREDICTIVO IN SILICO PARA LA ESTIMACIÓN DE LA TOXICIDAD DE MOLÉCULAS UTILIZANDO DATOS PÚBLICOS E INTELIGENCIA ARTIFICIAL. Revista Ibero-Americana De Humanidades, Ciências E Educação, 12(1), 1–15. https://doi.org/10.51891/rease.v12i1.23728