DESENVOLVIMENTO DE UM MODELO PREDITIVO IN SILICO PARA ESTIMATIVA DE TOXICIDADE DE MOLÉCULAS UTILIZANDO DADOS PÚBLICOS E INTELIGÊNCIA ARTIFICIAL

Casimiro Waete Agostinho; Grazielly Honorio Rodrigues de Freitas; John Henrique Soares Costa; Maria Eduarda de Melo Pretes; William Argolo Saliba

doi:10.51891/rease.v12i1.23728

Autores/as

Casimiro Waete Agostinho Centro Universitário Única https://orcid.org/0009-0009-7482-2959
Grazielly Honorio Rodrigues de Freitas Centro Universitário Única https://orcid.org/0009-0007-3117-5582
John Henrique Soares Costa Centro Universitário Única https://orcid.org/0009-0008-5547-9457
Maria Eduarda de Melo Pretes Centro Universitário Única https://orcid.org/0009-0009-3777-3799
William Argolo Saliba Centro Universitário Única

DOI:

https://doi.org/10.51891/rease.v12i1.23728

Palabras clave:

Toxicidad molecular. Inteligencia artificial. Modelo predictivo in sílico.

Resumen

Este artículo buscó desarrollar un modelo predictivo in silico, implementado en Python, para estimar la toxicidad de pequeñas moléculas orgánicas utilizando datos públicos y técnicas de Inteligencia Artificial. Se construyó un conjunto de datos con 200 moléculas que contienen hasta 10 átomos de carbono a partir del repositorio PubChem, priorizando compuestos halogenados y amínicos estructuralmente relacionados con cloraminas y halometanos. Se extrajeron descriptores estructurales y fisicoquímicos, incluyendo masa molar, tipo de cadena, número de halógenos, proporción halógeno/carbono, anillos alifáticos y aromáticos, carbonos quirales y función orgánica principal, además de una variable objetivo binaria de toxicidad. El modelado se realizó en Google Colab utilizando Random Forest y regresión logística, con el desbalance de clases tratado mediante SMOTENC y el desempeño evaluado por holdout (70/30) y validación cruzada estratificada. El modelo Random Forest presentó un desempeño global superior (accuracy 0,9333; balanced accuracy 0,8693; ROC-AUC 0,9673), mientras que la regresión logística maximizó el recall (0,9804) y ofreció mayor interpretabilidad, indicando mayor riesgo asociado a la halogenación y a la aromaticidad y un efecto protector de los anillos alifáticos y de un mayor número de hidrógenos unidos al nitrógeno. Se concluye que el pipeline propuesto es prometedor para el cribado toxicológico preliminar, aunque la ampliación y la validación externa de la base de datos son esenciales para aumentar la robustez y la capacidad de generalización de los modelos.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Casimiro Waete Agostinho, Centro Universitário Única

Discente do curso de Ciência de Dados e Inteligência Artificial do Centro Universitário Única.

Grazielly Honorio Rodrigues de Freitas, Centro Universitário Única

Discente do curso de Química do Centro Universitário Única.

John Henrique Soares Costa, Centro Universitário Única

Discente do curso de Farmácia do Centro Universitário Única.

Maria Eduarda de Melo Pretes, Centro Universitário Única

Discente do curso de Farmácia do Centro Universitário Única.

William Argolo Saliba, Centro Universitário Única

Docente do Centro Universitário Única - Prof. Orientador. Centro Universitário Única – UNIÚNICA.

DESARROLLO DE UN MODELO PREDICTIVO IN SILICO PARA LA ESTIMACIÓN DE LA TOXICIDAD DE MOLÉCULAS UTILIZANDO DATOS PÚBLICOS E INTELIGENCIA ARTIFICIAL

Autores/as

DOI:

Palabras clave:

Resumen

Descargas

Biografía del autor/a

Casimiro Waete Agostinho, Centro Universitário Única

Grazielly Honorio Rodrigues de Freitas, Centro Universitário Única

John Henrique Soares Costa, Centro Universitário Única

Maria Eduarda de Melo Pretes, Centro Universitário Única

William Argolo Saliba, Centro Universitário Única

Descargas

Publicado

Cómo citar

Número

Sección

Categorías

Licencia

Atribuição CC BY

Enviar un artículo

Idioma