Investigadores de la Universidad Tecnológica de Kaunas (KTU) han sido pioneros en un modelo de inteligencia artificial que diagnostica la depresión con un 97.53% de precisión mediante el análisis del habla y la actividad neuronal del cerebro, lo que marca un avance significativo en el diagnóstico de la salud mental.
La depresión afecta a aproximadamente 280 millones de personas en todo el mundo y diagnosticarla con precisión siempre ha sido un desafío importante. Los investigadores de la Universidad Tecnológica de Kaunas (KTU) han logrado un gran avance en este campo al desarrollar un modelo de inteligencia artificial (IA) que puede identificar la depresión con una precisión excepcional al analizar tanto los patrones del habla como la actividad neuronal cerebral.
“La depresión es uno de los trastornos mentales más comunes, con consecuencias devastadoras tanto para el individuo como para la sociedad, por lo que estamos desarrollando un nuevo método de diagnóstico más objetivo que podría ser accesible para todos en el futuro”, dijo en un comunicado el coautor Rytis Maskeliūnas, profesor del Departamento de Ingeniería Multimedia de KTU. comunicado de prensa.
El enfoque multimodal mejora la precisión del diagnóstico
Publicado En el Brain Sciences Journal, la innovación surge de un enfoque multimodal que integra dos tipos de datos: el habla y la actividad eléctrica cerebral (EEG).
Los investigadores sostienen que, si bien la mayoría de los métodos de diagnóstico tradicionales se basan en un tipo de datos, este enfoque dual ofrece una comprensión más completa del estado emocional de una persona.
Este análisis combinado logró una impresionante precisión del 97.53% en el diagnóstico de la depresión, una mejora significativa con respecto a los métodos existentes.
“Esto se debe a que la voz añade datos al estudio que aún no podemos extraer del cerebro”, añadió Maskeliūnas.
Voz y datos cerebrales: un potente dúo diagnóstico
Según Musyyab Yousufi, estudiante de doctorado que contribuyó al proyecto, la elección de las fuentes de datos fue cuidadosamente deliberada. Señaló que, si bien las expresiones faciales pueden ofrecer cierta información sobre el estado psicológico de una persona, pueden manipularse fácilmente.
“Elegimos la voz porque puede revelar sutilmente un estado emocional, y el diagnóstico afecta el ritmo del habla, la entonación y la energía general”, dijo Yousufi en el comunicado de prensa.
La privacidad de los pacientes fue otro factor crítico a considerar. Los métodos tradicionales como el reconocimiento facial pueden inmiscuirse en la privacidad, mientras que el habla y el electroencefalograma ofrecen datos menos invasivos pero igualmente informativos.
“Recopilar y combinar datos de varias fuentes es más prometedor para su uso posterior”, añadió Maskeliūnas.
El camino a seguir: mejorar la transparencia y la comprensión de la IA
El equipo de investigación de la KTU utilizó el conjunto de datos abiertos multimodales para el análisis de trastornos mentales (MODMA) para sus datos de EEG. Estos datos se recopilaron en un entorno controlado, con los participantes en reposo y con los ojos cerrados durante cinco minutos. Al mismo tiempo, se grabó el habla natural de los participantes durante una sesión de preguntas y respuestas y mientras describían imágenes.
Para procesar estos datos, se transformaron en espectrogramas, representaciones visuales de las señales. Se emplearon filtros de ruido avanzados y un modelo de aprendizaje profundo DenseNet-121 modificado para identificar indicadores de depresión en estas imágenes.
En el futuro, este modelo de IA podría hacer que el diagnóstico de la depresión sea más rápido y más accesible, lo que podría facilitar las evaluaciones a distancia y reducir los sesgos subjetivos. Sin embargo, aún quedan desafíos por resolver.
“El principal problema de estos estudios es la falta de datos porque las personas tienden a mantener en privado sus asuntos de salud mental”, explicó Maskeliūnas.
Una tarea futura importante para los investigadores es mejorar la capacidad del algoritmo para explicar claramente su proceso de diagnóstico.
“El algoritmo todavía tiene que aprender a explicar el diagnóstico de forma comprensible”, añadió Maskeliūnas.
Implicaciones más amplias: IA explicable en la atención sanitaria
A medida que las soluciones de IA ganan terreno en campos sensibles como la atención sanitaria, las finanzas y el derecho, aumenta la demanda de inteligencia artificial explicable (XAI). La XAI tiene como objetivo hacer transparente el proceso de toma de decisiones de la IA, generando así confianza y garantizando que estos sistemas puedan integrarse de forma fiable en áreas críticas.
Con este desarrollo, KTU abre una vía prometedora hacia diagnósticos más precisos, objetivos y comprensibles de la depresión, revolucionando potencialmente la forma en que se identifican y tratan los problemas de salud mental.