La colaboración entre humanos y IA permite obtener diagnósticos médicos más precisos, según un nuevo estudio

En un estudio histórico, la combinación de la experiencia humana con la IA ha demostrado mejorar significativamente la precisión del diagnóstico en medicina, ofreciendo un camino transformador hacia el cuidado y la seguridad del paciente.

Los colectivos de diagnóstico híbridos compuestos por expertos humanos y sistemas de inteligencia artificial superan significativamente los métodos de diagnóstico tradicionales, según un estudio internacional dirigido por el Instituto Max Planck para el Desarrollo Humano.

Los errores de diagnóstico siguen siendo un desafío crítico en la práctica médica.

Si bien los sistemas de IA, especialmente los modelos de lenguaje grandes (LLM) como ChatGPT-4, Gemini y Claude 3, ofrecen un apoyo diagnóstico innovador, en ocasiones generan información falsa y reflejan sesgos existentes.

Un equipo de investigación del Instituto Max Planck para el Desarrollo Humano, en colaboración con el Proyecto de Diagnóstico Humano de San Francisco y el Instituto de Ciencias y Tecnologías Cognitivas del Consejo Nacional de Investigación de Italia, ha investigado la colaboración óptima entre humanos e IA.

Los resultados del estudio son prometedores: los colectivos de diagnóstico híbridos, que combinan aportes humanos e IA, producen una precisión diagnóstica significativamente mayor que la de los humanos o la IA por separado, en particular en casos complejos y abiertos.

“Nuestros resultados muestran que la cooperación entre humanos y modelos de IA tiene un gran potencial para mejorar la seguridad del paciente”, dijo en un comunicado de prensa el autor principal Nikolas Zöller, investigador postdoctoral en el Centro de Racionalidad Adaptativa del Instituto Max Planck para el Desarrollo Humano.

Simulaciones realistas y análisis exhaustivos

El equipo de investigación utilizó datos de más de 2,100 viñetas clínicas proporcionadas por el Proyecto de Diagnóstico Humano.

Estos estudios de casos, combinados con diagnósticos correctos, permitieron una comparación entre los diagnósticos realizados por profesionales médicos y los generados por cinco modelos de IA líderes.

Los investigadores simularon varios escenarios de diagnóstico (individuos, colectivos humanos, modelos de IA y colectivos mixtos de humanos e IA), lo que dio como resultado un análisis de más de 40,000 diagnósticos.

El estudio reveló que, si bien varios modelos de IA superaron colectivamente al 85% de los diagnosticadores humanos, los expertos humanos aún se destacaron en muchos casos.

Cabe destacar que la combinación de aportaciones humanas y de IA condujo a la máxima precisión diagnóstica. Este enfoque aprovecha la naturaleza complementaria de los errores humanos y de IA: cuando uno falla, el otro suele tener éxito, creando una sólida red de seguridad.

“No se trata de reemplazar a los humanos por máquinas. Más bien, deberíamos considerar la inteligencia artificial como una herramienta complementaria que despliega todo su potencial en la toma de decisiones colectiva”, añadió el coautor Stefan Herzog, investigador principal del Instituto Max Planck para el Desarrollo Humano.

Desafíos y direcciones futuras

A pesar de los prometedores resultados, los investigadores enfatizan que el estudio se limitó a viñetas clínicas textuales y no abarcó situaciones clínicas reales. Se requieren más estudios para determinar si estos hallazgos se aplican a la práctica clínica real.

Además, la investigación se centró únicamente en el diagnóstico en lugar del tratamiento, y la precisión de un diagnóstico no siempre garantiza resultados óptimos del tratamiento.

La implementación práctica y la aceptación de los sistemas de apoyo basados ​​en IA por parte del personal médico y los pacientes, así como los posibles sesgos, siguen siendo áreas de investigación futura.

Aplicaciones más amplias y consideraciones éticas

El estudio, parte del proyecto Hybrid Human Artificial Collective Intelligence in Open-Ended Decision Making (HACID), financiado por Horizonte Europa, tiene como objetivo mejorar los sistemas de apoyo a la toma de decisiones clínicas mediante la integración de inteligencia humana y de máquinas.

Las posibles aplicaciones se extienden más allá de la atención de salud, incluyendo el sistema legal, la respuesta a desastres y la política climática.

Este enfoque también puede aplicarse a otras áreas críticas, como el sistema legal, la respuesta a desastres o la política climática, donde sea necesario tomar decisiones complejas y de alto riesgo. Por ejemplo, el proyecto HACID también está desarrollando herramientas para mejorar la toma de decisiones en materia de adaptación climática, añadió el coautor Vito Trianni, coordinador del proyecto HACID.

Conclusión

Los colectivos híbridos humano-IA exhiben un potencial incomparable para mejorar la precisión diagnóstica y la seguridad del paciente. A medida que avanza la investigación, este enfoque innovador podría revolucionar la prestación de servicios de salud, lo que en última instancia conducirá a una atención al paciente más equitativa y eficaz en todo el mundo.

Fuente: Instituto Max Planck para el Desarrollo Humano