Al combinar dos tipos de inteligencia artificial muy diferentes, investigadores de la Universidad Tecnológica de Viena han resuelto problemas lógicos complejos con una velocidad sin precedentes. Su trabajo demuestra cómo los modelos de estilo ChatGPT pueden guiar algoritmos tradicionales, abriendo nuevas posibilidades para la ciencia y la toma de decisiones cotidiana.
Cualquiera que haya contemplado una cuadrícula de Sudoku a medio terminar conoce el poder de una sola pista oportuna. Investigadores de la Universidad Tecnológica de Viena (TU Wien) han demostrado que los grandes modelos de lenguaje, el tipo de IA que sustenta herramientas como ChatGPT, pueden proporcionar ese tipo de ayuda para algunos de los problemas de lógica más complejos de la informática, aunque no puedan resolverlos por sí mismos.
Al permitir que un modelo de lenguaje sugiriera reglas adicionales para programas clásicos basados en lógica, el equipo aceleró las soluciones y, en al menos un caso, encontró mejores respuestas que las que nadie había visto antes.
La obra, publicado en el Journal of Artificial Intelligence Research. se llevó a cabo dentro del programa de doctorado iCAIML de la TU Wien.
El proyecto reúne dos ramas de la inteligencia artificial que habitualmente se mantienen separadas.
"Para entender por qué nuestro descubrimiento es tan sorprendente, ayuda echar un vistazo a dos mundos completamente diferentes de inteligencia artificial", dijo Florentina Voboril, estudiante de doctorado en el Instituto de Lógica y Computación de la TU Wien, en un comunicado de prensa.
Por un lado, está la IA simbólica, que aborda problemas que pueden describirse de forma matemática precisa. Estos sistemas siguen reglas lógicas estrictas para explorar diversas opciones posibles y seleccionar las que satisfacen todas las restricciones.
Ejemplos clásicos incluyen completar una cuadrícula de Sudoku, programar turnos de trabajo, planificar entregas o comprobar el correcto funcionamiento de un circuito digital complejo. Los solucionadores simbólicos modernos pueden gestionar enormes espacios de búsqueda, pero aun así pueden atascarse cuando hay demasiadas posibilidades por explorar.
Por otro lado, existen los grandes modelos de lenguaje (LLM), como ChatGPT o Copilot. Estos sistemas se entrenan con grandes cantidades de texto y aprenden a predecir qué palabras es probable que aparezcan a continuación. Su funcionamiento interno no se basa en reglas explícitas y legibles para humanos, y sus respuestas suelen ser difíciles de explicar paso a paso.
Por ello, los LLM suelen considerarse inadecuados para tareas que requieren un razonamiento lógico riguroso. Son eficaces para generar y resumir lenguaje, pero no están diseñados para ejecutar código ni garantizar la corrección de cada paso de una solución.
Voboril y sus colegas plantearon una pregunta diferente: en lugar de pedirle a un modelo de lenguaje que resuelva un problema lógico directamente, ¿qué pasaría si pudiera ayudar a plantear el problema de una manera más inteligente?
“Examinamos cómo se puede combinar la IA simbólica y subsimbólica para aprovechar las fortalezas de ambos mundos”, añadió Voboril.
En la IA simbólica, un desafío común es que existen demasiadas opciones para verificar. En teoría, un solucionador podría intentar todas las maneras posibles de asignar números a una cuadrícula de Sudoku o todas las maneras posibles de asignar enfermeras a turnos, pero esto rápidamente se vuelve imposible a medida que el problema se agrava.
A menudo no se pueden probar todas. Por eso resulta sumamente útil contar con ciertas reglas que eliminen partes del espacio de búsqueda desde el principio, añadió Voboril.
Los investigadores a veces añaden manualmente estas reglas adicionales, conocidas como "simples". Una simplificación no modifica lo que se considera una solución válida, pero elimina regiones del espacio de búsqueda que probablemente no resulten útiles. Esto puede acelerar considerablemente el solucionador e incluso guiarlo hacia soluciones especialmente elegantes o eficientes.
Voboril lo compara con navegar por un laberinto.
Imaginemos que intentamos encontrar el camino más corto para salir de un laberinto. Si ya sé que ciertas partes del laberinto no tienen salida, puedo bloquearlas y concentrarme en el resto. Así, se encuentra una mejor solución más rápido, dijo.
El equipo de la TU Wien utilizó un modelo de lenguaje grande para proponer automáticamente dichos simplificadores.
Primero, tomaron el código que un sistema de IA simbólica procesaría normalmente: una descripción formal del problema y sus restricciones. Luego, alimentaron este código a un LLM. El modelo de lenguaje no ejecutó el código ni calculó una solución. En cambio, lo trató como texto e intentó detectar patrones y regularidades.
Con base en estos patrones, el LLM sugirió restricciones adicionales que podrían limitar la búsqueda de forma segura. Estas alternativas simplificadoras se reintrodujeron en el solucionador simbólico, que verificó si mejoraban o perjudicaban el rendimiento.
En efecto, el modelo de lenguaje actuó como un asistente creativo, proponiendo atajos prometedores que los expertos humanos no habían considerado, mientras que el solucionador simbólico siguió siendo el motor riguroso que garantizaba la corrección.
De esta manera, pudimos resolver ciertos problemas mucho más rápido que lo que la IA simbólica había logrado hasta entonces. En uno de estos problemas, incluso establecimos nuevos récords mundiales al encontrar soluciones superiores a cualquier otra conocida hasta entonces», añadió Voboril.
Estos resultados récord ponen de relieve un aspecto más amplio: incluso sin una comprensión lógica paso a paso, los modelos lingüísticos pueden capturar estructuras útiles en ámbitos altamente técnicos. Su capacidad de reconocimiento de patrones, perfeccionada con una gran cantidad de datos de entrenamiento, puede revelar regularidades difíciles de detectar para los humanos.
El estudio sugiere que combinar IA simbólica y subsimbólica podría ser una estrategia poderosa que trasciende con creces los estándares académicos. Muchas tareas del mundo real, desde optimizar las cadenas de suministro y el transporte público hasta planificar los horarios del personal hospitalario o los quirófanos, se reducen a enormes problemas de búsqueda basados en reglas. Pequeñas mejoras en la resolución de estos problemas pueden traducirse en importantes ahorros de tiempo, dinero y energía, o en un mejor servicio para pacientes y clientes.
Al permitir que los modelos de lenguaje propongan simplificadores y que los solucionadores simbólicos apliquen las reglas, los sistemas futuros podrían enfrentar estos desafíos de manera más eficiente y flexible que cualquiera de los enfoques por separado.
Para los estudiantes e investigadores, el trabajo también es un recordatorio de que los avances más emocionantes en IA pueden surgir no de elegir un bando sobre el otro, sino de encontrar formas creativas de conectarlos.

