Investigadores de la UNIGE, Harvard y McGill han descubierto una función cerebral sofisticada que muestra cómo el área tegmental ventral (AVT) codifica con precisión el momento de la recompensa, revolucionando nuestra comprensión de la motivación y el aprendizaje.
Un nuevo estudio realizado por investigadores de la Universidad de Ginebra (UNIGE), la Universidad de Harvard y la Universidad McGill revela un papel sofisticado del área tegmental ventral (AVT) del cerebro en el procesamiento de las recompensas. Publicado En la revista Nature, el estudio demuestra que el VTA no solo predice recompensas sino que también codifica el momento preciso en que se espera que ocurran, una hazaña posible gracias a un algoritmo de aprendizaje automático.
El ATV, una pequeña región del cerebro, es crucial para la motivación y el circuito de recompensa cerebral. Produce dopamina, un neuromodulador que ayuda a predecir recompensas futuras basándose en señales contextuales.
Sorprendentemente, los nuevos hallazgos muestran que las predicciones del VTA son más detalladas y temporalmente específicas de lo que se pensaba anteriormente.
Inicialmente, se creía que el ATV era simplemente el centro de recompensa del cerebro. Pero en la década de 1990, los científicos descubrieron que no codifica la recompensa en sí, sino su predicción, declaró en un comunicado de prensa Alexandre Pouget, catedrático del Departamento de Neurociencias Básicas de la Facultad de Medicina de la UNIGE, quien dirigió la investigación.
Estudios previos en animales demostraron que cuando una recompensa sigue consistentemente a una señal, el ATV libera dopamina al ver la señal, en lugar de la recompensa en sí. Esta respuesta, por lo tanto, codifica la predicción de la recompensa.
El estudio reciente revela que la codificación del VTA es aún más sofisticada.
En lugar de predecir una suma ponderada de recompensas futuras, el VTA predice su evolución temporal. En otras palabras, cada ganancia se representa por separado, con el momento preciso en que se espera», añadió Pouget.
El estudio muestra que diferentes neuronas del ATV priorizan las recompensas en distintas escalas de tiempo. Algunas neuronas se centran en las recompensas esperadas en unos segundos, otras en las que se anticipan en un minuto y otras en plazos aún más lejanos.
Esta diversidad permite al VTA codificar el momento de las recompensas con gran flexibilidad, adaptando sus predicciones para maximizar las recompensas inmediatas o retrasadas, dependiendo de los objetivos y prioridades individuales.
Si bien sabíamos que las neuronas del VTA priorizaban las recompensas cercanas en el tiempo sobre las más lejanas —según el principio de «más vale pájaro en mano que ciento volando»—, descubrimos que diferentes neuronas lo hacen en diferentes escalas de tiempo: algunas se centran en la recompensa posible en unos segundos, otras en la recompensa esperada en un minuto y otras en horizontes más lejanos. Esta diversidad es lo que permite la codificación del momento de la recompensa —añadió Pouget—.
El estudio ejemplifica la sinergia entre la inteligencia artificial y la neurociencia. Pouget desarrolló un algoritmo matemático que incorpora la sincronización del procesamiento de la recompensa, mientras que investigadores de Harvard recopilaron amplios datos neurofisiológicos sobre la actividad del VTA en animales.
“Luego aplicaron nuestro algoritmo a sus datos y descubrieron que los resultados coincidían perfectamente con sus hallazgos empíricos”, añadió Pouget.
Esta colaboración subraya cómo las técnicas de aprendizaje automático inspiradas en el cerebro también pueden dilucidar mecanismos neurofisiológicos complejos.
Fuente: Universidad de Ginebra