La ETH de Zúrich presenta un nuevo motor de búsqueda de ADN

Científicos de la ETH de Zúrich han desarrollado MetaGraph, un motor de búsqueda de ADN pionero, similar a "Google para ADN". Esta innovación promete acelerar drásticamente la investigación genética al permitir búsquedas rápidas y exhaustivas en extensas bases de datos de secuencias de ADN y ARN.

Investigadores de la ETH de Zúrich han presentado una herramienta innovadora llamada MetaGraph, diseñada para revolucionar la investigación genética al permitir búsquedas rápidas y eficientes a través de vastas bases de datos de secuencias de ADN y ARN.

Este nuevo método, cuyos detalles se describen a continuación, publicado En la revista Nature, promete acelerar la identificación de enfermedades hereditarias raras y mutaciones específicas en células tumorales, anunciando una nueva era para la investigación biomédica.

MetaGraph funciona de manera similar a un motor de búsqueda de Internet, permitiendo a los investigadores ingresar una secuencia de interés y localizar rápidamente dónde ha aparecido en bases de datos globales.

"Es una especie de Google del ADN", dijo Gunnar Rätsch, profesor del Departamento de Ciencias de la Computación y miembro del Grupo de Informática Biomédica de la ETH de Zúrich, en un comunicado de prensa.

La herramienta busca en los datos sin procesar de todas las secuencias almacenadas, evitando así la necesidad de descargar grandes conjuntos de datos, lo que antes consumía mucho tiempo y recursos.

En los últimos años se ha destacado la importancia de la secuenciación de próxima generación, en particular al permitir la rápida decodificación y el seguimiento del genoma del SARS-CoV-2 durante la pandemia de COVID-19.

Sin embargo, el enorme volumen de datos (aproximadamente 100 petabytes almacenados en bases de datos como el American Sequence Read Archive (SRA) y el European Nucleotide Archive (ENA)) presentó un desafío sustancial para los investigadores.

Ahora, la innovadora herramienta MetaGraph, desarrollada por científicos de la ETH de Zúrich, aborda este desafío de frente. Puede comprimir datos por un factor de 300, lo que la hace altamente eficiente y, al mismo tiempo, mantiene la integridad de la información.

“Matemáticamente hablando, es una matriz enorme con millones de columnas y billones de filas”, añadió Rätsch.

El nuevo motor de búsqueda no solo simplifica y agiliza el proceso, sino que también lo hace a bajo costo. Las consultas más extensas con MetaGraph no cuestan más de $0.74 por megabase.

Esta asequibilidad, sumada a la precisión y eficiencia de la herramienta, podría impulsar significativamente la investigación sobre patógenos poco conocidos o enfermedades emergentes. Además, es prometedora para el avance en la investigación de la resistencia a los antibióticos mediante la identificación de genes de resistencia y bacteriófagos beneficiosos a partir de bases de datos existentes.

"Estamos ampliando los límites de lo posible para mantener los conjuntos de datos lo más compactos posible sin perder información necesaria", añadió André Kahles, científico senior del Departamento de Ciencias de la Computación y miembro del Grupo de Informática Biomédica.

Presentado por primera vez en 2020 y en constante mejora desde entonces, MetaGraph ya está disponible para consultas y ha indexado casi la mitad de los conjuntos de datos de secuencias globales. Los investigadores pretenden incluir los datos restantes para finales de año.

Al ser de código abierto, MetaGraph ofrece enormes beneficios potenciales, incluidas aplicaciones para compañías farmacéuticas y posiblemente incluso uso privado en el futuro.

Reflexionando sobre las futuras aplicaciones de la herramienta, Kahles añadió: «En sus inicios, ni siquiera Google sabía exactamente para qué servía un motor de búsqueda. Si continúa el rápido desarrollo de la secuenciación de ADN, podría convertirse en algo habitual identificar las plantas de tu balcón con mayor precisión».

Fuente: ETH Zurich