Los científicos pueden ensamblar el genoma humano en minutos con una computadora portátil



Las mejores noticias en Alicantur Noticias

Madrid

Actualizado:

Científicos del Instituto de Tecnología de Massachusetts (MIT) y el Institut Pasteur en Francia han desarrollado una técnica para reconstruir genomas completos, incluido el Genoma humano, en una computadora personal en minutos. Esta técnica, anuncian los investigadores en
«Sistemas celulares»
, es unas cien veces más rápido que los enfoques actuales de vanguardia y mucho más simple y eficaz. Con respecto al lenguaje, el modelo asume algo así como considerar palabras en lugar de letras.

«Podemos ensamblar rápidamente genomas y metagenomas completos, incluidos los genomas microbianos, en una computadora portátil modesta», dice Bonnie Berger del Laboratorio de Inteligencia Artificial y Ciencias de la Computación del MIT. «Esta capacidad es esencial para evaluar los cambios en el microbioma intestinal relacionados con enfermedades e infecciones bacterianas, como la sepsis, para que puedan tratarse más rápidamente y salvar vidas».

los Proyecto Genoma Humano terminó de ensamblar el primer genoma humano completo en 2003, resultado de una década de colaboración internacional y a un costo de 2.700 millones de dólares. Hoy en día, leer nuestro «código de barras» ya no lleva años, pero todavía lleva varios días y una enorme potencia informática. Las tecnologías de secuenciación de tercera generación ofrecen terabytes de secuencias genómicas de alta calidad con decenas de miles de pares de bases, pero el ensamblaje del genoma utilizando una cantidad tan inmensa de datos ha resultado difícil.

Para hacerlo más rápido y eficiente, Berger y sus colegas recurrieron a modelos de lenguaje. Partiendo del concepto de un diagrama de De Bruijn, una estructura de datos simple utilizada para el ensamblaje del genoma, los investigadores utilizaron secuencias cortas de nucleótidos llamadas mínimas en lugar de nucleótidos individuales.

Hasta 300 veces más rápido

Los investigadores aplicaron su método para recopilar datos de alta fidelidad del mundo real (que tienen una legibilidad de una sola molécula casi perfecta) para las moscas de la fruta D.rosophila melanogaster, así como los datos del genoma humano proporcionados por Pacific Biosciences (PacBio). Cuando evaluaron los genomas resultantes, Berger y sus colegas descubrieron que su software requería aproximadamente 33 veces menos tiempo y ocho veces menos hardware informático de memoria de acceso aleatorio (RAM) que otros ensambladores de genomas. Su software realizó el ensamblaje del genoma para datos humanos de alta fidelidad 81 veces más rápido con 18 veces menos uso de memoria que el ensamblador llamado «Peregrine» y 338 veces más rápido con 19 veces menos uso de memoria que el ensamblador de «hifiasm».

Luego, Berger y sus colegas usaron su método para construir un índice para una colección de 661,406 genomas bacterianos, la colección más grande de su tipo hasta la fecha. Descubrieron que la nueva técnica podía buscar en toda la colección genes de resistencia a los antimicrobianos en 13 minutos, un proceso que llevó siete horas utilizando la alineación de secuencia estándar.

«Sabíamos que nuestro renderizado era eficiente, pero no sabíamos que escalaría tan bien en datos reales después de más optimizaciones de código», dice Berger.

«La idea general funciona y no requiere algunos de los pasos de preprocesamiento generalmente costosos, como la corrección de errores, realizada por la mayoría de los otros métodos de ensamblaje del genoma», dice Rayan Chikhi, investigador y líder de grupo en el Instituto Pasteur. Para Berger, estas capacidades abren la puerta a la «democratización del análisis de secuenciación de datos».

Míralos
Comentarios

.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *