• 26 de febrero de 2024 10:02

Intel colabora con el Broad Institute para potenciar la genómica

Actualmente se celebra un hito en las investigaciones avanzadas en el campo de la genómica y, en este terreno, Intel está encantada de participar en tres importantes avances:

  • El Broad Institute del MIT y Harvard ofrece como código abierto el GATK4 – el software para análisis genómico más popular en todo el mundo que, además, se ha mejorado ahora en gran medida.
  • Intel y Broad han desarrollado una arquitectura innovadora – Broad-Intel Genomics Stack (BIGstack)-, que, en la actualidad mejora cinco veces las analíticas genómicas de Broad, gracias al uso de las CPU, la tecnología Omni-Path Fabric y los SSD de Intel, además de incluir optimizaciones para la próxima versión de los productos integrados CPU + FPGA de Intel.
  • BGI – una compañía china líder en genómica -, anuncia la adopción de las herramientas GATK más actualizadas, incluyendo las optimizaciones de Broad e Intel – un enorme avance en armonización a escala mundial para la comunidad especializada en genómica en rápido aumento.

Me gustaría profundizar más sobre estos tremendos logros.

En primer lugar, Intel y Broad comparten un objetivo común: aprovechar el poder de los datos sobre genómica para ponerlos a disposición de los investigadores de todo el mundo para lograr unos descubrimientos importantes. La genómica ofrece conocimientos sobre el funcionamiento interno del ADN dentro de los organismos y los avances en este campo impulsan los estudios basados en conocimientos para conocer mejor las complejidades de los sistemas biológicos.

Casi todos hemos tenido alguna experiencia relacionada con el cáncer y los efectos devastadores que esta enfermedad causa en las familias (en algunas más que en otras). Con los anuncios de hoy, podemos realizar grandes avances para entender los elementos moleculares que impulsan la aparición del cáncer y de otras enfermedades, además de facilitar el desarrollo de la medicina de precisión.

Por esa razón, Intel y Broad ofrecen el nuevo BIGstack para la iniciativa sobre buenas prácticas GATK4 Best Practices, ya que esta versión puede funcionar hasta cinco veces más rápidamente que las versiones anteriores, además de ofrecer soporte a una gran cantidad de datos a una escala verdaderamente sin precedentes hasta la fecha y simplificar su despliegue, gracias al uso de unos scripts listos para la fase de producción. Asimismo, la arquitectura proporciona un magnifico rendimiento, con la combinación de las CPU, la tecnología Omni-Path Fabric y las SSD de Intel. El BIGstack también incluye optimizaciones para los FPGA de Intel, y los primeros resultados indican un gran potencial para una mejora superior a x35 en el algoritmo PairHMM.

La versión 1.0 del Broad-Intel Genomics Stack representa el tipo de innovación en asequibilidad que esperamos crear para la comunidad especializada en analíticas genómicas dentro del proyecto Intel-Broad Center for Genomic Data Engineering, una colaboración de cinco años y $25 millones anunciada el pasado mes de noviembre. Esta versión se encuentra ya disponible para los 45.000 usuarios registrados del GATK – la herramienta para análisis genómico más popular de Broad – en universidades, ONG y organizaciones comerciales.

El sitio web de Intel ofrece más información sobre esta nueva arquitectura de referencia anunciada hoy en la Bio-IT World Conference & Expo. Además de esto, nos gustaría comentar lo siguiente:

  • Broad anunció que ofrecerá como código abierto la Versión 4del GATK (GATK4), una buena noticia para investigadores, biotecnólogos y especialistas en farmacia.
  • BGI anunció que proporcionará acceso al GATK4, al sistema Cromwell de Broad para gestión del flujo de trabajo y al lenguaje para definición de flujo de trabajo (workflow definition language, WDL) en la plataforma online de BGI, con su partner en la nube Alibaba Cloud en China.

Estoy realmente emocionado con el anuncio de BGI, ya que va a permitir a las principales instituciones en genómica de China y EE.UU. utilizar el mismo conjunto de herramientas de software de código abierto. Asimismo, esta ampliación del acceso facilitará la estandarización y la distribución de datos para mejorar las investigaciones en el futuro.

Resulta gratificante ver que el GATK4 incluye importantes optimizaciones que han sido posibles gracias a la colaboración llevada a cabo en el Intel-Broad Center for Genomic Data Engineering en Cambridge, unas instalaciones que tuve el enorme placer de visitar el mes pasado. Espero que el BIGstack se convierta en una plataforma común para cargas de trabajo avanzadas en analíticas utilizada por las más destacadas instituciones especializadas en genómica en todo el mundo para facilitar colaboración e impulsar los avances científicos.

Por último, esta solución completa se va a encontrar disponible como arquitectura de referencia y a través de fabricantes de equipos originales (OEM) e integradores de sistemas (SI), incluyendo LenovoHPEInspur y Colfax, con más empresas que se van a incorporar próximamente.

Estoy orgulloso de los logros del equipo de Intel para ofrecer la tecnología como un elemento facilitador de las innovaciones científicas. Momentos como éste me hacen pensar que, a lo largo de nuestra vida, vamos a poder ver la aparición de una cura para el cáncer, y es para mí todo un honor asociarme con magnificas instituciones como Broad y BGI para hacerlo realidad.

Mirando hacia el futuro, está claro que las complejas relaciones de las variantes genéticas y los efectos de los tratamientos en el desarrollo molecular son unos campos de estudio ideales para el aprendizaje automático, debido a la necesidad de aprender mediante ejemplos, una y otra vez. La colaboración con algunas de las mentes más brillantes del mundo permite a los ingenieros de Intel aplicar la inteligencia artificial a este enorme reto.

Para más información, visita el sitio web del Intel-Broad Center for Genomic Data Engineering.

Jason Waxman es vicepresidente corporativo y director general de Data Center Solutions Group en Intel Corporation.

Jason_Waxman_02_print