Crean la primera IA capaz de diagnosticar enfermedades ultra raras sin datos familiares

El modelo popEVE identifica mutaciones inéditas en proteínas humanas y clasifica su gravedad. Publicado en Nature Genetics, promete agilizar diagnósticos en sistemas sanitarios con recursos limitados. 

Crean la primera IA capaz de diagnosticar enfermedades ultra raras sin datos familiares
La nueva IA IA no solo detecta mutaciones genéticas causantes de enfermedad, sino que también las clasifica según su gravedad en todo el organismo. / Adobe Stock

Un equipo del Centro de Regulación Genómica (CRG)  de Barcelona y la Harvard Medical School ha desarrollado popEVE, una inteligencia artificial que determina qué mutaciones en proteínas humanas son más propensas a causar enfermedad, incluso cuando nunca se han observado en ninguna persona.

Según los autores, es el primer sistema que funciona únicamente con la información genética del paciente, sin necesidad de datos de los progenitores, y supera en rendimiento a herramientas punteras como AlphaMissense, de Google DeepMind.

Funciona únicamente con la información genética del paciente, sin necesidad de datos de los progenitores, y supera en rendimiento a herramientas punteras como AlphaMissense, de Google DeepMind

El modelo se basa en datos de cientos de miles de especies y en la variación genética humana. Este enfoque evolutivo permite identificar qué partes de las aproximadamente 20 000 proteínas humanas son esenciales para la vida y cuáles toleran cambios. Así, esta IA no solo detecta mutaciones causantes de enfermedad, sino que también las clasifica según su gravedad en todo el organismo.

Los resultados, publicados hoy en Nature Genetics, podrían transformar el diagnóstico de enfermedades genéticas. Una de cada dos personas con una enfermedad rara nunca recibe un diagnóstico claro. La herramieta popEVE puede cambiar esta situación al ayudar a los médicos a centrarse primero en las variantes más perjudiciales, dicen los investigadores.

Una de cada dos personas con una enfermedad rara nunca recibe un diagnóstico claro

Además, su capacidad para trabajar con el ADN del propio paciente facilita diagnósticos más rápidos y económicos, algo crucial en sistemas sanitarios con recursos limitados.

“En las consultas no siempre se dispone del ADN de los progenitores y muchos pacientes acuden solos. popEVE puede ayudar a estos médicos a identificar mutaciones causantes de enfermedad, y ya estamos observando este beneficio en nuestras colaboraciones con clínicas”, explica Mafalda Dias, coautora principal del estudio e investigadora del CRG.

Mutaciones de sentido erróneo

El genoma humano contiene numerosas diferencias únicas, entre ellas mutaciones de sentido erróneo que alteran aminoácidos en proteínas. Muchas son inocuas, pero otras provocan trastornos graves. El reto consiste en distinguir cuáles son benignas y cuáles perjudiciales. Además, no todas las mutaciones dañinas lo son en la misma medida: algunas causan síntomas leves, otras discapacidades graves y algunas son letales en la infancia. Las herramientas actuales predicen si una mutación es peligrosa, pero no suelen ofrecer una escala gradual.

Para afecciones “tan raras como únicas”, no existen antecedentes clínicos. Incluso si se secuenciara a toda la población mundial, las mutaciones de estos pacientes serían nuevas.

Los métodos tradicionales que dependen de patrones en grandes cohortes no sirven en estos casos. Por ello, el equipo liderado por Debora Marks, Jonathan Frazer y Mafalda Dias recurrió a la evolución.

Durante miles de millones de años, la naturaleza ha probado qué cambios tolera una proteína y cuáles son letales. Los modelos computacionales pueden aprender qué posiciones son críticas comparando secuencias de muchas especies.

Esta idea inspiró EVE (Evolutionary model of Variant Effect), un algoritmo presentado en 2021 por los mismos autores. EVE clasificaba mutaciones como benignas o perjudiciales y se usa en genética clínica para interpretar variantes inciertas. Sin embargo, sus puntuaciones no eran comparables entre genes, lo que dificultaba priorizar mutaciones en todo el genoma.

La tecnología popEVE resuelve este problema combinando datos evolutivos con información del UK Biobank y gnomAD, dos grandes repositorios genéticos. Así calibra sus predicciones para humanos y clasifica mutaciones en todo el proteoma, permitiendo comparar variantes de diferentes genes en la misma escala.

Para validar popEVE, se analizaron datos de más de 31.000 familias con hijos afectados por trastornos graves del desarrollo

Para validar popEVE, se analizaron datos de más de 31.000 familias con hijos afectados por trastornos graves del desarrollo. En el 98% de los casos con mutación causal conocida, popEVE la identificó como la más perjudicial del genoma del niño. También superó a AlphaMissense. Además, descubrió 123 genes candidatos nunca vinculados antes a estos trastornos, muchos activos en el cerebro en desarrollo. De ellos, 104 se observaron en solo uno o dos pacientes.

Otra ventaja es que evita sesgos hacia poblaciones de ascendencia europea, frecuentes en otras herramientas. “Nadie debería recibir un resultado alarmante solo porque su comunidad no esté bien representada en las bases de datos globales. popEVE contribuye a corregir ese desequilibrio, algo que el campo llevaba mucho tiempo necesitando”, afirma Frazer, coautor del estudio.

Los autores advierten que popEVE solo interpreta cambios en el ADN que alteran proteínas. No cubre toda la variación genética y no sustituye al criterio clínico: los médicos deben considerar historiales y síntomas para orientar el diagnóstico.

Referencia:

Orenbuch et al. Nature Genetics (2025). DOI:10.1038/s41588-025-02400-1

Fuente:
CRG
Derechos: Creative Commons.
Artículos relacionados