Desarrollan un software para descubrir errores en las bases de datos europeas del genoma humano

La herramienta, llamada “Mispred”, forma parte del proyecto europeo BioSapiens dentro del VI Programa Marco, para el cual se han invertido doce millones de euros, y servirá de punto de partida a los investigadores para corregir los códigos incorrectos de genes y proteínas incorporados en las bases de datos.

Secuencia de códigos genéticos. FOTO: BioSapiens

SINC

Científicos del Instituto de Enzimología de la Academia Húngara de las Ciencias han desarrollado un programa informático que repasa y detecta errores en los códigos genéticos referentes a las proteínas, anotados en las bases de datos universales. Estas fuentes públicas (PIR en Estados Unidos e Interprot en Europa) son consultadas por los centros de investigación del genoma humano en todo el mundo, y en las cuales es habitual encontrar fallos en forma de códigos incompletos o anómalos para genes y proteínas, restando credibilidad a estas bases. La causa es que “muchas de estos códigos de hallan computacionalmente a partir de otros sin verificación humana”, explica a SINC el investigador del Centre for Genomic Regulation de Barcelona Roderic Guigó.

El software desarrollado, que tiene el nombre de “Mispred”, compara la información nueva anotada con los conocimientos previos de la base de datos y, para identificar las entradas que presentan anomalías, utiliza cinco algoritmos que responden a las siguientes reglas: las proteínas extracelulares o transmembranales deben producir señales correctas; el segmento transmembranal debe encontrarse con proteínas con partes dentro y fuera de la célula; el dominio extracelular y nuclear no debe darse en una misma proteína; el número de residuos de aminoácido en elementos relacionados del código deben guardar relación; y, por último, una proteína debe estar codificada por exones situados en un mismo cromosoma. La ventaja del programa, es que una vez encontrado un error los científicos pueden corregirlo para mejorar la calidad de las bases de datos europeas.

Mispred ha sido financiado con parte de los doce millones con que la Unión Europea destina dentro del VI Programa Marco a los proyectos del instituto europeo para la anotación del genoma humano BioSapiens, que cuenta con laboratorios repartidos en todo el mundo.

Fuente: SINC

Derechos: Creative Commons