Los mapas genéticos humanos tienen un enorme “agujero negro” como consecuencia de haber puesto sistemáticamente el foco en la población de ascendencia europea. Un equipo de investigadores españoles ha identificado más de cuatrocientos posibles genes, a partir de las moléculas de ARN que transcriben, que todavía no figuran en los catálogos oficiales y no han sido descritos por la ciencia debido a este circunstancia. Y lo que ven, anuncian, es solo “la punta del iceberg”.

En el estudio, que se publica este miércoles en la revista Nature Communications , el equipo de investigadores del Barcelona Supercomputing Center (BSC) y el Centro de Regulación Genómica (CRG) demuestra que esta falta de representación global distorsiona el conocimiento existente sobre la manera en que los genes influyen en la salud y la enfermedad de personas de otras partes del mundo. “Es decir, que estaríamos haciendo una interpretación sesgada que puede derivar en injusticias biomédicas”, afirma el primer autor  Pau Clavell-Revelles , del BSC.

Aunque el sesgo de los catálogos genéticos hacia la población de ascendencia europea ya se conocía, esta es la primera vez que se pone el foco en qué moléculas de ARN se pueden generar a partir de los genes. “Esto es algo que jamás se había investigado”, subraya Clavell-Revelles. “Todos los estudios se habían quedado a nivel de ADN y no a nivel de ARN, porque al final es importante conocer los genes que tenemos, pero también cómo se usan”.

En la tarea, los científicos han generado más de 10 terabytes de datos y 800 millones de secuencias completas de ARN, lo que requirió herramientas avanzadas de aprendizaje automático y la capacidad del superordenador MareNostrum 5 del BSC, y han dado un paso de gigante hacia la creación de un “ pantranscriptoma ” humano, que nos acercará a una medicina genómica más precisa y equitativa. 

Si una variante genética cae en uno de estos genes ausentes, asumimos que no tiene ningún efecto biológico. En algunos casos, esa suposición podría ser sencillamente errónea

Roderic Guigó Investigador del CRG y coautor senior del estudio

“Los mapas génicos se utilizan cada día en los laboratorios, pero estamos dejando fuera enormes segmentos de la población mundial. Este estudio muestra, por primera vez, cuánto nos estábamos perdiendo”, afirma el primer autor. “Los catálogos de referencia que utilizamos pueden carecer de genes o transcritos que existan únicamente en poblaciones no europeas”, añade   Roderic Guigó , coautor senior. “Si una variante genética cae en uno de estos genes ausentes, asumimos que no tiene ningún efecto biológico. En algunos casos, esa suposición podría ser sencillamente errónea”.

Moléculas sin catalogar

Para determinar qué genes faltaban por identificar, los autores han reconstruido el proceso inverso que se produce en la célula. “Leemos qué ARN hay en una célula y buscamos su origen en el genoma y así localizamos los genes”, explica Clavell-Revelles. El resultado es el hallazgo de 41.000 moléculas de ARN ausentes en los mapas oficiales como GENCODE (un 10% de los ya conocidos) que se corresponden con 476 nuevos genes posibles.

Para el trabajo, el equipo analizó células de la sangre de 43 personas de ocho poblaciones humanas: Yoruba (Nigeria), Luhya (Kenia), Mbuti (Congo), Han (China), indios Telugu (Reino Unido), peruanos en Lima, asquenazíes (Israel) y europeos de Utah. Estos grupos forman parte del Proyecto 1000 Genomas , lo que implica que su ADN está bien caracterizado, y esto permite a su vez comparar directamente los nuevos datos de ARN.

Los autores del estudio del CRG y el BSC en la sala del superordenador MareNostrum 5, que fue clave en el estudio.

La punta del iceberg

“Es muy importante tener en cuenta que hemos mirado solo un tipo de células”, explica  Marta Melé , coautora principal del estudio y jefa de grupo en el BSC. “Estos 41.000 transcritos los hemos encontrado mirando un tipo celular. Creemos que faltan muchas moléculas y es la punta de iceberg”. Ahora habrá que mirar otros tipos de células, informa a elDiario.es , y extender el estudio a más poblaciones para tener el mapa completo. 

Estos 41.000 transcritos los hemos encontrado mirando un tipo celular. Creemos que faltan muchas moléculas y es la punta de iceberg

Marta Melé Coautora principal del estudio y jefa de grupo en el BSC

“Yo formo parte del consorcio GENCODE y puedo decir que está analizando estos datos y otros para producir una actualización del número de genes humanos”, añade Guigó. “Se está trabajando en ello en estos momentos”. 

Relación con enfermedades

Los resultados sugieren que parte del motivo por el que ciertas enfermedades son más frecuentes o se comportan de forma distinta en determinadas poblaciones podría ser que sus genes producen transcritos y, potencialmente, proteínas diferentes. Estas variaciones moleculares han permanecido prácticamente invisibles en los mapas genéticos actuales, ocultando información que podría ser crucial para comprender el riesgo de enfermedad.

En las últimas décadas, los científicos han comprobado que ignorar nuestra ascendencia genética al recibir una terapia es un riesgo para nuestra salud. Un ejemplo claro es que los niños afroamericanos con asma no responden bien a los tratamientos con broncodilatadores y esto incrementa hasta seis veces su riesgo de morir debido a complicaciones por la enfermedad. O el caso de las personas con ascendencias del este de Asia que tienen una mayor sensibilidad a los anticoagulantes para prevenir un infarto y la dosis recomendada para europeos les puede provocar hemorragias internas.

Aunque seas de ascendencia europea, puedes tener partes de tu ADN, y por lo tanto moléculas de ARN, más parecidas a la mayoría de migrantes que de europeos

Pau Clavell-Revelles Investigador del BSC-CRG y primer autor del artículo

“Y aunque esto a alguien no le interese, que los mapas génicos estén sesgados debería importarle a todo el mundo, porque al añadir diferentes ascendencias en este tipo de estudios nos beneficiamos todos, también las personas de ascendencia europea”, resume Clavell-Revelles. “Y hay muchos motivos. El primero es que las ascendencias genéticas no existen como grupos aislados. Esto significa que, aunque seas de ascendencia europea, puedes tener partes de tu ADN, y por lo tanto moléculas de ARN, más parecidas a la mayoría de migrantes que de europeos”.  

Ancestías ignoradas

Para el genetista  Lluis Montoliu , del CNB-CSIC, CIBERER-ISCIII, se trata de un artículo muy relevante que hace hincapié de nuevo en la desigualdad que se produce en salud y de la que cada vez somos más conscientes. “El genoma que hemos estado utilizando es un genoma eminentemente de ancestros europeos”, explica. “Los genomas diversos de otras personas que tienen un ancestro distinto sencillamente han sido ignorados y este trabajo reclama que tenemos que considerarlos y hacer lo posible para que representemos la variabilidad que tiene el genoma a lo largo de toda su secuencia”.

El resultado implica que hay una diversidad de proteínas sutilmente diferente más elevada entre humanos, que desconocíamos

Gemma Marfany Catedrática de Genética de la Universidad de Barcelona (UB)

“Los autores han descubierto que de cada gen, podemos fabricar más transcritos distintos de lo que se había descrito, especialmente, cuando se analizan las muestras de personas de ancestralidad no europea”, explica Gemma Marfany , catedrática de Genética de la Universidad de Barcelona (UB). “Eso implica que cada gen puede fabricar más proteínas distintas de lo que pensábamos, es decir, que hay una diversidad de proteínas sutilmente diferente más elevada entre humanos, que desconocíamos”. 

En opinión de Marfany, necesitamos completar nuestros bancos de datos con esta diversidad sutil de transcritos entre poblaciones humanas, considerando además que hay tejidos y órganos que se caracterizan por presentar muchos transcritos distintos, como las neuronas del cerebro o de la retina. “Estos resultados tendrán impacto en el diagnóstico genético de enfermedades, ya que las variantes genéticas o mutaciones que se identifiquen pueden estar afectando la producción de transcritos y, por tanto, de proteínas, de forma diferente en personas de distintas poblaciones humanas”, concluye.