Este artículo se publicó hace más de 4 meses

Una relectura del genoma humano amplía el catálogo de variaciones genéticas

Dos estudios publicados hoy en la revista Nature amplían significativamente el catálogo de variaciones genéticas humanas conocidas. Los datos resultantes constituyen lo que podría ser la visión más completa del genoma humano hasta la fecha. 

23/07/2025 - 17:00 CEST
Reacciones

Marfany - genoma

Gemma Marfany

Catedrática de Genética de la Universitat de Barcelona (UB) y miembro de CIBERER

Science Media Centre España

Estos dos artículos abordan algunas de las principales cuestiones a descifrar de la secuencia del genoma humano. Por una parte, la mayoría de información genética que se dispone es del genoma humano de ancestría europea, con muy baja representación de otras poblaciones humanas. Por otra parte, la secuenciación masiva basada en lecturas cortas dejaba regiones sin cubrir o sin una secuencia precisa debido a la gran cantidad de secuencias repetitivas en nuestro genoma. Es como si hubiera partes del genoma que podíamos mirar con gafas de alta precisión y otras regiones que teníamos que mirar a través de cristales gruesos distorsionados y sin definición. 

A partir de la secuenciación masiva de lecturas largas, los investigadores de estos dos artículos han utilizado estrategias complementarias de análisis del genoma humano, bien secuenciando el genoma de más de 1000 individuos de 26 poblaciones distintas, pero sin una cobertura muy profunda, bien secuenciando muy profundamente el genoma de 65 individuos de 28 poblaciones distintas. Los resultados permiten descubrir que nuestro genoma es muy dinámico, con una gran variabilidad estructural que desconocíamos, sobre todo en las regiones con muchas repeticiones, con movimiento y salto de elementos transponibles y con una evolución muy rápida de los centrómeros (secuencias que definen la unicidad de los cromosomas). Otros resultados interesantes son la definición precisa de la variación del cromosoma Y en distintas poblaciones humanas, la mayor definición de regiones génicas implicadas en enfermedades humanas, así como la gran variabilidad estructural de regiones cromosómicas importantes para nuestro sistema inmunitario, como los genes del complejo mayor de histocompatibilidad. 

Un mayor conocimiento de la estructura, variabilidad y dinámica de nuestro genoma en distintas poblaciones humanas permitirá comprender mejor nuestra evolución y adaptación a distintos ambientes. Supone pasar de un mapa somero de nuestro genoma, centrado en grandes ciudades y pueblos, a completarlo a una escala menor, de gran precisión, con casas aisladas, ríos y montañas

Declara no tener conflicto de interés
ES

Montoliu - genoma 2

Lluís Montoliu

Investigador en el Centro Nacional de Biotecnología (CNB-CSIC) y en el CIBERER-ISCIII

Science Media Centre España

La obtención del primer genoma humano, en 2001, fue un hito impresionante. Conseguir leer las más de tres mil millones de pares de bases del genoma (aunque con muchos agujeros e indeterminaciones) nos permitió, por vez primera, tener un genoma de referencia con el que comparar cualquier otro genoma individual para identificar posibles mutaciones causantes de enfermedad. Ese primer genoma secuenciado no pertenecía a un solo individuo, sino que se usaron datos genéticos de diversas personas para construirlo. La tecnología usada permitía obtener lecturas relativamente cortas. Con el desarrollo de la secuenciación masiva, que en general progresa con lecturas igualmente cortas, de unas 150 bases, combinada con las lecturas de secuencias largas en 2022, se completaron muchos de los agujeros y se añadieron alrededor de 200 millones de letras nuevas al genoma humano, a través de un consorcio de investigadores autodenominado “de telómero a telómero” (T2T en sus siglas en inglés) refiriéndose a los extremos de los cromosomas, los telómeros. Algo así como “de cabo a rabo”. En 2023 se completó la secuencia del cromosoma Y, el más pequeño de todos, que no se había podido obtener, añadiéndose otros 30 millones de letras adicionales al genoma humano, que pasaba a tener un tamaño de 3230 millones de pares de letras. Dos humanos cualesquiera comparten el 99,9% de esas letras, diferenciándose en apenas un 0,1%, que corresponde a unos 3,2 millones de letras (que heredamos de nuestra madre y otras tantas de nuestro padre).  

La tecnología que permite leer lecturas de cadenas de ADN de gran longitud, de decenas o centenares de miles de letras intactas, permitió en 2023 empezar a descubrir una variabilidad genética subyacente entre los diferentes genomas humanos que se obtuvieron. Entonces se caracterizaron genomas de 47 poblaciones de todo el mundo. Fue la primera versión del llamado “Pangenoma”, un conjunto de genomas que recoge la variabilidad genética existente entre los seres humanos. No existe un solo genoma, sino que cada población (y, en esencia, cada individuo) tenemos genomas ligeramente diferentes, especialmente en las regiones intergénicas, entre los genes, las mayoritarias del genoma que ocupan nada menos que el 98% de nuestro, dejando el 2% restante para nuestros veinte mil genes, que son los que necesitamos para vivir.  

Esta semana se publican en la revista Nature sendos trabajos colaborativos, relacionados, del consorcio T2T junto con la aportación de muchos otros laboratorios internacionales (mayoritariamente alemanes y norteamericanos), en los que se han aplicado las versiones más optimizadas de tecnologías de lecturas de secuencias largas de ADN. Y lo que han encontrado estos investigadores es un montón de variantes estructurales (SV en sus siglas en inglés), anteriormente desconocidas, que habían pasado desapercibidas. Por ejemplo, si tenemos un segmento de ADN de 5000 letras repetido unas cuantas veces en tándem y secuencias el genoma a partir de fragmentos pequeños de 150 letras, dado que la secuencia de cada uno de estos segmentos es fundamentalmente idéntica, no vas a poder deducir que hay tantas repeticiones y, a lo sumo, vas a deducir la existencia de unos pocos de estos segmentos. Sin embargo, si aplicas la tecnología de lecturas largas y eres capaz de hacer pasar por un nanoporo larguísimas secuencias de ADN que contengan todas estas unidades repetidas en tándem, en forma de repeticiones directas o invertidas, podrás deducir que hay en una persona 47 repeticiones, por ejemplo, mientras que otra tiene solo 23, y además las tiene invertidas, por ejemplo. Es decir, de nuevo se describe una variabilidad genética adicional subyacente en nuestros genomas que sospechábamos pero que desconocíamos o no habíamos sido capaces de interpretar hasta que no han aparecido técnicas que permiten leer secuencias muy largas de ADN intacto, como son las que aportan los métodos más sofisticados de secuenciación desarrollados por las empresas Oxford Nanopore Technologies (ONT) y PacBio. 

Un primer trabajo reporta hasta 65 genomas humanos tipo (aumentando el pangenoma) que contienen hasta 130 haplotipos (fragmentos cromosomales contiguos que se heredan conjuntamente de padres a hijos), completando muchos de los intervalos desconocidos y agujeros que todavía tenía el genoma humano. Un segundo trabajo detalla la secuenciación más precisa, con lecturas de gran tamaño, obtenida de más de mil seres humanos, con lo logran distinguir hasta 100 mil variantes estructurales y 300 mil secuencias genéticas en número variable que se agrupan en forma de tándems. Los elementos móviles, los genes saltarines, los trasposones y retrotrasposones, se apuntan como el origen de esta diversidad estructural, combinada con la existencia de fenómenos de recombinación homóloga, es decir, de mezcla de secuencias en base a la similitud de sus bases.  

Todavía desconocemos bastante del significado e impacto real de tener 40 o 400 copias de un segmento determinado del ADN, pero estas dos publicaciones lo que nos demuestran es que cada genoma de cada individuo es único, con variaciones estructurales propias, que pueden coexistir en una población, de ahí que el recurrir al pangenoma (al conjunto de genomas descriptivos de decenas de poblaciones humanas) sea ahora nuestro nuevo “genoma de referencia”, el que debamos usar (ya no uno solo, sino muchos genomas) para deducir la presencia o ausencia de mutaciones en genes o en secuencias intergénicas que nos sirvan para diagnosticar a las personas con enfermedades de base genética. El diagnóstico genético siempre es previo al desarrollo de cualquier terapia génica que pueda considerarse. Por ello estas dos publicaciones son relevantes, porque nos muestran la complejidad adicional que tiene nuestro genoma, mucho más variable entre individuos de lo que nunca imaginamos. Y eso nos debería permitir diagnosticar genéticamente mejor a enfermos afectados por patologías o trastornos congénitos

No declara conflicto de interés
ES
Publicaciones
Complex genetic variation in nearly complete human genomes
    • Artículo de investigación
    • Revisado por pares
Revista
Nature
Tipo de estudio:
  • Artículo de investigación
  • Revisado por pares
Temas genética
Las 5W +1
Publica
FAQ
Contacto