En 2000 se anunció el primer borrador de la secuencia de un genoma humano, que fue publicado en 2001 en las revistas Nature y Science a la vez. Pero no estaba completo, permanecían vacíos. Nuevas aproximaciones para llenarlos se publicaron en 2003, 2009 y 2013 —esta última sirve todavía de referencia para las investigaciones, aunque la secuencia seguía sin estar completa. Finalmente, el primero de abril de este año se publicó una nueva ampliación, en un número especial de la revista Sciencesi bien la comunidad científica la conocía porque había sido colgada en mayo de 2021 en BioRchivservidor en el que se publican artículos todavía no revisados, pero que permiten avanzar investigaciones.
La nueva secuencia del genoma humano de este año todavía no es completa, pero se ha avanzado bastante desde el anterior de 2013. El consorcio T2T (Telómero en Telómero) ha averiguado la composición de 200 megabases que no se sabía cuáles eran -200 millones de letras de información genética- donde probablemente haya 2.000 nuevos puntos de información. Estas nuevas secuencias corresponden a 99 genes que fabrican proteínas, y otras zonas que probablemente correspondan a fragmentos reguladores, activadores y silenciadores de genes, que sólo actúan según la célula donde se encuentran, o según la edad del portador. También se ha descifrado la secuencia de centrómeros —el asa por la que la célula toma los cromosomas y asegura que en las células hijas sólo va una copia— y de telómeros —los puntos iniciales y finales de los cromosomas. Ambos muy repetitivos y difíciles de encajar.
Queda por completar el cromosoma Y, el masculino, porque las células secuenciadas no lo contenían. Y también cabe adjudicar el cromosoma al que pertenecen secuencias que pueden tener entre 200, 500 o 1.500 repeticiones, porque una limitación técnica de la tecnología actual hace difícil averiguar el orden. Esto se debe a que la información de los cromosomas debe fragmentarse para ser secuenciada en máquinas que aceptan filamentos de sólo 100 o 200 pares de bases. Por tanto, por más potentes que sean los ordenadores que después vuelven a ensamblar las secuencias, no es fácil averiguar el orden en las repeticiones tan grandes. La nueva técnica utilizada por el consorcio T2T ha permitido leer fragmentos más largos, pero todavía no tan largos como lo son muchas repeticiones.
Para investigar enfermedades genéticas, es importante un genoma humano de referencia. Lo vimos hace 15 días, al explicar cómo los investigadores piden colaboración ciudadana para encontrar la secuencia del cáncer de mama mediante el juego Genigma. En un ámbito de estudio más amplio, el proyecto 100.000 genomas es una iniciativa de investigación clínica con base británica, que quiere secuenciar genomas de pacientes afectados por enfermedades raras o cáncer. El cáncer deja «firmas mutacionales» en el historial celular, que permiten profundizar en las causas de la enfermedad de cada caso. Detectan el tipo de tumor y el órgano de origen, y delatan si un paciente ha podido estar expuesto a causas ambientales carcinogénicas, como el tabaquismo o la luz ultravioleta, o si ha sufrido disfunciones celulares internas.
El estudio más amplio del DNA del cáncer hasta ahora ha estudiado más de 12.000 tumores, y también estuvo publicado el pasado abril en la revista Science. Los resultados han dado 58 nuevos patrones de mutación o «firmas mutacionales» de varios cánceres, lo que apunta a que se pueden conocer nuevos factores que provocan la enfermedad. Además, la nueva técnica analítica desarrollada ha permitido también distinguir diferencias en pacientes recientemente diagnosticados. Así pues, el estudio abre las puertas a conocer mejor el funcionamiento del cáncer y comprender las causas de los patrones de mutación para asociarlas a diagnósticos y tratamientos, y ofrecer una atención más personalizada a los enfermos.
Siguiendo con investigación reciente del genoma humano, podemos encontrar una genealogía de la especie humana, que se ha elaborado con datos genómicos de cientos de miles de personas que vivieron entre 1.000 y 100.000 años atrás, obtenidos en estudios realizados en las últimas dos décadas. Dado que existía la referencia geográfica de la muestra, lo obtenido es un atlas que explica la historia de la especie humana. Cuando se viertan más datos en esta herramienta, se podrá comprender la evolución de la enfermedad genética humana.
Tener la secuencia de genomas de referencia de diversas poblaciones será aún mayor para averiguar el origen de las enfermedades genéticas y pensar en tratamientos más generales. En el continente africano, justamente la cuna de nuestra especie, se han realizado muy pocos estudios genómicos; se estima que todavía tiene una gran variabilidad genética escondida. Al no descubrirla, no sólo nos perdemos el conocimiento de nuestros orígenes, sino también la oportunidad de comprender la base genética de las complejas enfermedades humanas, lo que permitiría mejorar la investigación en salud.