¿Qué es la Arqueogenética?

por Jesús M. de la Cruz

La arqueogenética es la disciplina que estudia del genoma de los pueblos del pasado, ya sea a través del análisis del ADN de restos arqueológicos o con el estudio de la herencia genética que han dejado en el presente. La posibilidad de recuperar ADN antiguo ha avanzado mucho gracias al desarrollo de técnicas cada vez más sofisticadas, pero estamos lejos de poder obtener muestras de calidad de cualquier resto humano que encontremos. Las condiciones concretas de conservación de un cuerpo condicionan en gran medida la capacidad para obtener datos genéticos de calidad, y en algunos casos, como en las culturas que practicaban la incineración de los cadáveres, resulta extremadamente difícil. También las técnicas para determinar el sexo biológico de una persona han mejorado bastante, aunque según qué casos aún se procede a sexar a los individuos según los datos que arrojan su estructura ósea.

El primer genoma parcialmente descifrado se publicó en 2003, pero no será hasta el año 2022 cuando pudo publicarse de forma definitiva la secuenciación completa del genoma humano. Desde los últimos años la arqueogenética ha dado un gran impulso al conocimiento histórico sobre las culturas de la Prehistoria y a día de hoy se ha convertido en una disciplina auxiliar de la Historia imprescindible. Sin embargo, la arqueogenética por sí sola no es suficiente, sino que necesita ir acompañada de la arqueología para que su información sea útil. Ambas disciplinas son complementarias y sus datos deben tenerse en cuenta para poder obtener conclusiones válidas. Si no lo hacen, la arqueogenética puede llevar a conclusiones precipitadas que no se adaptan a la compleja realidad arqueológica, y analizada por si sola puede conducirnos a interpretaciones que carecen de referencias histórica y que están más motivadas por conclusiones a priori que pretende satisfacer respuestas fáciles en el mejor de los casos, o ideologías políticas radicales en el caso peor.

El ADN no tiene idioma, ni nacionalidad, ni cultura. Todos estos rasgos no corresponden a un código genético, sino a poblaciones humanas que a lo largo de su evolución reciben influencias de otros pueblos vecinos a través de la interacción o el intercambio comercial, desarrollan distintas prácticas de identidad cultural y experimentan cambios en su lengua y sus tradiciones debido al natural desarrollo del proceso histórico. Pretender simplificar la relación entre la arqueología y la arqueogenética desarrollando un esquema por el que a cada grupo genético le debe corresponde una única cultura definida, o concibiendo que detrás de cada lengua hay un único grupo genético concreto, es no entender la complejidad del estudio de los grupos humanos a lo largo de su desarrollo histórico.

Hay que tratar de no caer en estos errores para poder comprender bien toda la información que la arqueogenética puede proporcionar para conocer las culturas de la Antigüedad. Por ello en este artículo me gustaría sentar unas bases para conocer todos los conceptos importantes necesarios para adentrarse en este tema tan apasionante.

Qué es el genoma

Los genes son los paquetes de datos en los que se divide la información de las cadenas de ADN, donde se encuentran todas las instrucciones necesarias para crear vida. Los seres humanos poseemos unos 20.000 genes. El genoma es el mapa completo de todas las instrucciones del ADN contenidas en los genes. El genoma se encuentra en el interior de las células, que contienen dos códigos de ADN distintos, el ADN nuclear y el ADN mitocondrial.

El ADN mitocondrial está contenido dentro de unos pequeños órganos de la célula llamados mitocondrias. Poseen un ADN muy sencillo, de forma circular, que heredamos por parte de nuestras madres a través de una línea de descendencia exclusivamente femenina.

El ADN nuclear procede de los 23 pares de cromosomas que se encuentran en el interior del núcleo de la célula. Los cromosomas son estructuras compuestas por proteínas y una cadena de ADN. De cada par de cromosomas uno lo heredamos de nuestra madre y otro de nuestro padre. Los pares de cromosomas se organizan en orden de tamaño y complejidad del 1 al 23. Los 22 primeros son autosomas, albergando información general, mientras que el par 23 son los cromosomas sexuales, quienes contienen el código que determina el sexo de una persona. El nombre de estos cromosomas procede de su parecido con las letras X e Y cuando son vistos con un microscopio. Las mujeres poseen dos cromosomas X, mientras que los hombres poseen un cromosoma X y un cromosoma Y.

Además, los 22 pares de autosomas también albergan información genética. Durante la reproducción, cada uno de nosotros hereda un par de cada uno de nuestros progenitores, recombinados en un nuevo código cromosómico. El ADN de los autosomas refleja nuestra herencia ancestral de una forma general, ya que estos cromosomas se van fragmentando cada vez más de generación en generación, mezclándose con otros linajes, de forma que no es posible distinguir cuáles proceden por línea materna o paterna. El ADN autosómico muestra por tanto una piscina genética de antepasados indefinidos que pueden retrotraerse a muchas generaciones atrás. 

Este dibujo esquemático representa de forma general una célula con los dos elementos contenedores de ADN que pueden encontrarse en su interior, el núcleo celular y los orgánulos de las mitocondrias. En cada uno de ellos se recrea cómo son las cadenas de ADN que pueden obtenerse. También se observa la organización de los cromosomas y autosomas que se encuentran en el interior del núcleo. Fuente de la imagen: National Institutes of Health.

Haplogrupos y linajes genéticos.

Toda la Humanidad posee un linaje genético que nos conecta con nuestros más remotos antepasados. Los genes pueden mutar de forma natural, y el estudio del genoma utiliza estas mutaciones como hitos en el camino para analizar el recorrido de un linaje a través de toda la sucesión de antepasados de una persona de los cuales ha heredado alguna mutación genética. Los haplogrupos o clados están formados por todas las personas que comparten un antepasado común. Estos linajes pueden trazarse bien a través de la línea de descendencia masculina estudiando el ADN del cromosoma Y, o ADN-Y, o bien a través de la línea de descendencia femenina estudiando el ADN mitocondrial, o ADNmit.

El ADN-Y es el más útil para trazar el camino de una herencia genética, ya que consiste en varios centenares de genes que pueden mutar con relativa frecuencia, por lo que gracias a ello pueden trazarse mapas genómicos muy detallados. Este ADN nos sirve para conocer la herencia transmitida de padres a hijos a través de una línea de ascendencia exclusivamente masculina.

El ADNmit es mucho menos complejo y sus mutaciones ocurren con una frecuencia de miles de años, por lo que es más útil en el seguimiento de linajes ancestrales muy antiguos.

Dentro de cada haplogrupo o clado es posible encontrar familias genéticas más pequeñas, denominadas subclados. donde pueden encontrarse patrones genéticamente similares entre individuos y poblaciones humanas. Estos grupos se han denominado con una letra para marcar su orden cronológico de aparición. Los haplogrupos del ADN-Y, o Y-haplogrupos, llegan hasta la letra T, mientras que, en el caso de los haplogrupos del ADN mitocondrial, los grupos llegan hasta la letra X.

Cuando uno de estos grupos humanos muestra una diferencia, los subclados son enumerados con un número, al que se pueden añadir otras siglas. Por ejemplo, el famoso haplogrupo de los pueblos esteparios que avanzaron por Europa durante el Calcolítico aportando la lengua indoeuropea son subclados R1a y R1b del haplogrupo R. Cuando un grupo genético va diluyéndose con otros conforme avanza por un territorio, se habla de clina o gradiente. Así, el haplogrupo R1b muestra una clina cada vez menor desde la región atlántica hacia el centro y norte de Europa, mezclándose con el sublcado R1a, que predomina en Europa del este.

Adán Cromosómico y Eva Mitocondrial son los nombres que se han acuñado para hacer referencia al primer antepasado de todos los linajes masculinos y femeninos que existen. Sin embargo, estos Adán y Eva no son personas reales, sino una forma de conceptualizar esa idea de un antepasado del que todos procedemos. Se calcula que en el momento de origen en el que es posible fechar este origen pudo ser de unos 200.000 años, un momento en que debían existir varios miles de seres humanos. Lo mismo ocurre con Adán, cuyo origen pudo estar en el sur de África en una fecha aproximada de 270.000 años, aunque estas fechas son discutidas, y se han proporcionado otras, algunas más tempranas y otras mucho más antiguas.

Mapa genealógico de los haplogrupos o clados de Europa y sus familias o subclados más importantes, desde el Paleolítico superior hasta el Calcolítico. Fuente de la Imagen: Eupedia.com

Representación de datos

En los artículos de investigación científica es común encontrar una tabla de PCA, o Principal Component Analysis, expresada en una gráfica de dos variantes. En ellas se realiza un análisis multivariable de todos los datos genómicos de distintos individuos para mostrarlos con un icono de color que resume toda la información de su ADN. Los iconos de esta gráfica estarán dispuestos en el campo más cerca según mayor sea la cercanía entre individuos. Esta gráfica puede usarse para identificar diferencias genéticas entre las poblaciones, de manera que los iconos dispuestos en el campo de la gráfica que representan a las personas aparecen agrupados según su cercanía genética sea mayor.

Sin embargo, este método de representación, aunque muy utilizado, ha sido duramente criticado al definir que los resultados mostrados son aleatorios y no obedecen a una realidad, sino que son fácilmente manipulables y sus resultados han sido considerados inaceptables desde un punto de vista científico, ya que los datos pueden cambiar completamente según como sean introducidos los datos y pueden ser fácilmente manipulados por las ideas a priori de los investigadores (Elhaik, E., 2022).

Otros métodos de representación permiten la plasmación de gráficas donde se desarrollan datos genéticos a través del árbol genealógico de una muestra. Estas formas son útiles para estudiar los procesos de relación entre poblaciones y la mezcla que resulta de ellas. Algunas de las más utilizadas son los softwares de cálculo algorítmico GLOBETROTTER, ADMIXTURE o STRUCTURE, entre otros, son programas que permiten determinar de forma estimada la ancestría de un grupo de individuos a través del análisis de los datos genómicos (Alexander, D. D. et alii, 2009; Wangkumhang, P. et alii, 2022).

En esta imagen se muestra una tabla PCA con las múltiples variantes que puede adoptar con la inclusión de nuevos datos o la modificación de datos ya existentes. Se puede ver que varios resultados son posibles, lo que muestra la inconsistencia de este tipo de representación gráfica de la relación entre grupos humanos. Fuente de la imagen: Elhaik, E. (2022): fig. 20.

Ejemplo de gráfica obtenida con el programa ADMIXTURE. En ella se muestra el linaje genético de varios individuos de época argárica mostrando la ancestría que comparten con pueblos agricultores neolíticos provenientes de Anatolia (AnatoliaN), con pueblos Yamnaya (Yamnaya), con pueblos cazadores recolectores de Europa occidental (WHG) y con pueblos neolíticos de la region de Irán (Iran N). Fuente de la imagen: Villalba-Mouco, V. et alii (2021): fig.S6.

Imagen de portada: mapa genético de la población actual de Europa, donde se muestran los principales linajes de AND-Y de cada país. Fuente: Eupedia.

Referencias bibliográficas:

National Institutes of Health. Una organización dependiente del gobierno de los Estados Unidos que agrupa a varias instituciones y centros de investigación médica.

https://www.genome.gov/about-genomics

Eupedia. Una enciclopedia online centrada en el continente europeo. Posee mucha información y mapas, pero algunos de sus datos no están actualizados y deben ser tratados con cuidado.

https://www.eupedia.com/genetics/

Alexander, D. H. et alii (2009): “Fast model-based estimation of ancestry in unrelated individuals”. Genome Research, 19 (9). pp. 1655-1664.

DOI: https://doi.org/10.1101%2Fgr.094052.109

Elhaik, E. (2022): “Principal Component Analyses (PCA)-based findings in population genetic studies are highly biased and must be reevaluated”. Scientific Reports, 12, 14683.

DOI: https://doi.org/10.1038/s41598-022-14395-4

Villalba-Mouco, V. et alii (2021): “Genomic transformation and social organization during the Copper Age–Bronze Age transition in southern Iberia”. Science Advances, 7: eabi7038.

DOI: https://doi.org/10.1126/sciadv.abi7038

Wangkumhang, P. et alii (2022): “An efficient method to identify, date, and describe admixture events using haplotype information”. Genome Research, 32. pp. 1553-1564.

DOI: https://doi.org/10.1101/2021.08.12.455263

Deja una respuesta