¿Podemos saber de donde provenían nuestros ancestros?

Marcadores genéticos hoy en día:

Introducción

 

Hola a todxs!!! Espero les parezca útil leer sobre la tecnología que se usa para el rastreo de nuestro antecesores. Algunas técnicas como la detección de SNPs (variaciones o polimorfismos de un sólo nucleótido), STRs (repeticiones cortas de bases o nucleótidos en tandem) y ADN mitocondrial están aquí explicadas de manera breve.

El otro día escuchando una conferencia sobre genética de poblaciones en YouTube, me dí cuenta cuanto ha cambiado esta ciencia en los últimos años debido al avance de las técnicas de biología molecular, cada vez más económicas en el mercado y los resultados de los proyectos: 1000 genomas y HapMap

 En esa conferencia se mencionaban los avances que se han realizado y cuanto han bajado los costos de la secuenciación desde aquel primer Proyecto genoma Humano de casi 1 billón de dólares y ahora con solo 10.000 se podría hacer todo el genoma humano y probablemente sigan cayendo los costos, más y más cada día. Lo mismo ocurre con los métodos de genotipación o genotipificación moleculares cada vez menos costosos debido a las tecnologías de los microchips. En un ensayo con robots que hacen todo el trabajo y con cantidades ínfimas de reactivos se pueden determinar miles de genotipos al mismo tiempo en varios individuos y a muy bajo costo.

La genética de poblaciones ha analizado a lo largo de los años cómo cuantificar la variación o variabilidad en las poblaciones, mapear o ubicar genes de interés o encontrar asociaciones de ciertos genes con susceptibilidad o resistencia a enfermedades, reconstruir historias migratorias, etc.  Estos estudios son de distintas utilidades dependiendo de la especie y se aplican a todo tipo de individuos: humanos, perros, ganado de producción lechera o de carne, etc. El desarrollo de programas de computación y algoritmos matemáticos que puedan analizar todos estos datos en forma conjunta y arrojar valores confiables que han aparecido en estos últimos años, garantizan la confiabilidad de los resultados.  El uso de  Componentes principales o Principal o en inglés PCA (Principal component analysis) a través de algoritmos específicos puede relacionar en varias dimensiones los SNPs (single nucleotide polymorphism)  y sus diferencias en las distintas subpoblaciones o poblaciones de distintos orígenes étnicos con una gran precisión, es especial cuando se combinan con otros que permiten graficar de forma clara los resultados.  Incluso se puede rastrear el origen de los ancestros de un individuo con una precisión tan alta que determina el ancestro dentro de un radio de menos de 400 km de donde provenía.

En el caso de los Argentinos por ejemplo y supongo que a muchos de los latino-americanos nos gustaría saber de dónde provenimos y muchas veces nos surgen preguntas como estas:  ¿Tendremos ancestros europeos de la primera ola migratoria de los conquistadores españoles,  o serán de la 2da o 3ra?. ¿O tendremos ancestros alemanes o franceses o griegos o alemanes o árabes y de donde exactamente? ¿Tendremos algún ancestro nativo americano o alguno de origen africano?

Para hacer estos estudios se usan varios tipos de herramientas de la biología molecular:

  •  SNPs

Los SNPs o SNPs (single nucleotide polymorphism)

Son variaciones en una sola de las bases de ADN entre un individuo y otro. La idea es que la si la frecuencias de esa variación de un nucleótido en de más de un 1 % en la población se convierte en una variante de las poblaciones más que una mutación.

SNPS de la universidad de Utah Learn genetics

Fuente: https://learn.genetics.utah.edu/content/precision/snips/

Hoy en día estos estudios poblacionales usan paneles de mas de varios SNPs al mismo tiempo en una gran cantidad de individuos analizados para evaluar la ancestría y la relación entre distintas poblaciones.

La diferencia entre un SNP y SNPs se ve la siguiente figura

  • Diferencia entre SNPs y STRs

Diferencia entre SNPs y STRs

  • Los microsatélites o STRs (short tándem repeats) lo que quiere decir repeticiones cortas en tándem, han sido de particular uso tanto en la identificación de individuos o sea en la genética forense como en los análisis de paternidad. Son grupos de 3 a 4 nucléotidos que se repiten en un número muy variable en la población. Por ejemplo ACCG ACCG ACCG ACCG (en este caso lo tendríamos 4 veces repetido) pero como están tanto en el cromosoma paterno como en el que heredamos de nuestra madre, tendremos dos números de repeticiones. Por ejemplo 4 (para seguir con el ejemplo, en 1 cromosoma y en el otro por ejemplo 6. Otros tendrán 4 y 10; otros individuos, 5 y 6 y así las combinaciones son muchas.
Numero variable de STRs en distintas personas.

Numero variable de STRs en distintas personas. Fuente: https://vce.bioninja.com.au/unit-three/area-of-study-1-biotechnolo/core-technologies.html

Estos SNPs y STRs están distribuidos a todo lo largo del genoma y de los cromosomas como se puede ver en la siguiente imagen

 

 

 

Un ejemplo de este tipo de análisis de STRs se muestra en la siguiente tabla:

Alelo

(STR)

Motivo

Repetido

P. génica

Caucásicos

(N = 302)

P. génica

Afroamericanos

(N = 258)

P. génica

Hispanos

(N = 140)

5

[AATG]5

0,002

0,004

Ausente

6

[AATG]6

0,232

0,124

0,214

7

[AATG]7

0,190

0,421

0,279

8

[AATG]8

0,084

0,194

0,096

9

[AATG]9

0,114

0,151

0,150

9,3

Variante 9

0,368

0,105

0,246

10

[AATG]10

0,008

0,002

0,014

11

[AATG]11

0,002

Ausente

Ausente

Fuente: http://geneticaaplicada2011.blogspot.com.ar/2011/02/conceptos-de-identificacion-genetica.html

  • Marcadores de ADN mitocondrial

El ADN que está dentro de las mitocondrias celulares es pequeño y circular y se auto replica como el ADN del núcleo celular. Este ADN lo  heredamos de nuestras madres  de sus mitocondrias ya que en la fecundación del ovocito el espermatozoide no aporta mitocondrias, por ende los embriones heredan las mitocondrias con su ADN directamente de sus madres. Por su baja tasa de mutaciones y el hecho de que se hereda de esta forma, las secuenciación del ADN mitocondrial se usa para rastrear las líneas maternas, no sufren recombinación o crossing over porque es un genoma haploide. Pero tienen algunos elementos muy variables que son usados para corroborar nuestros orígenes maternos. Por eso son muy usadas en los análisis de ancestros y nos permiten ver de qué poblaciones originarias provenimos. La probabilidad de compartir estas variaciones sin estar emparentados es muy baja. Por ejemplo, de los 1175 alelos diferentes determinados en las poblaciones caucásicas norteamericanas, 982 son únicos y por eso se usan para estos fines. (http://geneticaaplicada2011.blogspot.com.ar/)

Hay descriptos varios haplogrupos que nos dan una idea de los orígenes incluso hasta la primera mujer.

  •  Marcadores del cromosoma Y

Como sabemos el cromosoma Y se hereda de padre a hijo varón en forma directa. Por ende al igual que en el caso del mitocondrial para la línea materna, este cromosoma y sus variables son de utilidad para analizar la línea paterna. También existen varios haplogrupos descriptos que dan una idea de los orígenes

  • Haplotipos de SNPs

Como comentábamos antes acerca de los SNPs y que están en varios cromosomas e incluso varios dentro de un mismo cromosoma. A varios SNPs ubicados sobre un mismo cromosoma al estar ligados tienden a heredarse juntos sin sufrir recombinación.   Estos SNPs juntos o ligados son analizados en distintas poblaciones y nos pueden proporcionar una buena idea de de dónde provenimos.

Como vemos hoy en día hay a disposición de la genética de poblaciones varias herramientas muy útiles para los análisis de las poblaciones tanto humanas como animales.

Una figura que ilustra algunas de las cosas y preguntas que nos hacíamos al principio se ve aquí:

Determinación de la Estructura Genética de la población de Mendoza a partir del análisis de STRs autosómicos y del cromosoma Y

Determinación de la Estructura Genética de la población de Mendoza a partir del análisis de STRs autosómicos y del cromosoma Y

Como siempre ya existen varias empresas privada que pueden hacer rastreos de tu genealogía. Lo mismo pueden hacer con tus mascotas como tus perros y saber mezcla de que razas son, o si son de raza, si son puros y de quienes descienden.

Eso sí ojo con los resultados de estas empresas y que la certeza de la prueba sea bien alta porque si no, pueden dar lugar a malas interpretaciones.

Fuentes consultadas y direcciones útiles:

Empresa que ya te hace este tipo de análisis para humanos.  http://www.dnatribes.com/snpfaq.html.

Determinación de la Estructura Genética de la población de Mendoza a partir del análisis de STRs autosómicos y del cromosoma Y. Furfuro, S. ; Gonzalez, P ; Marino , M. (http://www.fcm.uncu.edu.ar/jornadas2010/index.php/articulos/view/1)

http://geneticaaplicada2011.blogspot.com.ar/2011/02/conceptos-de-identificacion-genetica.html

http://www.genebase.com/about/?cat=3

http://www.dnaancestryproject.com/index.php?&l=n&__atoken=__NONE__

(DNA Haplogroups, Indigenous DNA, DNA Reunion, DNA Archaeology, Family TreeStore)

Conferencia de genética de poblaciones del Dr. Carlos Bustamante, disponible en YouTube. CARTA_ Carlos Bustamante – Population Genetic Inference in the Personal Genome Era

Yang et al. BMC Genomics 2012, 13:346 Page 11 of 12.  http://www.biomedcentral.com/1471-2164/13/346

Londin ER, Keller MA, Maista C, Smith G, Mamounas LA, et al. (2010) CoAIMs: A Cost-Effective Panel of Ancestry Informative Markers for Determining Continental Origins. PLoS ONE 5(10): e13443. doi:10.1371/journal.pone.0013443

Nassir et al. An ancestry informative marker set for determining continental origin: validation and extension using human genome diversity panels2009BMC Genetics 2009, 10:39 http://www.biomedcentral.com/1471-2156/10/39

Irwin, J et al. mtGenome reference population databases and the future of forensicmtDNA analysis. Forensic Science International: Genetics 5 (2011) 222–225.

Rosenberg, N. et al. Informativeness of Genetic Markers for Inference of Ancestry. Am. J. Hum. Genet. 73:1402–1422, 2003

Kidd et al.  Analyses of a set of 128 ancestry informative single-nucleotide polymorphisms in a global set of 119 population samples. Investigative Genetics 2011, 2:1.  http://www.investigativegenetics.com/content/2/1/1

Gravel et al.  Demographic history and rare allele sharing among human populations. PNAS 2011 vol. 108, no. 29 (11983–11988).  www.pnas.org/cgi/doi/10.1073/pnas.1019276108

Brisbin A, et al.  PCAdmix: Principal Components-Based Assignment of Ancestry along Each Chromosome in Individuals with Admixed Ancestry from Two or More Populations. Human Biology, August 2012, v. 84, no. 4, pp. 343–364.

 

Saludos

Gabriela