Autre question, moins génétique. Lorsque l'on veut étudier des lien de
parenté entre différentes espèces à partir de leur ADN. Comment
fait-on? J'imagine qu'on calcul une sorte de distance
Tu imagines assez bien en fait ! En effet les recherches de parentés entre espèces basées sur la génétique ( = la phylogénétique) se basent au final sur des distances , mais pas directement entre les 2 (pour faire simple) espèces que l'on compare. En effet, on s'appuie sur les mécanismes de l'évolution qui veulent que deux espèces dérivent d'un ancêtre commun. Ce sont donc les distances entre chacune des 2 espèces et leur ancêtre commun qui sont calculées. Ca peut paraître moins intéressant que calculer une distance directe entre les 2 espèces (ce qui correspond en fait à un 'score'), mais ça a tout de suite un intérêt quand on passe a plus de deux espèces : on compare les X espèces deux à deux, ce qui nous donne un certain nombre (X-1) d'ancêtres communs, puis ensuite on peut comparer les ancêtres communs ! C'est comme ça qu'on obtient des arbres phylogénétiques (que tu as surement déjà vu ?).
Quant à t'expliquer COMMENT on fait ça en pratique... Pour faire très très simple, on essaie mathématiquement de "reconstituer" ce qui a pu se passer comme évolution pour le matériel génétique des différentes espèces, en les "alignant" : on cherche à mettre en parallèle le plus possible de bases (A,T,C,G) entre les deux espèces, et ainsi identifier si certaines ont été ajoutées chez l'une des espèces au cours du temps, ou si certaines ont disparu (insertions/délétions), ou alors remplacées (ex : un A devenu un G). Ca passe donc par des traitements mathématiques et statistiques plus ou moins compliqués (plus c'est compliqué, plus c'est puissant, et inversement), donc heureusement on s'aide d'ordinateurs ! Au final, on obtient un score comme je t'ai dit précédemment. Ainsi, pour comparer différentes espèces, il faudra en fait les comparer toutes, deux à deux.
Enfin, je tiens à te préciser que pour comparer deux espèces, on n'aligne pas TOUT leur génome, ce serait un travail monstrueux, que l'ordinateur le plus puissant que tu puisses imaginer mettrait un temps incroyable à effectuer ! C'est pourquoi on utilise plutot des portions de génomes bien définies, et connues pour varier plus ou moins selon les espèces. Pour te donner un exemple, j'ai travaillé sur la construction d'un arbre phylogénétique de différents représentants d'une espèce bactérienne (Achromobacter), simplement en séquençant et alignant les séquences d'un seul gène plutot petit (~1500 bases, contre plusieurs millions pour le génome complet).
mais entre 2 individus est-ce pertinent?
Alors en fait, entre deux individus ça ne repose pas sur le même principe... Je suppose que tu veux parler de cas comme la recherche de paternité ? En fait, la méthode se base sur des répétitions dans la séquence. Prenons le cas de l'homme : on sait qu'à certains endroits ( = loci) connus du génome humains, il existe par exemple des répétitions 'AC' d'affilée. Par chance, il existe un polymorphisme de ces répétitions : certains ont 5 'AC' d'affilée, d'autres en ont 12, encore d'autres 7, etc ... Bien sûr, nous sommes 6 milliards, et il n'y a pas 6 milliards de variantes de cette répétition AC. Mais ce même genre de répétition existe à bien d'autres endroits du génome, et à chacun de ces endroits il y a un nouveau polymorphisme ! Ce qui fait qu'au final avec plusieurs dizaines de telles répétitions, on peut établir la parenté de deux personnes.
Tu noteras certainement que ça se complique à cause de notre diploïdie : nos parents nous ont très certainement transmis chacun 2 variantes différentes de ces répétitions, pour un même endroit (ex: pour un même locus génétique, 5 'AC' donnés par la mère, mais 7 sur le chromosome venant du père)...