« Pääbo-17/8 chap14 » : différence entre les versions

De biorousso
Aller à la navigation Aller à la recherche
Ligne 37 : Ligne 37 :


==Questions==
==Questions==
 
Comment sont crées les algorithmes informatiques ?
----
----
*retour à [[Lecture_Pääbo_17/18]]
*retour à [[Lecture_Pääbo_17/18]]
*retour à [[Accueil]]
*retour à [[Accueil]]

Version du 5 décembre 2017 à 14:41

Chapitre n°14, Cartographier le génome, Anne, Razane & Eline

Le chapitre en deux mots

Pääbo et son équipe essaient d'établir des correspondances entre des fragments d'ADN néandertalien et le génome humain actuel, ce qui est la cartographie. Leur objectif de départ était de trouver si les séquences d'ADN néandertalien avait des liens de parenté en particulier avec les humains actuels en Europe qu'avec des personnes qui font partie d'autres régions du monde.

Mots clés

cartographie
correspondance
algorithme
contamination

Aspects

Raisonnement

  • La cartographie des critères de correspondance équilibrés. Car si ces critères étaient trop tolérants, cela permettra à des fragments d'ADN bactérien, du fait qu'ils présentent une ressemblance au génome humain, d'être faussement attribués à l'ADN néandertalien. Par conséquent, le génome néandertalien serait plus éloigné de celui des humains de nos jours, qu'il ne l'était en réalité. Et si ces critères sont strictes afin d'avoir une correspondance exacte entre les fragments d'ADN néandertalien et le génome humain, le risque serait que des fragments contenant des petites différences réelles soient exclus. Ceci pourrait rapprocher davantage le génome néandertalien de celui des humains actuels qu'il ne l'était vraiment. Il fallait donc trouver des critères qui se situent entre les deux cités plus haut, car cela influencera tous les résultats de leurs travaux qui utilisent principalement les écarts par rapport aux génomes actuels.
  • L'algorithme de cartographie a également permis de mettre en oeuvre la façon dont les erreurs sont produites, en analysant la probabilité d'erreur selon la position des nucléotides C. Si en position finale, on observe un T dans la séquence néandertalienne et un C dans le génome humain, cela signifie que la correspondance est presque parfaite car les erreurs dues à la désamination, qui transforme les C en T aux extrémités des fragments néandertaliens, étaient très courantes. Par contre, si un C se trouve en position finale des fragments néandertaliens, et un T dans le génome humain, cela est un vrai écart. Une correspondance correspond à une comparaison de différents fragments d'ADN néandertalien aux fragments d'ADN humain mitochondrial. Quelques nucléotides de l'ADN néandertalien se chevauchent aux nucléotides de l'ADN humain. Ainsi, une mise en commun entre les nucléotides provenant des deux individus (Néandertal et humain) est possible.
  • La solution à leur problème liée à la première contamination est de durcir les critères d'exclusion de la correspondance. En faisant cela, les degrés d'écart par rapport au génome de référence devenaient identiques dans les fragments longs et dans les fragments courts. En fait, les fragments courts d'ADN bactérien avaient été mis en correspondance avec le génome de référence humain par erreur. C'est pourquoi, l'équipe avait l'impression que les fragments courts contenaient plus de différences que les fragments longs. Ils ont donc amélioré le critère d'exclusion et le problème a été résolu.
  • L'équipe a ensuite voulu savoir quelle est la fréquence des allèles dérivés (récents) chez les Néandertaliens que l'on voit aussi chez les humains d'aujourd'hui. La réponse permettrait d'estimer quand est-ce que l'ancêtre des Néandertaliens s'est séparé de l'ancêtre des humains modernes. Plus il y a d'allèles dérivés partagés par les humains modernes et les Néandertaliens, plus la divergence entre les deux lignées est récente.
  • L'équipe a trouvé une solution au deuxième problème qui s'est présenté à eux. Cette solution comporte deux parties: d'une part, lorsqu'un fragment d'ADN néandertalien était porteur d'un allèle dérivé, il allait correspondre seulement 35% des cas à la séquence de référence du génome humain et différer dans 65% des cas. Donc, un fragment d'ADN néandertalien avait plus de chances de correspondre à la position correcte s'il était porteur de l'allèle ancestral. D'autre part, les fragments courts porteurs d'une différence avec le génome humain échappaient plus souvent aux programmes de cartographie que les fragments longs. Car, les fragments longs comportent plus de positions correspondantes qui permettent de les cartographier correctement. Par conséquent, les fragments courts porteurs d'allèles dérivés sont plus souvent rejetés par le programme de cartographie que les fragments longs. C'est pour cela que l'équipe avait l'impression que les fragments courts portaient plus d'allèles dérivés que les fragments longs. L'impression s'est alors révélée fausse.

Technologies de laboratoire

L'équipe a dû mettre en place un nouveau système d'algorithmes informatiques pour la cartographie qui permettrait de comparer d'une manière plus efficace l'ADN provenant des os néandertaliens (plus d'un milliard de fragments longs de 30 à 70 nucléotides chacun) aux trois milliards de nucléotides du génome humain. L'algorithme élaboré prenait en compte toutes les erreurs qui sont dans les séquences de l'homme de Néandertal. Ces erreurs étaient principalement situées vers les extrémités du brin d'ADN.

Nature des sciences

  • Les erreurs, qui sont relevées par l'algorithme informatique, sont dues à une désamination de résidus de cytosine. Quand un C apparaissait à l'extrémité d'un brin d'ADN, l'équipe avait un risque grand de 20 à 30% que dans leurs séquences, un T apparaisse. Cela s'explique par le fait que lorsque les fragments d'ADN se brisent, les deux brins ne sont plus de la même taille, alors le brin qui pendouille (le plus long) est vulnérable à des attaques chimiques.
  • Il a fallu trouver un point de comparaison neutre, un génome qui n'appartiendrait pas à un Européen ou un Africain afin d'éviter que le génome néandertalien ne se rapproche plus d'une population d'un certain continent que celle d'un autre continent. L'équipe a trouvé ce génome dans celui du chimpanzé. Ils ont par la suite cartographié les fragments d'ADN néandertalien par rapport à un génome imaginaire (celui de l'ancêtre commun des humains et des chimpanzés, reconstruit par d'autres scientifiques). Cette manipulation permettrait d'établir une comparaison entre les fragments néandertalien et les séquences d'ADN qui leur correspondent dans les génomes actuels provenant de diverses régions du monde, et permettant ainsi de relever les différences sans fausser les résultats dès le départ.
  • Un problème surgit lors de l'observation des comparaisons établies: les différences entre l'ADN néandertalien et le génome humain sont plus nombreuses dans les fragments courts que dans les fragments longs. Ce phénomène serait explicable par une potentielle contamination des bibliothèques de séquençage. Cette contamination est due à de l'ADN humain récent qui a été mélangé au génome humain. Mais, l'équipe a vérifié si leurs bibliothèques sont contaminées et elles ne le sont pas.
  • Un autre problème est survenu, l'équipe a remarqué que les fragments longs de l'ADN de Néandertal comportaient plus d'allèles dérivés que les fragments courts. Ce qui revient à dire que les fragments longs sont plus proches de l'ADN humain actuel que les fragments courts, ce qui est une découverte paradoxale qui est peut-être causéé par une contamination.

Questions

Comment sont crées les algorithmes informatiques ?