Etablir l'alignement et une phylogénie
Etablir l'alignement et une phylogénie à partir de données authentiques d'une publication récente
Procédure
Suite à une publication récente (Lemopoulos & Montoya‐Burgos , 2021) sur l'évolution des écailles, des plaques osseuses ou une peau nue, des écailles, sur la base d'une phylogénie établie par la comparaison bioinformatique des séquences. Cf Jump-To-Science lien sur la publication a ajouter ici . Juan Montoya‐Burgos a sélectionné pour le projet Jump-To-Science quelques séquences parmi les milliers utilisées dans la publication, pour un gène qui ne possède qu'une copie par espèce (single copy gene), qui montre suffisamment de variation et qui n'est pas trop difficile à aligner.
Il vous a donc sélectionné chez plusieurs espèces de poissons la séquences du gène qui code pour: Cilia and flagella associated protein 58. On trouve cette protéine CFA58 pour de nombreuses espèces sur Uniprot : sélection ici , même chez l'humain Q5T655 (observer ou il est exprimé dans le schéma d'une cellule un peu plus bas)
Obtenir les séquences
- Downloader le fichier texte ici qui content les séquences non-alignées pour quelques 21 poissons et le requin (groupe externe), en format FASTA (Le code après le nom des espèces correspond à l'ID du gène dans la base de donnée GenBank
Aligner ces séquences
- Ouvrir UniProt
- Choisir Align
- Coller toutes le texte avec les séquences dans le champ indiqué Protéin sequences (FASTA)
- Cliquer "Run align"
- Après une attente variable de l'ordre de 1-3 minutes, on obtient un alignement (Exemple de résultat ici (actif jusqu'à mi juin 21)
- Cliquer la case "Similarity"
- Observer le grand degré de similarité - visible dans l'image ci-contre et ici
Noter l'arbre en dessous de l'alignement : "Tree" cf. pour une discussion de la validité de cet arbre cf ce scénario: Preuve de l'évolution par la comparaison de protéines chez différentes espèces)
Un fichier PDF établi par Montoya‐Burgos montrant l'arbre que l'on obtient avec ce gène et disponible ici
Il est intéressant de voir que les espèces Hippocampe et PoissonGlobe évoluent plus vite pour ce gène que les autres espèces).ici
Pour aller plus loin
Pour éprouver le degré de similitude de ces espèces et discuter de l'origine commune de ces espèces (cf. Preuve de l'évolution par la comparaison de protéines chez différentes espèces)
- Ajouter les séquences d'autres espèces dans la case "You may add additional sequences to this alignment (FASTA format)
- On les obtient par exemple depuis le nom de la protéine sur genbank : pour Homo sapiens on trouve une visualisation du gène similaire à Gene Data Viewer sous "Genomic regions, transcripts, and products"
- Si on survole le nom du gène un menu offre l'accès - notamment à la séquence en FASTA ICI vérifier , ça n'a pas l'air facile
- Rvenir dans Uniprot sur l'alignement et ajouter cette séquence en plus
- Cliquer "add sequence and align" pour refaire l’alignement : exemple avec l'humain ici
- Résultat : Alignemnt mémorisé quelques temps ici image d'un extrait avec la similarité activée ici
Insertions possibles des activités de biologie numérique
Concepts et Scénarios pédagogiques où il peut s'intégrer
Références
Lemopoulos, A., & Montoya‐Burgos, J. I. (2021). From scales to armor : Scale losses and trunk bony plate gains in ray‐finned fishes. Evolution Letters, evl3.219. https://doi.org/10.1002/evl3.219