« Etablir l'alignement et une phylogénie » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
== Etablir l'alignement et une phylogénie à partir de données authentiques d'une publication récente ==
== Etablir l'alignement à partir de données authentiques : une étape vers la phylogénie. ==


== Procédure ==
== Procédure ==
Ligne 20 : Ligne 20 :
** Observer le grand degré de similarité - visible dans l'image ci-contre et [https://edutechwiki.unige.ch/fr/Fichier:Alignment-22-especes-poisson-Uniprot-similarity.jpg ici]
** Observer le grand degré de similarité - visible dans l'image ci-contre et [https://edutechwiki.unige.ch/fr/Fichier:Alignment-22-especes-poisson-Uniprot-similarity.jpg ici]
** Remarque: cet outil d'alignement est prévu pour des séquences de protéines: le programme considère donc les 4 lettres A, T, C, G comme des acides aminés. Lorsque les acides aminés sont identiques, il y a un *. A et G sont des acides aminés 'similaires' : il y a un ..
** Remarque: cet outil d'alignement est prévu pour des séquences de protéines: le programme considère donc les 4 lettres A, T, C, G comme des acides aminés. Lorsque les acides aminés sont identiques, il y a un *. A et G sont des acides aminés 'similaires' : il y a un ..
Noter l'arbre ("guided tree") en-dessous de l'alignement : "Tree"  cf. pour une discussion de la validité de cet arbre cf ce scénario: [[Preuve de l'évolution par la comparaison de protéines chez différentes espèces]])  
Notez que  l'arbre ("guided tree") en-dessous de l'alignement : "Tree"  n'exprime pas réellement la phylogénie cf. pour une discussion de la validité de cet arbre cf ce scénario: [[Preuve de l'évolution par la comparaison de protéines chez différentes espèces]]). Voir plutôt  l'arbre phylogénétique obtenu avec ces séquences établi par Montoya‐Burgos montrant disponible  [https://tecfa.unige.ch/perso/lombardf/projets/experimental/sequences-poissons-V21/Arbre_ML_Cilia_associated_prote58_poissons_align-PhyML_tree.pdf ici(pdf)]. Il nous fait remarquer que le gène étudié (CFA58) a évolué plus rapidement chez les espèces Hippocampe et PoissonGlobe que chez les autres espèces .[https://tecfa.unige.ch/perso/lombardf/projets/experimental/sequences-poissons-V21/Arbre_ML_Cilia_associated_prote58_poissons_align-PhyML_tree.jpg ici]


Un fichier PDF établi par Montoya‐Burgos montrant le "vrai arbre phylogénétique" obtenu avec ces séquences est disponible [https://tecfa.unige.ch/perso/lombardf/projets/experimental/sequences-poissons-V21/Arbre_ML_Cilia_associated_prote58_poissons_align-PhyML_tree.pdf ici]
===== Pour aller plus loin =====
 
====== 1) Eprouver le degré de similitude de ces espèces et discuter de l'origine commune de ces espèces ======
 
===== (cf. [[Preuve de l'évolution par la comparaison de protéines chez différentes espèces]]) =====
* Reprendre l'alignement
* Ajouter les séquences d'autres espèces  dans la case "You may add additional sequences to this alignment (FASTA format)
** pour [https://www.ncbi.nlm.nih.gov/gene?Db=gene&Cmd=DetailsSearch&Term=159686 Homo sapiens] on trouve une visualisation du gène similaire à Gene Data Viewer sous  "Genomic regions, transcripts, and products"  
'''Refaire les analyses avec des séquences de protéine.'''
* Revenir dans Uniprot sur l'alignement  
* ajouter une séquence en plus par exemple une partie du gène chez l'humain [http://tecfa.unige.ch/perso/lombardf/projets/experimental/sequences-poissons-V21/Cilia_associated_prot58-homo-sap.txt ici]  


Il est intéressant de voir que le gène étudié (CFA58) a évolué plus rapidement chez les espèces Hippocampe et PoissonGlobe que chez les autres espèces .[https://tecfa.unige.ch/perso/lombardf/projets/experimental/sequences-poissons-V21/Arbre_ML_Cilia_associated_prote58_poissons_align-PhyML_tree.jpg ici]
* Cliquer "add sequence and align" pour refaire l’alignement : 
* Résultat : Alignemnt [https://www.uniprot.org/align/A2021050672FEB3358BE035486EE75ADE9E9177250045075 mémorisé quelques temps ici] image d'un extrait avec la similarité activée  [http://tecfa.unige.ch/perso/lombardf/projets/experimental/sequences-poissons-V21/alignement-simimilarity-poissons+homo.jpg ici]  


===== Pour aller plus loin =====
====== 2) Voir la '''structure du gène''' ======
1) Vous pouvez voir la '''structure du gène''' chez [https://www.ncbi.nlm.nih.gov/gene?Db=gene&Cmd=DetailsSearch&Term=159686 Homo sapiens]  (similaire à Gene Data Viewer) sous  "Genomic regions, transcripts, and products
* Chez [https://www.ncbi.nlm.nih.gov/gene?Db=gene&Cmd=DetailsSearch&Term=159686 Homo sapiens]  (similaire à Gene Data Viewer) sous  "Genomic regions, transcripts, and products"


'''2) Refaire les analyses avec des séquences de protéine.'''
====== 3) Refaire les analyses avec des séquences de ''protéine'' ======
* Aller sur UniProt
* Aller sur UniProt
* Chercher toutes les protéines avec le nom de gène '''Cfap58'''  [https://www.uniprot.org/uniprot/?query=gene%3Acfap58&sort=score Uniprot : sélection ici]  
* Chercher toutes les protéines avec le nom de gène '''Cfap58'''  [https://www.uniprot.org/uniprot/?query=gene%3Acfap58&sort=score Uniprot : sélection ici]  
Ligne 36 : Ligne 47 :
* Cliquer sur 'Align'.
* Cliquer sur 'Align'.
* Cliquer sur la case 'Similarity' dans la colonne de gauche.
* Cliquer sur la case 'Similarity' dans la colonne de gauche.
----
Pour éprouver le degré de similitude de ces espèces et discuter de l'origine commune de ces espèces (cf. [[Preuve de l'évolution par la comparaison de protéines chez différentes espèces]])
+
1) Vous pouvez voir la '''structure du gène''' chez [https://www.ncbi.nlm.nih.gov/gene?Db=gene&Cmd=DetailsSearch&Term=159686 Homo sapiens]  (similaire à Gene Data Viewer) sous  "Genomic regions, transcripts, and products
* Ajouter les séquences d'autres espèces  dans la case "You may add additional sequences to this alignment (FASTA format)
+
**[[Fichier:Alignement-Cilia associated prot58-22poissons+homo-similarity-on.jpg|alt=Alignement dans Uniprot des séquences pour Cilia_associated_prot58 pour 22 poissons+homo avec Similarity on|vignette|210x210px|Alignement dans Uniprot des séquences pour Cilia_associated_prot58 pour 22 poissons+homo avec Similarity on]]On les obtient par exemple depuis le nom de la protéine sur genbank : pour [https://www.ncbi.nlm.nih.gov/gene?Db=gene&Cmd=DetailsSearch&Term=159686 Homo sapiens] on trouve une visualisation du gène similaire à Gene Data Viewer sous  "Genomic regions, transcripts, and products"
+
'''2) Refaire les analyses avec des séquences de protéine.'''
**Si on survole le nom du gène un menu offre l'accès - notamment [https://www.ncbi.nlm.nih.gov/protein/NP_001008723.1?report=fasta à la séquence en FASTA] ''ICI vérifier , ça n'a pas l'air facile'' 
+
* Aller sur UniProt
* Rvenir dans Uniprot sur l'alignement et ajouter cette séquence en plus 
+
* Chercher toutes les protéines avec le nom de gène '''Cfap58'''  [https://www.uniprot.org/uniprot/?query=gene%3Acfap58&sort=score Uniprot : sélection ici] 
* Cliquer "add sequence and align" pour refaire l’alignement : exemple avec l'humain [http://tecfa.unige.ch/perso/lombardf/projets/experimental/sequences-poissons-V21/Cilia_associated_prot58-homo-sap.txt ici]
+
* Par défaut, 25 entrées UniProtKB sont affichées dans la table des résultats: cliquer sur 'Show 200'
* Résultat : Alignemnt [https://www.uniprot.org/align/A2021050672FEB3358BE035486EE75ADE9E9177250045075 mémorisé quelques temps ici] image d'un extrait avec la similarité activée  [http://tecfa.unige.ch/perso/lombardf/projets/experimental/sequences-poissons-V21/alignement-simimilarity-poissons+homo.jpg ici]
[[Catégorie: BioInfoScenarios]]
[[Catégorie: BioInfoScenarios]]



Version du 7 mai 2021 à 14:58

Etablir l'alignement à partir de données authentiques : une étape vers la phylogénie.

Procédure

Suite à une publication récente (Lemopoulos & Montoya‐Burgos , 2021) sur l'évolution des écailles, des plaques osseuses ou d'une peau nue, sur la base d'une phylogénie établie par la comparaison bioinformatique des séquences. Cf Jump-To-Science lien sur la publication a ajouter ici . Juan Montoya‐Burgos a sélectionné pour le projet Jump-To-Science quelques séquences parmi les milliers utilisées dans la publication, de gènes présents en une seule copie dans une espèce donnée (single copy gene). Ces séquences montrent suffisamment de variation et ne sont pas trop difficiles à aligner.

Il vous a donc sélectionné chez plusieurs espèces de poissons la séquence du gène qui code pour: Cilia and flagella associated protein 58. On trouve cette protéine CFA58 (nom de gène: Cfap58) chez de nombreuses espèces sur Uniprot : sélection ici , même chez l'humain Q5T655 (observer dans quel compartiment subcellulaire la protéine est retrouvée dans le schéma d'une cellule un peu plus bas)

Obtenir les séquences
  • Downloader le fichier texte ici qui contient les séquences pour quelques 21 espèces de poissons et le requin (groupe externe), au format FASTA (Le code après le nom des espèces correspond au numéro d'accession de la séquence dans la base de donnée GenBank
Alignment de 22-espèces de poissons sur Uniprot similarity on
Alignment de 22-espèces de poissons sur Uniprot similarity on
Aligner ces séquences
  • Ouvrir UniProt
  • Choisir Align
  • Coller toutes le texte avec les séquences dans le champ indiqué "Protein sequences (FASTA)"
  • Cliquer "Run align"
  • Après une attente variable de l'ordre de 1-3 minutes, on obtient un alignement (Exemple de résultat ici (actif jusqu'à mi juin 21)
    • Cliquer la case "Similarity" dans la colonne à gauche
    • Observer le grand degré de similarité - visible dans l'image ci-contre et ici
    • Remarque: cet outil d'alignement est prévu pour des séquences de protéines: le programme considère donc les 4 lettres A, T, C, G comme des acides aminés. Lorsque les acides aminés sont identiques, il y a un *. A et G sont des acides aminés 'similaires' : il y a un ..

Notez que l'arbre ("guided tree") en-dessous de l'alignement : "Tree" n'exprime pas réellement la phylogénie cf. pour une discussion de la validité de cet arbre cf ce scénario: Preuve de l'évolution par la comparaison de protéines chez différentes espèces). Voir plutôt l'arbre phylogénétique obtenu avec ces séquences établi par Montoya‐Burgos montrant disponible ici(pdf). Il nous fait remarquer que le gène étudié (CFA58) a évolué plus rapidement chez les espèces Hippocampe et PoissonGlobe que chez les autres espèces .ici

Pour aller plus loin
1) Eprouver le degré de similitude de ces espèces et discuter de l'origine commune de ces espèces
(cf. Preuve de l'évolution par la comparaison de protéines chez différentes espèces)
  • Reprendre l'alignement
  • Ajouter les séquences d'autres espèces dans la case "You may add additional sequences to this alignment (FASTA format)
    • pour Homo sapiens on trouve une visualisation du gène similaire à Gene Data Viewer sous "Genomic regions, transcripts, and products"

Refaire les analyses avec des séquences de protéine.

  • Revenir dans Uniprot sur l'alignement
  • ajouter une séquence en plus par exemple une partie du gène chez l'humain ici
  • Cliquer "add sequence and align" pour refaire l’alignement :
  • Résultat : Alignemnt mémorisé quelques temps ici image d'un extrait avec la similarité activée ici
2) Voir la structure du gène
  • Chez Homo sapiens (similaire à Gene Data Viewer) sous "Genomic regions, transcripts, and products"
3) Refaire les analyses avec des séquences de protéine
  • Aller sur UniProt
  • Chercher toutes les protéines avec le nom de gène Cfap58 Uniprot : sélection ici
  • Par défaut, 25 entrées UniProtKB sont affichées dans la table des résultats: cliquer sur 'Show 200'
  • Sélectionner les espèces que vous souhaitez mettre dans votre alignement: choisir des séquences de longueurs similaires (si possible).
  • Cliquer sur 'Align'.
  • Cliquer sur la case 'Similarity' dans la colonne de gauche.

Insertions possibles des activités de biologie numérique

Concepts et Scénarios pédagogiques où il peut s'intégrer

Références

Lemopoulos, A., & Montoya‐Burgos, J. I. (2021). From scales to armor : Scale losses and trunk bony plate gains in ray‐finned fishes. Evolution Letters, evl3.219. https://doi.org/10.1002/evl3.219

Retour à Bioinformatique : opportunités pour l’enseignement