Etude d'un famille de protéines


Nous allons étudier une famille de protéines au sein d'un même génome, avec un ensemble de séquences très conservées (duplication de gènes) et un gène ayant une fonction proche, mais une séquence éloignée.

A l'aide de Entrez retrouvez les séquences qui portent les numéros d'accession : P24088 P32580 O13559 P40105 P53345 P53819

Ne conservez que les séquences issues de la banque SwissProt.

  • Quel organisme proviennent ces séquences ?
  • Quelle est la fonction de ces protéines ?

Mémorisez les séquences de ces protéines au format FASTA et gardez la liste de résultats ouverte.

Effectuez un alignement multiple de ces séquences à l'aide des trois programmes (ClustalW, Dialign et MultAlign).

  • Est-ce que les alignements trouvés sont identiques ?
  • Lesquels semblent les plus satisfaisants ?

2. Qualité de l'alignement.

Le meilleur moyen d'estimer la qualité d'un alignement est de vérifier si les régions connues pour avoir la même fonction biologique sont bien alignées entre elles.

Le lien "Conserved Domains" qui se trouve à droite de chaque entrée (dans la liste de résultats proposée par Entrez) mène à un schéma qui localise les domaines protéiques connus pour chaque entrée.

  • Quels sont les domaines communs aux différentes séquences ?
  • Quelles sont leurs positions (approximatives) sur ces séquences ?

Repérez ces domaines dans les alignements obtenus précédemment. Puis vérifiez que les régions contenant ces domaines sont bien alignées les unes avec les autres.

  • Quels sont les programmes d'alignement multiple qui alignent correctement les domaines fonctionnels ?