Doctorat
Génomique comparée des éléments génétiques de Thermococcales, un ordre d'Archaea hyperthermophiles: diversité et plasticité des génomes.UMR6197 LM2E - Laboratoire de Microbiologie des Environnements extrêmes 29280 Plouzané
Ce laboratoire,
UMR6197, est dirigé par Daniel PRIEUR et sous la tutelle du CNRS, de
l’université de Bretagne Occidentale et de l’IFREMER. La principale
thématique de recherche est l’écologie microbienne au sein des
environnements extrêmes, plus particulièrement en
milieu abyssal à proximité des fumeurs noirs. Le
projet de thèse s’inscrivait dans
l’initiation d’une nouvelle thématique
visant à la caractérisation des éléments génétiques
d’Archaea hyperthermophiles par une approche de génomique comparative.
Les Thermococcales constituent un ordre modèle d’Archaea, par
l’importante collection d’isolats disponibles et de part leur
répartition géographique importante et l'endémisme des sources
hydrothermales profondes.
Afin de sonder la biodiversité des éléments génétiques, le premier travail a consisté à cribler une banque de plus de 300 souches de Thermococcales à la recherche d’éléments génétiques par une technique d’extraction d’ADN extrachromosomique proche de la lyse alcaline mais adaptée à la membrane des Archaea. L’abondance de ces éléments a été jugées relativement importante par rapport à d'autres familles. En effet, environ 30% des souches possèdent au moins un génome extrachromosomique. Une première classification a été effectuée par l’intermédiaire de d’hybridation croisée ADN‐ADN afin de choisir des candidats au séquençage. Douze plasmides ont été séquencés après création de banques Shotgun. Ces génomes ont été annotés et ont fait l’objet de la création d’une puce à ADN afin de continuer à explorer la diversité des plasmides encore inconnus. L’ensemble de ces données ont été produites par l’intermédiaire de programmes développés en Perl et consignés dans une base de données de type MySQL inferfacée en PHP. L’impact sur les communautés bactériennes, la plasticité des génomes et la physiologie de leurs hôtes a été étudié en parallèle pour certains plasmides.
Les principaux résultats montrent des similitudes avec les ilôts génomiques de chromosomes d'Archaea (thermophiles mais également mésophiles d'eau douce), la caractérisation du premier élément intégratif dans cet Ordre (dont une proche intégrase est la celle de Sputnik, le virus infectant Mamavirus) ou bien l'annotation d'une nouvelle famille de primase-polymérase thermostable (expérimentalement confirmée une autre équipe). Ces éléments génétiques peuvent être considérés comme un réservoir de nouvelles familles de protéines. Sur la base des annotations, certains gènes ont servis à alimenter un deux programmes de valorisation par caractérisation des structures tridimensionnelles (ACI Genoarchaea) et d'expression afin de tester les activités fonctionnelles (ACI Deephotvir).
Durant ce doctorat, j'ai également eu l'opportunité de travailler sur une thématique annexe, émergeant durant l'annotation des génomes, en relation avec la présence de séquences répétées dans la génome. Cette collaboration avec les les bioinformaticiens de l'éuipe Symbiose de l'INRIA de Rennes à travers l'ANR Modulome a aboutit à la création d'un outil de détection et d'analyse des CRISPRs et gènes CAS associés. Cet outil est disponible à l'adresse suivante : http://crispi.genouest.org
Afin de sonder la biodiversité des éléments génétiques, le premier travail a consisté à cribler une banque de plus de 300 souches de Thermococcales à la recherche d’éléments génétiques par une technique d’extraction d’ADN extrachromosomique proche de la lyse alcaline mais adaptée à la membrane des Archaea. L’abondance de ces éléments a été jugées relativement importante par rapport à d'autres familles. En effet, environ 30% des souches possèdent au moins un génome extrachromosomique. Une première classification a été effectuée par l’intermédiaire de d’hybridation croisée ADN‐ADN afin de choisir des candidats au séquençage. Douze plasmides ont été séquencés après création de banques Shotgun. Ces génomes ont été annotés et ont fait l’objet de la création d’une puce à ADN afin de continuer à explorer la diversité des plasmides encore inconnus. L’ensemble de ces données ont été produites par l’intermédiaire de programmes développés en Perl et consignés dans une base de données de type MySQL inferfacée en PHP. L’impact sur les communautés bactériennes, la plasticité des génomes et la physiologie de leurs hôtes a été étudié en parallèle pour certains plasmides.
Les principaux résultats montrent des similitudes avec les ilôts génomiques de chromosomes d'Archaea (thermophiles mais également mésophiles d'eau douce), la caractérisation du premier élément intégratif dans cet Ordre (dont une proche intégrase est la celle de Sputnik, le virus infectant Mamavirus) ou bien l'annotation d'une nouvelle famille de primase-polymérase thermostable (expérimentalement confirmée une autre équipe). Ces éléments génétiques peuvent être considérés comme un réservoir de nouvelles familles de protéines. Sur la base des annotations, certains gènes ont servis à alimenter un deux programmes de valorisation par caractérisation des structures tridimensionnelles (ACI Genoarchaea) et d'expression afin de tester les activités fonctionnelles (ACI Deephotvir).
Durant ce doctorat, j'ai également eu l'opportunité de travailler sur une thématique annexe, émergeant durant l'annotation des génomes, en relation avec la présence de séquences répétées dans la génome. Cette collaboration avec les les bioinformaticiens de l'éuipe Symbiose de l'INRIA de Rennes à travers l'ANR Modulome a aboutit à la création d'un outil de détection et d'analyse des CRISPRs et gènes CAS associés. Cet outil est disponible à l'adresse suivante : http://crispi.genouest.org