Modélisation de séquences et reconstruction non supervisée de génomes microbiens à partir de donnée métagénomiques. - Thèses Université Clermont Auvergne
Thèse Année : 2019

Sequence modelling and unsupervised reconstruction of microbial genomes from metagenomic data

Modélisation de séquences et reconstruction non supervisée de génomes microbiens à partir de donnée métagénomiques.

Résumé

Résumé indisponible.
Les micro-organismes sont ubiquistes et contribuent à tous les cycles biogéochimiques de la planète. Leur étude en laboratoire souffre cependant d’importantes limitations. Les approches métagénomiques permettent d’étudier la matière noire microbienne in situ. Leur étude en laboratoire souffre cependant d’importantes limitations et les approches de type "omique" comme la métagénomique ont ainsi révolutionné l’écologie microbienne. Il est ainsi possible de reconstruire des génomes sans mettre en culture les microorganismes grâce aux recours à des stratégies par des approches de binning non supervisé.Les méthodes existantes sont articulées en deux étapes : une représentation numérique (ou « modélisation ») des séquences métagénomiques (le plus souvent, des contigs) puis un clustering. Ce dernier produit des « bins » représentant les génomes. Une comparaison objective de ces méthodes restait nécessaire. Cette dernière a été conduite à partir de jeux de données maîtrisés et a permis de mettre en évidence une influence de la méthode employée sur les résultats, et ce quelle que soit l’origine taxonomique des micro-organismes reconstruits (chapitre 3). Cependant, la modélisation de séquences manque de diversité pour tirer parti des approches consensuelles pourtant prometteuses. Six modélisations, dont trois encore inutilisées pour le binning et une originale, sont réunies dans un même module Python dédié – fennec. Ces différentes modélisations sont intégrées en une seule de manière non supervisée et adaptative. Cette adaptabilité a été exploitée au travers d’un processus itératif d’extraction de génomes automatique basé sur un clustering semi-supervisé (chapitre 4). Cet outil appliqué individuellement ne permet pas la reconstruction de meilleurs génomes sur des données de test et réelles. Cependant, il vient améliorer les résultats d’autres logiciels lorqu’une approche par consensus est envisagée (chapitre 5).
Fichier principal
Vignette du fichier
2019CLFAC111_GRAVOUIL.pdf (23.08 Mo) Télécharger le fichier
Origine Version validée par le jury (STAR)

Dates et versions

tel-04718038 , version 1 (02-10-2024)

Identifiants

  • HAL Id : tel-04718038 , version 1

Citer

Kévin Gravouil. Modélisation de séquences et reconstruction non supervisée de génomes microbiens à partir de donnée métagénomiques.. Bio-Informatique, Biologie Systémique [q-bio.QM]. Université Clermont Auvergne [2017-2020], 2019. Français. ⟨NNT : 2019CLFAC111⟩. ⟨tel-04718038⟩
16 Consultations
1 Téléchargements

Partager

More