Le projet DREAM (PPR Antibiorésistance) vise à étudier l’impact des antibiotiques sur la modulation de la sélection de la résistance aux antibiotiques dans le microbiote intestinal humain [1]. Les réponses aux antibiotiques varient fortement d’un individu à l’autre, et
décrypter les bases génomiques et métaboliques de cette variabilité pourrait permettre de
mieux contrôler la propagation de la résistance. Pour cela, des expérimentations dans des modèles in vitro [2] sont menées par les collaborateurs du projet DREAM en se concentrant sur l’espèce Escherichia coli.
Le laboratoire LABGeM (CEA Genoscope, UMR Génomique Métabolique) a développé plusieurs méthodes basées sur des graphes de pangénome pour structurer les données génomiques des procaryotes (https://github.com/labgem/PPanGGOLiN) [3]. Ce modèle compresse l’information de milliers de génomes d’une même espèce tout en conservant l’information d’occurrence et de co-localisation des gènes. Cette approche par graphe permet une classification statistique en génome persistent, shell et cloud et facilite grandement les analyses de génomique comparée via notamment l’identification des régions de plasticité génomique et leur organisation en modules conservés (panRGP [4] et panModule [5]).
Le présent sujet de thèse a pour premier objectif de développer une nouvelle méthode bioinformatique de reconstruction des réseaux métaboliques à l’échelle d’un pangénome d’une espèce et non plus d’un génome de référence. Cette approche innovante est
particulièrement adaptée aux espèces pour lesquelles de nombreuses données génomiques sont disponibles, allant de plusieurs dizaines à plusieurs milliers de génomes. Un aspect clé de ce processus de reconstruction est la prédiction des activités enzymatiques codées par
les gènes, ainsi que l’exhaustivité de la base de données des voies métaboliques validées expérimentalement [6,7], qui sert de référence pour une reconstruction par homologie [8,9]. La méthode développée utilisera en entrée les graphes de PPanGGOLiN et permettra : (i) la gestion de plusieurs sources de prédiction d’activités enzymatiques avec différents niveaux de confiance (ii) la prise en compte du contexte génomique pour renforcer les prédictions d’activités (iii) l’utilisation de règles de prédiction de voies métaboliques basées sur un découpage en sous-ensembles de réactions conservées. Elle offrira ainsi une vision globale de la diversité métabolique au sein d’une espèce, en permettant d’identifier les voies conservées, perdues et acquises parmi les différentes souches. Les développements bioinformatiques réalisés seront mis à disposition à la communauté scientifique sous la forme d’un logiciel libre.
La méthode développée au cours de cette thèse sera appliquée aux données métagénomiques et métabolomiques générées dans le cadre du projet DREAM. Il s’agira de reconstruire les réseaux métaboliques à partir des génomes des différentes espèces composant le microbiote intestinal, afin d’interpréter conjointement les données d’abondance taxonomique et de composition en métabolites. Cette approche permettra d’élucider le rôle des interactions métaboliques dans la réponse du microbiote aux antibiotiques, notamment en lien avec l’adaptation de souches pathogènes de E. coli.
Ces travaux ont des implications majeures en santé publique pour la lutte contre la résistance aux antibiotiques.
[1] Niehus, R. et al. Quantifying antibiotic impact on within-patient dynamics of extended spectrum beta-lactamase resistance. eLife https://elifesciences.org/articles/49206/ (2020) doi:10.7554/eLife.49206.
[2] Auchtung, J. M., Robinson, C. D., Farrell, K. & Britton, R. A. MiniBioReactor Arrays (MBRAs) as a Tool for Studying C. difficile Physiology in the Presence of a Complex Community. Methods Mol. Biol. Clifton NJ 1476, 235–258 (2016).
[3] Gautreau G, Bazin A, Gachet M, Planel R, Burlot L, Dubois M, et al. PPanGGOLiN: Depicting microbial diversity via a partitioned pangenome graph. PLoS Comput Biol. 2020;16: e1007732. doi:10.1371/journal.pcbi.1007732
[4] Bazin A, Gautreau G, Médigue C, Vallenet D, Calteau A. panRGP: a pan genome-based method to predict genomic islands and explore their diversity. Bioinformatics. 2020;36:i651–i658. doi:10.1093/bioinformatics/btaa792
[5] Bazin A, Medigue C, Vallenet D, Calteau A. panModule: detecting conserved modules in the variable regions of a pangenome graph. bioRxiv. 2021. p. 2021.12.06.471380. doi:10.1101/2021.12.06.471380
[6] Caspi R, Billington R, Keseler IM, Kothari A, Krummenacker M, Midford PE, Ong WK, Paley S, Subhraveti P, Karp PD. The MetaCyc database of metabolic pathways and enzymes – a 2019 update. Nucleic Acids Res. 2020 Jan 8;48(D1):D445-D453. doi:10.1093/nar/gkz862.
[7] Kanehisa M, Furumichi M, Sato Y, Matsuura Y, Ishiguro-Watanabe M. KEGG: biological systems database as a model of the real world. Nucleic Acids Res. 2025 Jan 6;53(D1):D672-D677. doi: 10.1093/nar/gkae909
[8] Feist AM, Herrgård MJ, Thiele I, Reed JL, Palsson BØ. Reconstruction of biochemical networks in microorganisms. Nat Rev Microbiol. 2009 Feb;7(2):129-43. doi:10.1038/nrmicro1949
[9] P. D. Karp, S.M. Paley, M. Krummenacker, A. Kothari, P.E. Midford, P. Subhraveti, A. Swart, L. Moore, and R. Caspi. Pathway Tools version 28.0: Integrated software for Pathway/Genome informatics and Systems Biology, arXiv:1510.03964:1–107, 2024. doi:10.48550/arXiv.1510.03964.
Encadrement
David Vallenet et Violette Da Cunha
Lien sur theses.fr
Publications et valorisations
Financeurs



projet DREAM PPR Antibioresistance
École doctorale

