Ingénieur bioinformaticien en développement logiciel (projet ALADIN)

Contexte : 

Le Genoscope (CEA, Institut de Biologie François Jacob) est un centre de référence français en génomique environnementale qui réalise des analyses à grande échelle pour la compréhension des écosystèmes, notamment dans le contexte des grands changements environnementaux. Son unité de recherche (UMR8030 Génomique Métabolique du CEA, du CNRS et de l’Université Paris-Saclay Evry) regroupe plusieurs laboratoires composés de chercheurs et d’ingénieurs experts en génomique, bioinformatique, microbiologie et biochimie. Cette forte interdisciplinarité rend possible une caractérisation fine des espèces, fonctions et interactions présentes dans un écosystème. L’exploration de la biodiversité du métabolisme de ces micro-organismes offre également des applications dans la bioremédiation, la valorisation de la biomasse et dans la découverte de nouveaux catalyseurs pour une chimie durable.

Ce contrat se déroulera au laboratoire LABGeM du Genoscope dans le cadre du projet ALADIN (Active Learning to Accelerate biocatalyst Development for INdustrial biotechnology) en collaboration avec l’Institut de Biotechnologie de Toulouse et le laboratoire MICALIS de l’INRAE. ALADIN vise à combiner la génétique combinatoire avec l’intelligence artificielle pour obtenir de nouveaux catalyseurs. Le LABGeM est impliqué dans le développement de méthodes et workflows bioinformatiques pour explorer la diversité fonctionnelle des familles d’enzymes enrichies par des données métagénomiques (jusqu’à plusieurs milliards de nouvelles séquences protéiques). En effet, les microbiomes de divers biotopes (sol, intestin humain, océans) représentent un réservoir riche et largement inexploité de nouveaux biocatalyseurs aux propriétés biotechnologiques prometteuses.

Missions : 

En interaction avec des chercheurs du LABGeM, l’ingénieur recruté sera chargé du développement de workflows d’analyse de familles d’enzymes qui permettront de : 

  • constituer des familles d’enzymes à partir de séquences de référence ou de profils HMM pour rechercher des homologues dans plusieurs bases de données (UniProt, métagénomes) 
  • classifier une famille en sous groupes sur des critères de similarité de séquence, phylogénie, modélisation structurale de sites actifs (méthode ASMC), contexte génomique (méthode NetSyn)
  • sélectionner des candidats pour du criblage d’activités enzymatiques
  • visualiser les résultats de classification et de criblage

Profil :

Ingénieur en bioinformatique possédant des compétences dans les domaines suivants :

  • Analyses bioinformatiques de séquences protéiques et d’annotation fonctionnelle
  • Expérience en programmation python
  • Gestion de projets logiciels (dépendances, versioning, déploiement)
  • Maîtrise de l’environnement Linux et utilisation d’un cluster de calcul (SLURM)
  • Connaissances dans des systèmes de workflows (nextflow, snakemake, galaxy)

Type de contrat : 

  • CDD-OD (18 mois) ingénieur CEA à Evry (30 km au sud de Paris)
  • Rémunération en fonction de l’expérience (grille CEA)
  • Début dès que possible

Candidature :
Pour postuler, merci de nous faire parvenir un CV ainsi qu’une lettre de motivation à l’adresse suivante : vallenet@genoscope.cns.fr.

Ingénieur bioinformaticien en développement logiciel (projet ALADIN)