Catalogue de génomes

Introduction

La plate-forme Genome Catalog de l'Ifremer propose un accès aux ressources omiques d’organismes marins modèles étudiés à l'Ifremer.

Son objectif est double :

  • Proposer un accès aux génomes (et données associées) directement séquencés par les équipes de l’Ifremer ;
  • Proposer un accès aux génomes publiques utilisés comme référence pour de nouvelles analyses menées par les équipes Ifremer.

Genome Catalog est une application web interactive organisant les génomes aux travers de leurs métadonnées : classification taxonomique, origine des génomes, qualité d’assemblage, liens vers les banques de référence (dans le cas de données publiques), etc. A partir de ce catalogue, l’utilisateur peut accéder à un Genome Browser JBrowse2 (Buels, Robert, et al. Genome Biology, 2016) pour y visualiser les données génomiques de chacune de ces espèces.

Accès au catalogue

Réalisation

Ce projet est réalisé par le service de bioinformatique de l’Ifremer (SeBiMER), rattaché au département IRSI (Infrastructures de Recherche et Systèmes d’Information) en lien avec différentes équipes de recherche (ASIM, La Tremblade ; GENALG, Nantes ; IHPE, Montpellier ;  RMPF, Tahiti) qui ont participé activement à l’établissement du cahier des charges.

Aspects techniques

Le Genome Catalog repose sur l'outil Keshif qui exploite le système de visualisation et de filtrage de données par facettes. Les facettes reposent sur le modèle de métadonnée exploitée par la visualisation.
L'ajout de nouvelles données au Genome Catalog se fait de manière automatisée grâce au pipeline omics-catalog, développé avec le gestionnaire de workflow Nextflow. Celui-ci permet (1) le traitement et l’indexation des données, (2) la création d'une session JBrowser 2 intégrant ces données et (3) l'ajout du lien de cette session et des métadonnées associées au catalogue de génomes. Ce pipeline est disponible sous licence libre.