Gestion des données bioinformatiques

Le supercalculateur DATARMOR de l'IFREMER est associé à un vaste entrepôt de données de référence dénommé DATAREF.

Dans le cas des données de bioinformatique, une donnée est dite "de référence" lorsqu'il s'agit d'informations provenant d'instruments scientifiques (reads de séquençage, données MS/MS, etc.) ou de résultats (p.ex. un génome assemblé et annoté).

Le SeBiMER, en lien avec le Centre National de données océanographiques, prend en charge la mise en place des données de bioinformatique de référence sur cet espace de stockage, de la manière suivante :

  • toute donnée est soumise à l'arbitrage du Groupe de Travail "Données de Référence"
  • dès lors qu'une donnée est éligible, elle est placée sur DATAREF dans une arborescence reposant sur un vocabulaire contrôlé (EDAM Ontology)
  • la donnée est également décrite et cataloguée dans le référentiel Sextant
  • la donnée, initialement en accès privé Ifremer, peut être rendue publique à la demande des chercheurs : Catalogue Sextant, site FTP, DOI.

De cette manière, les chercheurs de l'IFREMER dispose d'un tiercé gagnant pour la gestion de leurs données :

  1. un stockage centralisé et sécurisé par archivage des données de bioinformatique
  2. une connexion à haute performance avec le calculateur DATARMOR
    (accès aux données par la ligne de commande et le portail Galaxy@DATARMOR)
  3. une association avec le catalogage Sextant de l'Ifremer et l'attribution d'un DOI pour les publications