Le SeBIMER au sein de ROME, Patrick Durand et Cyril Noel.
Le SeBIMER au sein de ROME, interview de Patrick Durand et de Cyril Noel.
Q : quel est le rôle du SEBIMER dans la mise en place du projet ROME?
Le SeBiMER a un rôle central dans la gestion, l’analyse et la mise à disposition des données et des résultats du projet ROME. En lien avec le SISMER (Pôle National de Données Océanographiques), le SeBiMER organise le stockage des données issues du séquençage des différents échantillons collectés par le réseau ROME. Ces données sont des fichiers au format texte contenant un grand volume de séquences d’ADN. Ce stockage se fait à la fois sur disque dur et sur bande magnétique. Dans le premier cas, les données sont ainsi directement disponibles sur DATARMOR, le supercalculateur de l’Ifremer, en vue de leur analyse. Dans le second cas, les données sont protégées contre toute destruction par un stockage spécifique situé dans un autre bâtiment que celui abritant DATARMOR. Pour la partie analyse de données, le SeBiMER a mis au point les logiciels utilisés dans ROME pour étudier la diversité des communautés (virus, bactéries, eucaryotes) des différents échantillons. Ces outils ont été optimisés pour DATARMOR, et pour assurer la reproductibilité et la traçabilité des analyses dans le temps. Pour ce faire, toutes ces activités du SeBiMER s’inscrivent dans une démarche FAIR (1). Ainsi, les données, les résultats et les logiciels sont mis à la disposition de la communauté internationale de manière libre et ouverte.
Q : et en pratique, comment cela se passe?
Depuis le lancement du réseau, et même un peu avant, le SeBiMER s’est employé à concevoir et développer deux logiciels d’analyse de la diversité, SAMBA et MAEVA. Dans notre jargon, il s’agit de pipelines, c’est-à-dire d’enchaînements de différentes méthodes d’analyses (jusqu’à 15 étapes pour SAMBA). Celles-ci ont été sélectionnées après un important travail bibliographique, et de nombreux échanges avec les équipes de recherche du projet, visant à choisir celles qui sont le plus appropriées pour étudier les communautés d’organismes ciblées par le projet ROME.
Parallèlement à ce travail de développement logiciel, le SeBiMER et le SISMER ont mis en place un ensemble de règles destinées à organiser rigoureusement le stockage et le catalogage des données du projet ROME. En effet, au fil du temps, les partenaires de ROME collectent des échantillons pour en isoler l’ADN. Celui-ci est alors envoyé à un prestataire (Genotoul/Get-Plage de l’INRAe à Toulouse) qui va réaliser le séquençage de l’ADN. C’est alors le SeBiMER qui se charge de rapatrier les fichiers numériques vers DATARMOR (situé à Plouzané) en vue de leur stockage et de leur archivage, dans un premier temps, et de leur analyse avec SAMBA et MAEVA, dans un second temps. Les résultats des analyses sont enfin mis à disposition des partenaires du réseau via un portail web sécurisé.
Q : qu’espérez-vous découvrir grâce à ce réseau ROME?
Le rôle du SeBiMER dans le projet ROME est un support scientifique (p.ex. biostatistique) et technique (p.ex. utilisation de DATARMOR) aux activités de recherche et découverte de nos collègues chercheurs… Nos attentes sont plutôt en lien avec l’amélioration des méthodologies d’analyse de la biodiversité réalisée à partie de l’ADN environnemental.
(1) Acronyme de Findable, Accessible, Interoperable, Reproducible… soit, en français : « réaliser de la science ouverte ».