Dat@UBFC

Le projet dat@UBFC propose la mise en place d’un service de gestion et de valorisation des données de la recherche en Bourgogne-Franche-Comté. Dans le contexte international d’ouverture des données de la recherche, ce service permettra d’accompagner les chercheurs pour la gestion de leurs données, de faciliter le partage des données via un portail de référencement interopérable avec les principaux services de données, d’augmenter la visibilité et l’efficacité de la recherche locale et de conserver le patrimoine numérique scientifique régional.

Le contexte

Les nouvelles technologies et les nouveaux moyens informatiques permettent une production de données qui peuvent être aussi bien des données d’observation que des résultats de simulations numériques. Ces données sont produites en quantité toujours plus importante. On parle ainsi du big data qui inclut les méthodes de collecte et de traitement de grands volumes de données. Cependant, pour que ces données puissent offrir tout leur potentiel, il est essentiel qu’elles soient protégées, garanties et partagées. Ainsi, ces dernières années ont vu l’émergence du mouvement de « l’open data » qui, en favorisant l’ouverture des données, vise la réutilisation optimale de celles-ci. Les données publiques (données collectées et financées par les organismes publics) sont de ce fait vues comme un bien commun, le patrimoine numérique dont la diffusion est d’intérêt public et général, et en particulier parmi elles les données issues de la recherche scientifique. Ainsi, le mouvement de « l’open science » a vu le jour, avec différents projets et portails internationaux. Cependant, au niveau des universités françaises, peu d’initiatives ont abouti à la mise en place de portails d’exposition des données.

Pour une structure telle que la COMUE UBFC, proposer un service commun d’accompagnement à la communauté scientifique afin de soutenir une bonne gestion et valorisation des données de la recherche est aujourd’hui un enjeu majeur et fait partie des services à rationaliser et mutualiser au niveau régional.

Le projet dat@UBFC propose ainsi la mise en place d’un tel service innovant à un niveau régional, en s’appuyant naturellement sur deux projets préexistants : dat@OSU de l’OSU THETA (cf. encadré ci-dessous) pour la création d’un portail de valorisation des données de la recherche et le projet de datacenter régional d’UBFC pour le traitement et le stockage des données.

FAIR – Findability, Accessibility, Interoperability and Reusability

Depuis 2016, les principes FAIR, agréés par la communauté internationale de la recherche scientifique, favorisent, par leur mise en œuvre, la découverte, l’accès, l’interopérabilité et la réutilisation des données de recherche à la fois aux humains et aux machines. L’obtention de données FAIR est facilitée par l’utilisation de plans de gestion de données (Data Management Plan – DMP). Ce sont des documents rédigés au commencement d’un projet de recherche qui définissent ce que les chercheurs feront de leurs données pendant et après le projet, en explicitant notamment la mise à disposition des données. Ils sont obligatoires depuis 2017 dans les demandes de financements européens H2020 et depuis 2019 dans celles de l’Agence Nationale de la Recherche (ANR).

Un service de soutien à la recherche

Ce service de soutien à la recherche aura pour objectif de guider les chercheurs dès la création de leurs données afin de :

  • gérer leurs données tout au long de leur cycle de vie ;
  • faciliter le partage des données ;
  • faciliter la reproduction et la vérification des données (intégrité scientifique) ;
  • valoriser les recherches (la citation des données et des publications augmente la visibilité des résultats) ;
  • sauvegarder et pérenniser les données.

Il permettra notamment :

  • de répondre aux exigences institutionnelles et à celles des financeurs ;
  • d’offrir une recherche de meilleure qualité et de nouvelles perspectives scientifiques ;
  • d’augmenter la visibilité et l’efficacité de la recherche locale (économie de moyens, accélération des progrès de la recherche) ;
  • de conserver le patrimoine numérique scientifique régional.

Lancement de dat@UBFC

Pendant le colloque DataBFC2 qui se tiendra du 20 au 22 novembre 2019, à Dijon (Campus Montmuzard)

Le colloque DataBFC2 « Science ouverte : initiatives et projets en Bourgogne Franche-Comté dans le nouveau contexte européen et international des données de la recherche » propose de dresser un panorama des initiatives régionales entreprises en matière de gestion, d’ouverture et de valorisation des données de la recherche. Cet événement sera l’occasion de lancer officiellement le projet dat@UBFC. Il est ouvert à l’ensemble de la communauté de l’enseignement supérieur et de la recherche et plus spécifiquement à la communauté scientifique régionale.Inscriptions jusqu’au 4 novembre 2019. https://databfc2.sciencesconf.org/

Les services proposés doivent traiter de l’ensemble des phases du cycle de vie des données :

  • planification : dès le lancement d’un projet de recherche, l’équipe de dat@UBFC peut accompagner les chercheurs dans la rédaction d’un plan de gestion de données (DMP).
  • collecte et analyse : ces deux étapes peuvent être réalisées grâce aux outils informatiques mutualisés et mis à disposition par le pôle scientifique du datacenter (serveurs de calcul, outils spécifiques de traitement, simulateurs, …).
  • documentation : le service accompagnera les chercheurs dans la description de leurs données. Cette description des données sera réalisée via le portail dat@UBFC.
  • stockage : l’infrastructure du datacenter régional pourra réaliser la sauvegarde des données décrites dans le portail.
  • conservation : l’archivage pérenne de certaines données pourra être réalisé ou organisé par le datacenter.
  • exposition : le portail dat@UBFC permettra la recherche et la consultation des données de recherche de l’ensemble de la COMUE et la réexposition de ces données sur d’autres portails avec lesquels il sera interopérable (DataCite, Isidore, etc.).
  • réutilisation : les bonnes pratiques en termes de gestion des données de la recherche dès le début d’un projet ou dès la création des données faciliteront leur réutilisation.

L’infrastructure de données repose sur :

  • un portail qui doit permettre aux chercheurs non seulement de décrire leurs données, de les mettre à disposition en libre accès mais aussi de les sauvegarder ;
  • un environnement numérique proposant des outils ou services nécessaires à une bonne gestion des données, tels que :
    • des outils de simulation, et/ou de calcul pour générer ou traiter les données des chercheurs ;
    • la mise à disposition de services tels que l’attribution de DOI, la réalisation de plans de gestion des données (DMP de OPIDoR) et l’aide au choix de formats pérennes (FACILE du CINES) ;
    • la sauvegarde et la pérennisation des données grâce à la mise en place de services de stockage mutualisés mis à disposition des chercheurs.
  • des guides et des tutoriels, mis à disposition des utilisateurs, pour décrire les bonnes pratiques de gestion des données et guider les chercheurs sur des éléments spécifiques.

Une équipe d’ingénieurs documentaliste (spécialisé dans le traitement des données scientifiques) et informaticien assurera l’accompagnement et le conseil aux chercheurs via des rencontres individuelles ou collectives, la mise en place de formations (en particulier au niveau de l’école doctorale pour sensibiliser les futurs chercheurs et les inciter à décrire leurs données), proposera des outils documentaires et des conseils juridiques et aidera les chercheurs à gérer leurs données tout au long de leur cycle de vie.

Une base préexistante

Le portail dat@OSU, opérationnel depuis avril 2016, sera réutilisé pour concevoir le portail dat@UBFC. Sa structure informatique (code et modèle de données) sera utilisée pour définir une « base » de portail réutilisable à l’échelle de l’UBFC et des différentes composantes qui souhaiteraient avoir leur propre portail. L’ensemble constituera une fédération de portails interconnectés et hiérarchisés.

Une telle solution présente l’avantage d’être évolutive et de permettre assez simplement un passage à l’échelle. La « base » de portail issue de dat@OSU évoluera pour correspondre aux besoins identifiés à l’échelle de l’UBFC. Elle sera interopérable avec d’autres portails nationaux et internationaux à l’instar du portail de dat@OSU.

La proposition d’outils s’appuiera quant à elle sur le datacenter régional. Celui-ci permettra la mutualisation et la mise à disposition d’outils pour la génération, le traitement, le stockage et l’archivage des données. L’hébergement de la solution développée et déployée sera assuré par le datacenter régional.

Le portail sera potentiellement alimenté par tous les chercheurs d’UBFC qui pourront décrire des données de nature très différentes. Pour assurer la qualité, l’homogénéité et la complétude des descriptions de données réalisées par les chercheurs il est essentiel que toutes ces informations soient validées par le documentaliste avant leur exposition sur le portail.

Dat@OSU

Le projet dat@OSU, porté par l’OSU THETA, décrit les données de recherche de ses laboratoires et équipes fédérés en se basant sur les standards utilisés par la communauté scientifique. Il a été ouvert en avril 2016. De nombreuses fiches de description de jeux et de bases de données ayant trait aussi bien à la recherche médicale, la spectroscopie moléculaire, l’écologie, la biodiversité, l’astronomie, la chimie, l’archéologie, la climatologie… sont disponibles. Ce portail doté d’un moteur de recherche très élaboré permet la recherche et la consultation des fiches de description des données, via une interface web ouverte à tout public (chercheurs, étudiants, décisionnaires, financeurs, grand public, etc.), avec un affichage des résultats de manière géolocalisée sur une carte du monde. L’interopérabilité a été mise en place avec un certain nombre de plateformes.

Pour en savoir plus :
https://dataosu.obs-besancon.fr

L’équipe du projet :
Sylvie DAMY, porteur du projet.
Bernard DEBRAY, Raphaël MELIOR et Hélène TISSERAND

Contact :
dataubfc@obs-besancon.fr