L’entrepôt de données de l’Université de Lorraine : le point en trois points

 
Publié le 24/03/2021 - Mis à jour le 5/01/2023

Le futur entrepôt de données de l'Université de Lorraine verra le jour à la fin de l'année 2021. 16 laboratoires de l'Université de Lorraine sont fortement impliqués dans sa mise en place. Rappel de la genèse et point d'étape de ce projet majeur.

Rappel du contexte

Dans le cadre de sa politique Science Ouverte, l’Université de Lorraine a fait le choix de travailler à la mise en place d'un entrepôt institutionnel pour les données de la recherche de ses laboratoires, avec deux objectifs principaux :

  • la mise en ligne contrôlée de jeux de données selon le principe "aussi ouvert que possible, aussi fermé que nécessaire" ; en permettant notamment de lier ces données à des publications et de les référencer dans des bilans ou des bibliographies, dans le cadre d'un espace dédié à chaque laboratoire et administré par lui ;
  • le référencement et l'identification des données produites et déposées dans d'autres entrepôts. 

En lien avec l'exigence nouvelle d'élaborer des plans de gestion de données pour les projets de recherche financés sur fonds publics, il offrira une réponse directe au cinquième item visé par le modèle de plan de gestion de l'ANR  en permettant le partage maîtrisé des données et leur conservation à long terme ; et ce en complément des autres entrepôts, comme les entrepôts disciplinaires et des autres acteurs de la recherche.

Il est pensé, dans le système d'information de l'Université, comme étant articulé aux outils existants, que sont HAL, le mésocentre de calcul Explor et le service de stockage à grande échelle PETA. L’entrepôt sera donc l’une des briques constitutives des circuits de production et de publication scientifiques sur le site lorrain.

Son déploiement à l’échelle du site lorrain est prévu pour la fin de l’année 2021.

Le choix de la solution Dataverse

Après une première phase de qualification des fonctionnalités et de rédaction d’un cahier des charges, un banc d’essai des solutions logicielles existantes a résulté dans le choix de Dataverse, un outil actuellement choisi par plus de 60 institutions ou pays dans le monde et installé dans quatre institutions majeures de recherche françaises (dont l'Inrae). Ce logiciel libre est soutenu par une communauté extrêmement active et également présente dans un grand nombre de projets et groupes d'intérêt internationaux tels que l’European Open Science Cloud et la Research Data Alliance.

Dès son déploiement à la fin de l’année, l'entrepôt sera capable d’offrir aux chercheurs lorrains les services suivants :

  • Un espace dédié à chaque unité de recherche, avec la possibilité pour elle de prendre en charge une grande part des responsabilités éditoriales, qu’elle pourront confier à des référents choisis en leur sein.
  • La possibilité pour chaque chercheur de mettre en ligne et publier, ou non, ses données en leur attribuant un identifiant numérique pérenne qui en garantit la citabilité et permet d'établir le lien avec les publications qui les utilisent.
  • Le cas échéant, le référencement dans l’espace du laboratoire des jeux de données déjà publiés dans d'autres entrepôts tels que Zenodo et Ortolang, et en lien avec eux.

Un projet au carrefour de collaborations étroites

Le comité opérationnel pour les données de la recherche est aujourd’hui pleinement impliqué avec les laboratoires volontaires dans des discussions et collaborations autour de la solution Dataverse afin de déployer la solution avec la configuration et le volume adapté aux besoins des chercheurs. Seize laboratoires, à raison de un à six chercheurs pour chacun, sont impliqués dans des tests de dépôt et d’interface permettant une validation de la solution et des choix de configuration.

Le comité est présent dans les groupes de travail autour des métadonnées montés par l'équipe de développement en place à Harvard, réfléchissant à certaines des évolutions prochaines du logiciel, suivant au plus près les besoins de chaque discipline.

Parallèlement, un calendrier commun de déploiement a motivé la création d'un groupe d'échange et de partage d'expertise avec l'Université de Strasbourg, ouvrant la voie à des collaborations futures plus étroites.

Pour en savoir plus sur le projet, ou pour toute question relative à la gestion des données de la recherche, n’hésitez pas à contacter l’équipe en charge du projet :

.