Se rendre dans une bibliothèque universitaire et obtenir en quelques dizaines de minutes l’accès à un portail numérique sur mesure présentant un ensemble d’articles en texte intégral (pouvant aller jusqu’à des dizaine de milliers) sur le sujet souhaité, voici un service que pourraient rendre les bibliothèques universitaires que préfigurent les travaux menés dans le cadre du projet LorExplor* par des étudiants du master 2 Documentation numérique, formation de l’Université de Lorraine adossée au Centre de recherche sur les médiations (Crem).
En effet, ces étudiants participent à un ensemble de travaux dirigés sur la manipulation de corpus issus d’ISTEX** (initiative d’excellence en information scientifique et technique) et d’autres bases de données scientifiques telles Pascal, Hal, PubMed et PubMed Central.
« Grâce à l’implication active des intervenants qui encadrent les étudiants, c’est une première en France, et une action de référence au niveau international » souligne Brigitte Simonnot, professeure de l’Université de Lorraine responsable de la formation et directrice-adjointe du Crem.
Plusieurs années d’expérimentations
Cela fait déjà plusieurs années que des expérimentations autour d'ISTEX sont offertes aux étudiants de l’Université de Lorraine (et de Paris 8 Vincennes-Saint-Denis, en alternance). Dans les premières sessions de travaux dirigés, les sujets étaient choisis par les enseignants autour d’un nombre de documents limité, en provenance d'une seule source de donnée. L’interface était limitée à des liens vers les serveurs.
Une première pour les étudiants
Pour cette session, les étudiants abordent des sujets de taille réelle, provenant de sources multiples. Ils peuvent procéder à des actions variées de curation de données. Ils se sont répartis en binômes, chacun ayant choisi un sujet spécifique qui a donné lieu à une extraction de corpus sur ISTEX et sur d'autres bases de données scientifiques. Les corpus sont exploités dans des serveurs d'exploration avec une interface de navigation utilisant le wiki sémantique du réseau WICRI. L’opération bénéficie d’un partenariat avec des ingénieurs de l'institut de l’information scientifique et technique (Inist) du CNRS qui assurent égaelement un support théorique.
Plus précisément, chaque sujet dispose d'une page d'accueil présentant un ensemble de résultats parmi lesquels des liens pour accéder aux articles et des données statistiques textuelles et graphiques telles des cartes de projection géographique sur l'activité scientifique dans le domaine :
- Un poisson, le scalaire : 1 300 documents (dont 900 issus d'ISTEX)
- Un arbre, l'oranger : près de 9 000 documents (dont près de 3 000 issus d'ISTEX et 4 000 de PubMed et PubMed Central)
- Un matériau, le Cobalt au Maghreb : 4 000 documents (dont 3 000 ISTEX)
- Une ville, Le Havre : 5 300 documents (dont 3 000 issus d'ISTEX)
- Le libre accès en Belgique : 3 700 documents (dont 3 000 issus d'ISTEX)
Il est aussi prévu de reprendre prochainement ce type de session à l'Université Paris 8 Vincennes-Saint-Denis.
* Porté par Jacques Ducloy, le projet LorExplor étudie les enjeux et besoins de l'Université de Lorraine dans le domaine de l'exploration des connaissances.
** Le projet ISTEX est un vaste programme d’acquisition de ressources scientifiques visant à créer une bibliothèque numérique suivant les meilleurs standards internationaux, accessible à distance par tous les membres des établissements de l’enseignement supérieur et de la recherche (près de 17 millions d'articles déjà disponibles).