Le consortium CORLI (CORpus, Langues, Interactions) de la TGIR Huma-Num (corli.huma-num.fr), dans lequel Christophe Benzitoun (responsable de l’équipe ATILF discours) participe au comité scientifique et de pilotage, lance un appel à propositions en vue de financements sous forme de prestation de service sur des ressources linguistiques (corpus oraux, textuels, multimodaux, lexiques) destinées à être rendues disponibles en suivant les principes FAIR. La réponse à l’appel ne peut se faire que si les corpus sont destinés à être utilisés librement.
Les principes FAIR sont aujourd’hui largement défendus et considérés comme incontournables dans les projets soutenus par Huma-Num. Une description des principes FAIR peut être trouvée sur le site international https://www.go-fair.org/fair-principles/ ou sur le site de CORLI (https://corli.huma-num.fr/node/102#fair) dans une version dédiée aux linguistes.
Pour respecter les principes FAIR, il faut que le dépôt des corpus soit réalisé dans un entrepôt public accessible – par exemple ORTOLANG (www.ortolang.fr) ou COCOON (cocoon.huma-num.fr) – et que le format des données soit dans un format FAIR (formats XML TEI, formats des logiciels pour corpus oraux : Transcriber, Praat, ELAN, CLAN).
L’objectif de cet appel est d’encourager ou d’aider à finaliser des publications de corpus accessibles gratuitement sous licence ouverte et aisément réutilisables pour la recherche ou d’autres utilisations. Les corpus concernés par la réponse à cet appel peuvent être déjà accessibles, et dans ce cas la réponse à l’appel doit justifier les transformations à réaliser pour rendre les corpus FAIR. Les sommes proposées dans l’appel ne permettent pas la création de nouveaux corpus, mais uniquement la modification, conversion de corpus existants. Les corpus ainsi traités seront versés dans ORTOLANG ou COCOON.
Calendrier
Soumissions de propositions : 15 juin 2020
Sélection des soumissions : 30 juin 2020
Le calendrier est volontairement serré pour permettre une mise en place des versements dès le mois de juillet.
Demande
Les contraintes imposées par le CNRS, gestionnaire des crédits, ne permettent pas malheureusement de rémunérer du personnel, ni CDD, ni stages. Les sommes versées, disponibles en Subvention d’Etat (SE) CNRS, ne pourront donc être utilisées que pour financer des prestations de services (y compris autoentrepreneurs). Les sommes doivent être dépensées en 2020. Le montant total de l’aide proposée par CORLI en 2020 est de 25 000 €. Les financements de chaque demande sont limités à 6 000€.
Toute demande doit être envoyée à Christophe Parisse (Modyco) | cparisse@parisnanterre.fr et à Céline Poudat (BCL) | celine.poudat@univ-cotedazur.fr. La demande doit préciser de manière explicite les formats qui seront utilisés et la quantité de données qui seront rendues disponibles et le type de dépôt qui sera réalisé. La sélection favorisera les corpus utilisant les formats les plus courants et d’une taille importante. Les corpus de données écrites et orales seront évalués séparément pour ne pas favoriser un type particulier de corpus.