ORD : Open Research Data

De EduTech Wiki
Aller à la navigation Aller à la recherche

ORD : Open Research Data

Introduction

Quoi ?

L'Open Research Data est un mouvement qui vise à rendre les publications scientifiques et leurs données accessibles à tous. Il s’agit d’une obligation pour les chercheurs bénéficiant des financements du programme Horizon 2020 de rendre accessibles et réutilisables en ligne leur recherche, ainsi que les données qui en résultent. Dorénavant l’accès aux travaux de recherche en ligne doit être gratuit, non seulement pour la communauté scientifique mais également pour le grand public, quel que soit leur niveau d’études.

Les résultats à rendre disponibles sont : l’ensemble des données, les métadonnées nécessaires à la validation des travaux de recherches, et en plus les données brutes que le chercheur souhaite rendre accessibles. Par exemple, les données statistiques, résultats de sondage, etc.

Qui ?

Depuis janvier 2017, les chercheurs ou chercheuses qui soumettent un projet dans le cadre du programme Horizon 2020 font partie par défaut d'un projet pilote Open Data, à l’exception des appels à projets portant sur :

  • Les instruments "co-fund" et "prix" ;
  • Les subventions "ERC ( European Research Counsil) Preuve de concept" ;
  • Les "ERA ( Research Area)-Nets" qui ne produisent pas de données ;
  • L’instrument PME, phase 1.

Où ?

Ils sont déposés dans une base de données de recherche « research data repository » qui permet au public d’avoir accès aux données, de pouvoir les extraire et les exploiter, les reproduire et les distribuer. Les chercheurs doivent également mettre à la connaissance des utilisateurs les outils ou logiciels utilisés pour valider leurs résultats.

Quand ?

Le chercheur doit rendre accessibles les données nécessaires à la validation d’une publication dès que possible sur la base de données de recherche qu’il aura choisi.

Pourquoi ?

L’objectif visée par l’Open Research Data est ainsi de favoriser le partage, la transparence, la reproductibilité des travaux scientifiques.

Effectivement, plusieurs articles ont révélé qu'il était indispensable que la totalité des données associées à des articles soient automatiquement rendues publiques. Notamment l'article d’un chercheur en cristallographie publiant des structures moléculaires factices, et que les économistes Rogoff et Reinhart ont révélé en 2009 en qualifiant cette publication d'"immense supercherie". Suite à cela en 2012 , un éditorial dans Naturefit échos en faisant état d'un nombre « choquant » d’articles, en particulier dans le domaine de la recherche médicale, dont les conclusions ne pouvaient être vérifiées et reproductibles en raison du manque de données suffisantes.

" Accompagner les publications scientifiques des jeux de données et codes sources qui permettront [à d’autres] de reproduire les résultatsfait donc partie des solutions avancées par les tenants d’une Science Ouverte (Open Science), irriguée par la libre circulation des informations et des connaissances"

L’idée principale est de permettre un accès à une grande quantité de ressources scientifiques partagées, favorisant ainsi une large diffusion des connaissances scientifiques. Les ressources ou les données primaires une fois ouvertes pouvant être critiquées par toute personne ayant l’expertise et/ou la compétence nécessaire, ce qui contribue à l’effort de collaboration pour aboutir à un produit final validé par la communauté scientifique.

Horizon 2020 sur la nouvelle loi

Qu’est-ce que l’Horizon 2020 ?

L’horizon 2020 est un « programme-cadre de recherche », avec comme objectif de promouvoir « les idées de recherches innovantes et leur mise en place sous la forme de produits et services commercialisables et d'avoir ainsi un impact positif sur la compétitivité »[1]. Le but de l’Horizon 2020 est ainsi de présenter une certaine évolution par rapport aux précédents programmes. Ainsi, il s’agit d’un programme pour la recherche et le développement, dans lequel s’intègre aussi l’ Open Research Data.

Comment s’intègre l’Open Research Data dans l’Horizon 2020 ?

Le programme Horizon 2020 comporte tout d’abord une obligation « d’assurer le libre accès aux publications issues des recherches qu’il aura contribuées à financer, sous peine de sanctions financières »[2]. L’Open Research Data est ainsi intégré sous forme de loi dans ce programme, afin de garantir une meilleure accessibilité et un meilleur partage des informations d’ordres scientifique découlant de ces recherches. De ce fait, la plupart des projets développés dans le cadre de l’Horizon 2020 doivent fournir de façon gratuite ces informations, autant à la communauté scientifique qu’au grand public. Ces dernières peuvent être «des articles de recherche scientifiques (publiés dans des revues savantes) évalués par les pairs ou des données de recherche »[3] .Ces recherches sont numérisées et déposées en ligne, afin d’être réutilisables. Certains projets non concernés et effectués sur justification font parties de cette exception et sont qualifiés par la notion d’opt out.

Quels sont les buts de ce partage?

Il s’agit tout d’abord d’une volonté d’améliorer le dialogue scientifique afin de rendre plus efficiente l’évolution de la recherche en se basant sur les axes suivants :

  • « S'appuyer sur les résultats de précédentes recherches (amélioration de la qualité des résultats) »
  • « Promouvoir les collaborations et éviter la duplication des efforts (plus grande efficacité) »
  • « Accélérer l’innovation (mise sur le marché plus rapide = croissance plus rapide) »
  • « Impliquer les citoyens et la société (amélioration de la transparence du processus scientifique »[4]

Quelles sont les bases juridiques ? 

L’Horizon 2020 possède ses propres bases juridiques concernant la diffusion autant des résultats des recherches que des données qui y sont rattachées : 

  • « En ce qui concerne la diffusion des résultats par voie de publications scientifiques, l'accès ouvert s'applique selon les modalités et conditions établies dans la convention de subvention. »
  • « En ce qui concerne la diffusion des données de la recherche, la convention de subvention peut, dans le cadre d'un accès ouvert et dans un souci de préservation de ces données, fixer les modalités et conditions de l'ouverture de l'accès à ces résultats »[5]

Ainsi, chaque projet recevant une subvention contient des conditions légales liées à la diffusion. Afin de protéger certaines données sensibles, il peut être établi que ces dernières ne soient pas diffusées dans le cadre du libre accès. 

Comment mettre en pratique cette nouvelle loi?

Les publications

Que signifie “Libre accès aux publications”?

Il faut savoir que toutes les publications scientifiques sont concernées, quel que soit le projet. Le libre accès aux publications signifie qu’il donne droit de les :

  • lire ;
  • télécharger et imprimer ;
  • copier ;
  • distribuer ;
  • rechercher ;
  • établir un lien vers le texte intégral ;
  • explorer par machine et réaliser des traitements de fouille textuelle.

Que doit faire un chercheur lorsque son article est prêt?

Le chercheur est libre de décider s’il souhaite publier ou non. Plus exactement l’exigence de rendre librement accessible n’implique pas l’obligation de publier. Si le chercheur décide de publier, alors il doit obligatoirement déposer dans un réservoir ses articles scientifiques afin de les mettre en libre accès.

Ainsi, il doit déposer une copie électronique de la version publiée ou de son manuscrit final validé par les pairs et accepté pour publication. Attention, ce dépôt doit être réalisé dans une archive ouverte le plus tôt possible et au plus tard lors de la publication.

Ensuite, le libre accès de ces publications doit être rendu possible au plus tard les six mois suivants leur parution (exception faite pour les sciences humaines et sociales pour lesquelles le délai est de 12 mois).

Parallèlement, le chercheur peut choisir un éditeur chez qui il souhaite publier son travail. Cet éditeur peut ou non proposer le libre accès. Dans la positive, l’éditeur est en droit de demander des frais de publication (APC : Article Processing Charges). Frais qui sont éligibles au remboursement.

Démarches de libre accès des publications


Choix d’une archive ouverte

Les chercheurs ont libre choix des archives ouvertes, dans lesquelles ils vont déposer leur article.

Cependant, il en existe de nombreuses et le choix peut parfois être difficile. Il est alors possible de demander des renseignements sur divers sites :

  • OpenAIRE (Open Access Infrastructure for Research in Europe)
  • OpenDOAR (Directories of Open Access Repositories)
  • ROAR (Registry of Open Access Repositories)

Les éditeurs

Les chercheurs sont libres de choisir la revue dans laquelle leur article sera publié. Cependant, quelle que soit la revue choisie, le chercheur doit déposer son article dans une archive ouverte. Tel que mentionné précédemment, tous les éditeurs ne permettent pas le libre accès, de plus si certains l’autorisent ceci se fait sous certaines conditions. De ce fait, il est fortement conseillé aux chercheurs de conserver leur droit d’auteur et d’accorder aux éditeurs des licences, et surtout de se procurer un identifiant auteur (ORCID : Open Researcher and Contributor ID).


Libre accès aux données

Que signifie “Libre accès aux données”?

Les articles doivent être en libre accès mais les données également. Ceci indique que les données :

  • Sont diffusées et accessibles gratuitement par l’utilisateur final
  • Peuvent être soumises à des processus de fouille, exploitées et reproduites

Actuellement tous les projets ne sont pas encore totalement concernés. Les projets concernés sont les suivants :

  • Technologies futures et émergentes
  • Infrastructure de recherche
  • Primauté dans les domaine des technologies génériques et industrielles- Technologie de l’information et de la communication
  • Nanotechnologies, matériaux avancés, procédés de production et de fabrication avancés, et biotechnologies thèmes “nanosécurité” et “modélisation”
  • Défi de société :
    • sécurité alimentaire, agriculture et foresterie durables, recherches marines, maritimes et sur les eaux continentales, et bioéconomie
    • Lutte contre le changement climatique, environnement, utilisation efficace des ressources et matières premières - à l’exception des travaux menés dans le domaine des matières premières
    • Des sociétés inclusives , novatrices et capables de réflexion
    • La Science avec et pour la société
    • Activités transversales - domaines prioritaires- volet “Villes intelligentes et durables”
Démarches libre accès aux données

Que doit faire un chercheur de ses données?

Le choix de partager les données dépend des bénéficiaires du financement. Si le choix des chercheurs est de partager les données , celles ci doivent être entreposées dans un dépôt et mises en libre accès.

Les données et les métadonnées nécessaires à la validation des résultats mentionnés dans l’article scientifique sont concernées, mais également les données spécifiés dans le plan de gestion de données (DMP : Data Management Plan).

Le dépôt doit être réalisé le plus tôt possible dans un entrepôt de données du choix du bénéficiaire du financement, afin que les données puissent être en libre accès.


Choix de l'entrepôt

Les chercheurs ont libre choix de l'entrepôt de dépôt des données. Il en existe plusieurs, le chercheur peut donc être conseillé par le site Registry of Research Data Repository.

Les entrepôts (Data Repository ou Digital Repository) sont des bases de données structurées qui permettent de déposer les données et métadonnées. En déposant les données dans un entrepôt, celles-ci sont rendues visibles, accessibles moissonnables et citables; ce qui permet leurs vérifications et réutilisations. Les entrepôts dit de confiance (Trusted Repository) sont conformes aux directives de l’OpenAIRE. Ils doivent répondre à certains critères de qualité concernant leur stockage et l'intégrité des données. Des coûts sont induits aux chercheurs par ces opérations, et sont éligibles au remboursement.

Il est conseillé aux chercheurs d’identifier les données de manière unique et par conséquent de se procurer un identifiant de données (DOI : Digital Object Identifier).

Il est important de savoir qu’il existe des procédures d’accès aux données:

  • Accès immédiat ou embargo (à définir)
  • Accès à tous ou restreint à des groupes spécifiques

FNS - Pour les chercheurs Suisses

La Suisse s’inscrit dans la même logique que le programme Horizon 2020 de l'Union Européenne : le Fond National Suisse (FNS) soutient l’idée de rendre accessible les publications scientifiques et les données de recherche pour tous.

À partir d’octobre 2017 le chercheur devra ainsi obligatoirement inclure un plan de gestion des données (Data Management Plan) pour chaque requête au près du FNS. Le FNS attend de la part des chercheurs que leurs données et/ou les résultats de leurs travaux de recherche soient accessibles dans des bases de données.

Déclaration de principe[6]

Le FNS considère que le partage des données de recherche apporte une contribution essentielle à la recherche scientifique en termes d’'impact, de transparence et de reproductibilité. En plus d'une préparation et d'un archivage soigneux, le FNS est d'avis que les données de recherche doivent être partagées de manière aussi ouverte que possible. Par conséquent, le FNS demande à tous les chercheuses et chercheurs qu'il finance :

  • d'archiver les données de recherche sur lesquelles ils ont travaillé et qu'ils ont produites durant leurs travaux ;
  • de partager ces données avec d'autres chercheuses et chercheurs, à moins qu'ils/elles soient lié-e-s par des clauses légales, éthiques, de copyright, de confidentialité ou autres ;
  • de déposer leurs données et métadonnées dans des archives publiques existantes, dans des formats accessibles et réutilisables sans restriction par tout un chacun.

Les données de recherche sont des éléments concrets collectés, étudiés ou générés dont la communauté scientifique admet communément la nécessité pour documenter et valider les résultats de recherche.

Le FNS a élaboré des directives sur le Data Management Plan (DMP) pour les chercheurs, et a mis à disposition sur son site les éléments que doit contenir le DMP .

Les règlements par rapport aux principes "Open Research Data" du FNS sont en outre régis par l'article 47 et l'article 2.13

Principes de données FAIR

L'application des principes FAIR aux données se traduit par le fait que l'ensemble des données puisse être trouvé ("Findable"), qu'il soit accessible ("Accessible"), interopérable ("Interoperable") et réutilisable ("Re-usable").

Par ailleurs, trouver une base de données qui répond à toutes les caractéristiques nécessaires pour accueillir les données FAIR est un challenge auquel est confronté la communauté scientifique. Pour rendre plus souple le passage vers des données FAIR, le FNS a jugé nécessaire d'établir un certain nombre de critères minimaux que les bases de données doivent remplir afin de respecter les principes FAIR. Vous pouvez consulter les exemples de bases de données disponible sur le site du FNS.

Libre Accès dans les pays en développement

Tandis que les chercheurs dans les pays développés profitent du libre accès à l'information scientifique et participent dans la communauté internationale de recherche, cela n’est pas encore le cas dans les pays en développement qui font toujours face à deux problèmes principaux :

  • Incapacité de s'abonner aux revues (coût élevé des abonnements)
  • Incapacité d'intégrer les connaissances scientifiques issues de leurs propres recherches dans le bassin grandissant du savoir mondial (lacunes dans les connaissances).

Il existe aujourd’hui un certain nombre de programmes offrant aux chercheurs des pays en développement un accès à la littérature scientifique gratuit ou à faible coût. Le plus connu est le programme Research4Life créé à la base de la collaboration entre les institutions des Nations Unies, les universités et les éditeurs. Il vise à réduire l’écart des connaissances entre les pays en développement et les pays industrialisés. Researche4Life est composé de quatre programmes - HINARI, AGORA, OARE, ARDI qui fournissent l’accès en ligne aux revues académiques et professionnelles.

  • HINARI - Accès aux principales revues, bases de données et autres ressources dans le domaine de santé et surtout en sciences biomédicales.
  • AGORA - Accès à une grande collection de revues spécialisés dans les domaines de l'alimentation, de l'agriculture et de l'environnement.
  • OARE - Accès à plus de 3900 revues scientifiques concernant les sujets environnementaux.
  • ARDI - Accès à la recherche pour le développement et l'innovation.

Conclusion

L’accessibilité à tous des publications scientifiques et des données attenantes offre aujourd’hui une nouvelle dimension à la Recherche. Désormais, la Recherche ne se résume plus exclusivement aux fruits d’observations expérimentales, d’hypothèses ou de théories, mais naît également de la manipulation et de l’agrégation des données.

Il devient à présent possible de réaliser de nouvelles recherches à partir de grands ensembles de données. Mais, force est de constater que ce changement ne peut se réaliser pleinement qu’à travers la mise en place de mécanismes de gestion, de conservation et de partage des données efficaces.

Les données produites par les chercheurs, dans de nombreuses disciplines, font désormais l’objet de toutes les attentions. États, agences de financement de la recherche, éditeurs, communautés scientifiques sont des acteurs indispensables garantissant l’accessibilité et la complète réutilisation des données à l’échelle internationale.

Glossaire

Ce glossaire est principalement issu du site http://www.inist.fr/?Glossaire et du FNS.

Entrepôt de données (Data Repository) : Réservoir en ligne dédié aux données de recherche. Il peut être disciplinaire ou thématique, être institutionnel ou centralisé.

Libre accès (open access) : Accès à des informations scientifiques en ligne, gratuites pour l’utilisateur final et réutilisables.

Frais de publication (APC : Article Processing Charges) : Somme demandée aux auteurs par les éditeurs pour que leurs articles soient en libre accès dès leur publication. Ces frais sont fréquemment payés par l’université ou l’institut de recherche auquel l’auteur est rattaché, ou par l’organisme de financement soutenant ses recherches.

Archive ouverte (open repository) : Réservoir en ligne de publications scientifiques, principalement des articles. Il permet un accès libre - immédiat ou différé (voir embargo) - et gratuit pour le déposant et le lecteur. Il peut être institutionnel, thématique ou centralisé.

Dépôt dans une archive ouverte (deposit in an open archive) : Dépôt d’un article (version publiée ou manuscrit final) dans une archive ouverte par l’auteur (auto-archivage, self-archiving) ou l’un de ses représentants. Ce dépôt est communément appelé "voie verte" (green road, green open access).

Licence (licence) : Contrat par lequel un titulaire d’un droit de propriété intellectuelle concède en tout ou en partie la jouissance de ce droit (droits de reproduction, de représentation, droit d’autoriser les œuvres dérivées…)

Licence Creative Commons (Creative Commons licence) : Contrats-type, proposés par l’organisation Creative Commons, dans lesquels les chercheurs déterminent les droits attachés à l’article ou aux données de recherche qu’ils ont produits dans le cadre de leurs recherches. Six contrats sont possibles en combinant quatre éléments de base qui sont : la paternité, la modification, l’utilisation commerciale et la réutilisation dans les mêmes conditions du contrat d’origine.

Identifiant ouvert pour chercheur et contributeur (ORCID : Open Researcher and Contributor) : soit « Identifiant ouvert pour chercheur et contributeur »): est un code alphanumérique non propriétaire, qui permet d'identifier de manière unique les chercheurs et auteurs de contributions académiques et scientifiques https://fr.wikipedia.org/wiki/ORCID

Plan de gestion des données (Data management plan : DMP) : Document à concevoir au début d’un projet de recherche expliquant la façon dont les données de recherche recueillies ou générées seront gérées durant le projet et après son terme.

Digital Curation Centre (DCC) : est un centre d’expertise sur la gestion et l’archivage de données. Il propose des études de cas, des services en ligne ou encore des programmes de formation http://www.dcc.ac.uk/.

Programme P-5 : il s'agit d'un programme de Swissuniversities. C'est la continuation du programme CUS P-2 qui "encourage le regroupement des efforts que les hautes écoles déploient actuellement de manière dispersée pour mettre à disposition et traiter des informations scientifiques." Programme P-5

Re3data : c'est le registre le plus large et le plus complet concernant les bases de données en ligne. Il couvre un large éventail de disciplines du monde entier. Re3data

Data Seal of ApproVal (DSA) : c'est une collaboration entre scientifiques et administrateurs de bases de données, qui vise à établir des standards en matière de stockage et d'archivage de données pour assurer une réutilisation efficace des données à long-terme. DSA

Références

http://www.inist.fr/?-Tutoriels-multimedias-H2020-

http://www.snf.ch/fr/leFNS/points-de-vue-politique-de-recherche/open_research_data/Pages/default.aspx

Ware, M., & Mabe, M. (2015). The STM report: An overview of scientific and scholarly journal publishing.