Open Research Data - Version Finale

De EduTech Wiki
Aller à la navigation Aller à la recherche
La version imprimable n’est plus prise en charge et peut comporter des erreurs de génération. Veuillez mettre à jour les signets de votre navigateur et utiliser à la place la fonction d’impression par défaut de celui-ci.

ORD : Open Research Data

  • Page réalisée par Azmira, Bademba, Liudmyla et Véronique

Introduction - L'Open Research Data en Europe

Quoi ?

L'Open Research Data est un mouvement qui vise à rendre les publications scientifiques et leurs données accessibles à tous. Il s’agit d’une obligation pour tous les chercheurs bénéficiant de financements.

Plus particulièrement, en Europe, les chercheurs sont rattachés à un programme : Horizon 2020, qui regroupe dans un seul programme, les programmes de recherche et d'innovation européens. Horizon 2020 soutient les projets tout au long de la chaîne de l'innovation, ceci en simplifiant l'accès aux financements européens notamment en accélérant l'attribution des financements. En outre, ce programme permet aux chercheurs de rendre accessible et réutilisable en ligne leur recherche, ainsi que les données qui en résultent.

Qui ?

En Europe, depuis janvier 2017, les chercheurs ou chercheuses qui soumettent un projet dans le cadre du programme Horizon 2020, font partie par défaut d'un projet pilote Open Data. Certains projets sont eux spécifiques, il s'agit des projets portant sur :

Où ?

Les données de recherche de toutes les disciplines sont déposées dans une base de données de recherche «Research Data Data Repository » qui permet au public d’avoir accès aux données, de pouvoir les extraire et les exploiter, les reproduire et les distribuer. Les chercheurs se doivent également de faire connaitre près des utilisateurs les outils ou logiciels utilisés pour valider leurs résultats.

Quand ?

Les chercheurs doivent rendre accessibles les données nécessaires à la validation de leur publication dès que possible sur la base de données de recherche qu’ils peuvent choisir.

Pourquoi ?

L’idée principale de l'Open Research Data, à l'échelle Européenne comme mondiale, est de permettre un accès à une grande quantité de ressources scientifiques partagées, favorisant ainsi une large diffusion des connaissances scientifiques. Le partage, la transparence et la reproductibilité des travaux scientifiques sont ainsi favorisés dans la mesure ou les ressources ou les données primaires une fois ouvertes peuvent être critiquées par toute personne ayant l’expertise et/ou la compétence nécessaire. Cet accès aux travaux de recherche en ligne est gratuit, non seulement pour la communauté scientifique mais également pour le grand public, quel que soit le niveau d’études.

Outre le partage des connaissances, cette accessibilité à l'ensemble des données permet aussi d'éviter la publication de travaux (non documentés) factices. Il existe effectivement plusieurs cas ou à défaut de transparence, des chercheurs ont pu publier de faux travaux. On peut notamment évoquer le cas d’un chercheur en cristallographie, qui ayant publié des structures moléculaires factices, avait vu sa publication qualifiée d'"immense supercherie" par les économistes Rogoff et Reinhart. Suite à quoi en 2012, un éditorial dans Naturefit échos en faisant état d'un nombre « choquant » d’articles, en particulier dans le domaine de la recherche médicale, dont les conclusions ne pouvaient être vérifiées et reproductibles en raison du manque de données suffisantes.

L'ORD à l'échelle Européenne : Horizon 2020 sur la nouvelle loi

Qu’est-ce que l’Horizon 2020 ?

Horizon 2020 est un « programme-cadre de recherche » Européen auquel la Suisse participe. Il a comme objectif de promouvoir « les idées de recherches innovantes et leur mise en place sous la forme de produits et services commercialisables et d'avoir ainsi un impact positif sur la compétitivité »[1]. Le but de l’Horizon 2020 est ainsi de présenter une certaine évolution par rapport aux précédents programmes. Ainsi, il s’agit d’un programme pour la recherche et le développement, dans lequel s’intègre aussi l’ Open Research Data.

Comment s’intègre l’Open Research Data dans l’Horizon 2020 ?

Le programme Horizon 2020 comporte l' obligation « d’assurer le libre accès aux publications issues des recherches qu’il aura contribuées à financer, sous peine de sanctions financières »[2]. L’Open Research Data est ainsi intégré sous forme de loi dans ce programme, garantissant une meilleure accessibilité et un meilleur partage des informations d’ordre scientifique.

De ce fait, la plupart des projets développés dans le cadre de l’Horizon 2020 doivent fournir de façon gratuite ces informations, autant à la communauté scientifique qu’au grand public. Ces dernières peuvent être «des articles de recherche scientifiques (publiés dans des revues savantes) évalués par les pairs ou des données de recherche »[3] .Ces recherches sont numérisées et déposées en ligne, afin d’être réutilisables. Certains projets non concernés et effectués sur justification font parties de cette exception et sont qualifiés par la notion d’opt out.

Quels sont les buts de ce partage?

Le programme Européen Horizon 2020 définit clairement comment atteindre les objectifs de l'Open Research Data, qui sont essentiellement basés sur la volonté d’améliorer le dialogue scientifique afin de rendre plus efficiente l’évolution de la recherche en se basant sur les axes suivants :

  • « S'appuyer sur les résultats de précédentes recherches (amélioration de la qualité des résultats) »
  • « Promouvoir les collaborations et éviter la duplication des efforts (plus grande efficacité) »
  • « Accélérer l’innovation (mise sur le marché plus rapide = croissance plus rapide) »
  • « Impliquer les citoyens et la société (amélioration de la transparence du processus scientifique »[4]

Quelles sont les bases juridiques ? 

L’Horizon 2020 possède ses propres bases juridiques concernant la diffusion autant des résultats des recherches que des données qui y sont rattachées : 

  • « En ce qui concerne la diffusion des résultats par voie de publications scientifiques, l'accès ouvert s'applique selon les modalités et conditions établies dans la convention de subvention. »
  • « En ce qui concerne la diffusion des données de la recherche, la convention de subvention peut, dans le cadre d'un accès ouvert et dans un souci de préservation de ces données, fixer les modalités et conditions de l'ouverture de l'accès à ces résultats »[5]

Ainsi, chaque projet recevant une subvention contient des conditions légales liées à la diffusion. Afin de protéger certaines données sensibles, il peut être établi que ces dernières ne soient pas diffusées dans le cadre du libre accès. 

Comment mettre en pratique cette nouvelle loi?

A l'échelle Européenne, le programme Horizon 2020 définit clairement les étapes pour mettre rendre accessible tant les publications que les données scientifiques.

Les publications

Que signifie “Libre accès aux publications”?

Il faut savoir que toutes les publications scientifiques sont concernées, quel que soit le projet. Le libre accès aux publications signifie qu’il donne droit de les :

  • lire ;
  • télécharger et imprimer ;
  • copier ;
  • distribuer ;
  • rechercher ;
  • établir un lien vers le texte intégral ;
  • explorer par machine et réaliser des traitements de fouille textuelle.

Que doit faire un chercheur lorsque son article est prêt?

Le chercheur est libre de décider s’il souhaite publier ou non. Plus exactement l’exigence de rendre librement accessible n’implique pas l’obligation de publier. Si le chercheur décide de publier, alors il doit obligatoirement déposer dans un réservoir ses articles scientifiques afin de les mettre en libre accès.

Ainsi, il doit déposer une copie électronique de la version publiée ou de son manuscrit final validé par les pairs et accepté pour publication. Attention, ce dépôt doit être réalisé dans une archive ouverte le plus tôt possible et au plus tard lors de la publication.

Ensuite, le libre accès de ces publications doit être rendu possible au plus tard les six mois suivants leur parution (exception faite pour les sciences humaines et sociales pour lesquelles le délai est de 12 mois).

Parallèlement, le chercheur peut choisir un éditeur chez qui il souhaite publier son travail notamment en format papier. Cet éditeur peut ou non proposer le libre accès. Dans la positive, l’éditeur est en droit de demander des frais de publication en ligne (APC : Article Processing Charges). Frais qui sont éligibles au remboursement.

Démarches de libre accès des publications

Choix d’une archive ouverte

Les chercheurs ont libre choix des archives ouvertes, dans lesquelles ils vont déposer leur article.

Cependant, il en existe de nombreuses et le choix peut parfois être difficile. Il est alors possible de demander des renseignements sur divers sites :

  • OpenAIRE (Open Access Infrastructure for Research in Europe)
  • OpenDOAR (Directories of Open Access Repositories)
  • ROAR (Registry of Open Access Repositories)

Les éditeurs

Les chercheurs sont libres de choisir la revue dans laquelle leur article sera publié. Cependant, quelle que soit la revue choisie, le chercheur doit déposer son article dans une archive ouverte. Tel que mentionné précédemment, tous les éditeurs ne permettent pas le libre accès, de plus si certains l’autorisent ceci se fait sous certaines conditions. De ce fait, il est fortement conseillé aux chercheurs de conserver leur droit d’auteur et d’accorder aux éditeurs des licences, et surtout de se procurer un identifiant auteur (ORCID : Open Researcher and Contributor ID).

Libre accès aux données

Que signifie “Libre accès aux données”?

Les articles doivent être en libre accès mais les données également. Ceci indique que les données :

  • Sont diffusées et accessibles gratuitement par l’utilisateur final
  • Peuvent être soumises à des processus de fouille, exploitées et reproduites

Actuellement, dans le cadre du programme Horizon 2020, tous les projets ne sont pas encore totalement concernés, mais le seront à terme. Les projets concernés sont les suivants :

  • Technologies futures et émergentes
  • Infrastructure de recherche
  • Primauté dans les domaine des technologies génériques et industrielles- Technologie de l’information et de la communication
  • Nanotechnologies, matériaux avancés, procédés de production et de fabrication avancés, et biotechnologies thèmes “nanosécurité” et “modélisation”
  • Défi de société :
    • sécurité alimentaire, agriculture et foresterie durables, recherches marines, maritimes et sur les eaux continentales, et bioéconomie
    • Lutte contre le changement climatique, environnement, utilisation efficace des ressources et matières premières - à l’exception des travaux menés dans le domaine des matières premières
    • Des sociétés inclusives , novatrices et capables de réflexion
    • La Science avec et pour la société
    • Activités transversales - domaines prioritaires- volet “Villes intelligentes et durables”
Démarches libre accès aux données

Que doit faire un chercheur de ses données?

Le choix de partager les données dépend des bénéficiaires du financement. Dans le cadre du programme Horizon 2020, les chercheurs se doivent de rendre accessibles leurs données, qui doivent être entreposées dans un dépôt et mises en libre accès.

Les données et les métadonnées nécessaires à la validation des résultats mentionnés dans l’article scientifique sont concernées, mais également les données spécifiés dans le plan de gestion de données (DMP : Data Management Plan). Le DMP est un document à concevoir au début d’un projet de recherche expliquant la façon dont les données de recherche recueillies ou générées seront gérées durant le projet et après son terme.

Le dépôt doit être réalisé le plus tôt possible dans un entrepôt de données du choix du bénéficiaire du financement, afin que les données puissent être en libre accès.

Choix de l'entrepôt

Les chercheurs ont libre choix de l'entrepôt de dépôt des données. Il en existe plusieurs, le chercheur peut donc être conseillé par le site Registry of Research Data Data Repository.

Les entrepôts (Data Data Repository ou Digital Repository) sont des bases de données structurées qui permettent de déposer les données et métadonnées. En déposant les données dans un entrepôt, celles-ci sont rendues visibles, accessibles moissonnables et citables; ce qui permet leurs vérifications et réutilisations. Les entrepôts dit de confiance (Trusted Repository) sont conformes aux directives de l’OpenAIRE. Ils doivent répondre à certains critères de qualité concernant leur stockage et l'intégrité des données. Des coûts sont induits aux chercheurs par ces opérations, et sont éligibles au remboursement.

Il est conseillé aux chercheurs d’identifier les données de manière unique et par conséquent de se procurer un identifiant de données (DOI : Digital Object Identifier).

Il est important de savoir qu’il existe des procédures d’accès aux données:

  • Accès immédiat ou embargo (à définir)
  • Accès à tous ou restreint à des groupes spécifiques

FNS - Pour les chercheurs Suisses

La Suisse s’inscrit dans la même logique que le programme Horizon 2020 de l'Union Européenne. Effectivement, le Fond National Suisse (FNS) soutient l’idée de rendre accessible les publications scientifiques et les données de recherche pour tous, et soutient ainsi la participation de la Suisse au programme Horizon 2020.

Depuis octobre 2017, le chercheur doit ainsi obligatoirement inclure un plan de gestion des données (Data Management Plan) pour chaque requête auprès du FNS. Le FNS attend de la part des chercheurs que leurs données et/ou les résultats de leurs travaux de recherche soient accessibles dans des bases de données.

Déclaration de principe[6]

Le FNS considère que le partage des données de recherche apporte une contribution essentielle à la recherche scientifique en termes d’'impact, de transparence et de reproductibilité. En plus d'une préparation et d'un archivage soigneux, le FNS est d'avis que les données de recherche doivent être partagées de manière aussi ouverte que possible. Par conséquent, le FNS demande à tous les chercheuses et chercheurs qu'il finance :

  • d'archiver les données de recherche sur lesquelles ils ont travaillé et qu'ils ont produites durant leurs travaux ;
  • de partager ces données avec d'autres chercheuses et chercheurs, à moins qu'ils/elles soient lié-e-s par des clauses légales, éthiques, de copyright, de confidentialité ou autres ;
  • de déposer leurs données et métadonnées dans des archives publiques existantes, dans des formats accessibles et réutilisables sans restriction par tout un chacun.

Les données de recherche sont des éléments concrets collectés, étudiés ou générés dont la communauté scientifique admet communément la nécessité pour documenter et valider les résultats de recherche.

Le FNS a élaboré des directives sur le Data Management Plan (DMP) pour les chercheurs, et a mis à disposition sur son site les éléments que doit contenir le DMP .

Les règlements par rapport aux principes "Open Research Data" du FNS sont en outre régis par l'article 47 et l'article 2.13

Principes de données FAIR

L'application des principes FAIR aux données se traduit par le fait que l'ensemble des données puisse être trouvé ("Findable"), qu'il soit accessible ("Accessible"), interopérable ("Interoperable") et réutilisable ("Re-usable").

Par ailleurs, trouver une base de données qui répond à toutes les caractéristiques nécessaires pour accueillir les données FAIR est un challenge auquel est confronté la communauté scientifique. Pour rendre plus souple le passage vers des données FAIR, le FNS a jugé nécessaire d'établir un certain nombre de critères minimaux que les bases de données doivent remplir afin de respecter les principes FAIR. Vous pouvez consulter les exemples de bases de données disponible sur le site du FNS.

Au delà de l'échelle Européenne : Libre Accès dans les pays en développement

Tandis que les chercheurs dans les pays développés tels que les pays Européens, profitent du libre accès à l'information scientifique et participent dans la communauté internationale de recherche; cela n’est pas encore le cas dans les pays en développement qui font toujours face à deux problèmes principaux :

  • Incapacité de s'abonner aux revues (coût élevé des abonnements)
  • Incapacité d'intégrer les connaissances scientifiques issues de leurs propres recherches dans le bassin grandissant du savoir mondial (lacunes dans les connaissances).

Toutefois, il existe aujourd’hui un certain nombre de programmes offrant aux chercheurs des pays en développement un accès à la littérature scientifique gratuit ou à faible coût. Le plus connu est le programme Research4Life créé à la base de la collaboration entre les institutions des Nations Unies, les universités et les éditeurs. Il vise à réduire l’écart des connaissances entre les pays en développement et les pays industrialisés.

Researche4Life est composé de quatre programmes - HINARI, AGORA, OARE, ARDI qui fournissent l’accès en ligne aux revues académiques et professionnelles.

  • HINARI - Accès aux principales revues, bases de données et autres ressources dans le domaine de santé et surtout en sciences biomédicales.
  • AGORA - Accès à une grande collection de revues spécialisés dans les domaines de l'alimentation, de l'agriculture et de l'environnement.
  • OARE - Accès à plus de 3900 revues scientifiques concernant les sujets environnementaux.
  • ARDI - Accès à la recherche pour le développement et l'innovation.

Conclusion

L’accessibilité à tous des publications scientifiques et des données attenantes offre aujourd’hui une nouvelle dimension à la Recherche. Désormais, la Recherche ne se résume plus exclusivement aux fruits d’observations expérimentales, d’hypothèses ou de théories, mais naît également de la manipulation et de l’agrégation des données.

Il devient à présent possible de réaliser de nouvelles recherches à partir de grands ensembles de données. Mais, force est de constater que ce changement ne peut se réaliser pleinement qu’à travers la mise en place de mécanismes de gestion, de conservation et de partage des données efficaces.

Les données produites par les chercheurs, dans de nombreuses disciplines, font désormais l’objet de toutes les attentions. États, agences de financement de la recherche, éditeurs, communautés scientifiques sont des acteurs indispensables garantissant l’accessibilité et la complète réutilisation des données.

Glossaire

Ce glossaire est principalement issu du site http://www.inist.fr/?Glossaire et du FNS.

Archive ouverte (open repository) : Réservoir en ligne de publications scientifiques, principalement des articles. Il permet un accès libre - immédiat ou différé (voir embargo) - et gratuit pour le déposant et le lecteur. Il peut être institutionnel, thématique ou centralisé.

Data Seal of ApproVal (DSA) : c'est une collaboration entre scientifiques et administrateurs de bases de données, qui vise à établir des standards en matière de stockage et d'archivage de données pour assurer une réutilisation efficace des données à long-terme. DSA

Dépôt dans une archive ouverte (deposit in an open archive) : Dépôt d’un article (version publiée ou manuscrit final) dans une archive ouverte par l’auteur (auto-archivage, self-archiving) ou l’un de ses représentants. Ce dépôt est communément appelé "voie verte" (green road, green open access).

Digital Curation Centre (DCC) : est un centre d’expertise sur la gestion et l’archivage de données. Il propose des études de cas, des services en ligne ou encore des programmes de formation http://www.dcc.ac.uk/.

Entrepôt de données (Data Repository) : Réservoir en ligne dédié aux données de recherche. Il peut être disciplinaire ou thématique, être institutionnel ou centralisé.

Frais de publication (APC : Article Processing Charges) : Somme demandée aux auteurs par les éditeurs pour que leurs articles soient en libre accès dès leur publication. Ces frais sont fréquemment payés par l’université ou l’institut de recherche auquel l’auteur est rattaché, ou par l’organisme de financement soutenant ses recherches.

Identifiant ouvert pour chercheur et contributeur (ORCID : Open Researcher and Contributor) : soit « Identifiant ouvert pour chercheur et contributeur »): est un code alphanumérique non propriétaire, qui permet d'identifier de manière unique les chercheurs et auteurs de contributions académiques et scientifiques https://fr.wikipedia.org/wiki/ORCID

Libre accès (open access) : Accès à des informations scientifiques en ligne, gratuites pour l’utilisateur final et réutilisables.

Licence (licence) : Contrat par lequel un titulaire d’un droit de propriété intellectuelle concède en tout ou en partie la jouissance de ce droit (droits de reproduction, de représentation, droit d’autoriser les œuvres dérivées…)

Licence Creative Commons (Creative Commons licence) : Contrats-type, proposés par l’organisation Creative Commons, dans lesquels les chercheurs déterminent les droits attachés à l’article ou aux données de recherche qu’ils ont produits dans le cadre de leurs recherches. Six contrats sont possibles en combinant quatre éléments de base qui sont : la paternité, la modification, l’utilisation commerciale et la réutilisation dans les mêmes conditions du contrat d’origine.

Plan de gestion des données (Data management plan : DMP) : Document à concevoir au début d’un projet de recherche expliquant la façon dont les données de recherche recueillies ou générées seront gérées durant le projet et après son terme.

Programme P-5 : il s'agit d'un programme de Swissuniversities. C'est la continuation du programme CUS P-2 qui "encourage le regroupement des efforts que les hautes écoles déploient actuellement de manière dispersée pour mettre à disposition et traiter des informations scientifiques." Programme P-5

Re3data : c'est le registre le plus large et le plus complet concernant les bases de données en ligne. Il couvre un large éventail de disciplines du monde entier. Re3data

Références

http://www.inist.fr/?-Tutoriels-multimedias-H2020-

http://www.snf.ch/fr/leFNS/points-de-vue-politique-de-recherche/open_research_data/Pages/default.aspx

Ware, M., & Mabe, M. (2015). The STM report: An overview of scientific and scholarly journal publishing.