Gestion des données de recherche

De EduTech Wiki
Aller à la navigation Aller à la recherche
Manuel de recherche en technologie éducative
Module: Questions pratiques et outils de référence
◀▬▬▶
brouillon débutant
2018/12/04 ⚒⚒ 2015/03/27

Introduction générale

De plus en plus de disciplines, revues et agences de recherchent exigent la mise à disposition des données de recherche. Cela implique qu'il faut gérer à la fois l'archivage, la documentation et la mise à disposition.

Par exemple, «Le Fonds national suisse (FNS) soutient le principe du libre accès aux données de la recherche (Open Research Data ou ORD). Il introduit à ce titre une première mesure: à partir d'octobre 2017, des plans de gestion des données (DMP) feront partie intégrante des requêtes en encouragement de projets.» (Open Research Data: directives du FNS pour les plans de gestion des données (11/05/2017)

Selon Wikipedia, «Un plan de gestion des données, Data management plan ou PGD est un document évolutif qui aide le(s) chercheur(s) ou le chargé de projet de la recherche à définir un plan pour gérer les données utilisées et générées dans le cadre de son activité ou de son projet de recherche. Initié au début du projet, ce plan est mis à jour de manière périodique pour s'assurer de son adéquation avec le déroulement de l'activité ou du projet.»

Définition et cycle de vie des données de recherche

Cette section a été réalisée par les participants au Module 1 du projet RESET-Francophone et particulièrement par Kaoutar Elhadi et Hanae El Maamri.

Le texte ci-dessous est un résumé produit à partir des trois ressources suivantes :

Définitions

Pour traiter la question de l’ouverture des données de la recherche, Rosemberg (2015) rapporte des définitions de différents organismes:

  • Selon l’Organisation de Coopération et de Développement Economiques (OCDE), les données de la recherche sont associées à la validité et aux résultats de la recherche. Elles constituent des sources pour la recherche scientifique pour en valider les résultats.
  • D’après l’Organisme Australien National Data Service (OANDS), les données de la recherche sont des observations ou des expériences sur lesquelles se base la théorie, l’argumentation ou le test. Elles comprennent toutes les données créées par le chercheur dans le cadre de son travail à savoir les carnets de laboratoire, carnets de recherche, projets, rapports, questionnaires, etc.
  • Contrairement à l’OANDS, l’Association des directeurs et des personnels de direction des bibliothèques universitaires (ADBU) n’inclue pas ces données dans l’ensemble « données de la recherche ». Elle les considère comme inutiles à la validation des résultats de la recherche.
  • Selon l’article What is research data ? publié sur le site officiel de l’Université de Leicester, la définition des données de recherche représente un défi. En effet elle varie selon la discipline. Ainsi à partir de plusieurs définitions, celle de l’Université d'Edimbourg, qui affirme que les données de recherche, contrairement aux autres types d’informations, sont « collectées, observées ou créées à des fins d'analyse et dans le but de produire des résultats de recherche originaux », est retenue. D’après le Conseil de recherche en génie et sciences physiques (EPSRC), les données de recherche représentent « des éléments factuels enregistrés, généralement retenus et acceptés par la communauté scientifique comme nécessaires pour valider les résultats de la recherche ».

Cycle de vie

Le site de l’Université de Lausanne, dans un article intitulé Cycle de vie des données de recherche, présente le modèle de référence du cycle de vie des données de recherche, Research Data Lifecycle, élaboré par UK Data Archive. Ledit modèle expose six principales étapes incluant des actions pour une rotation du cycle continue des données, dans le but d’en garantir une gestion appropriée.

Le cycle de vie des données de recherche est constitué de 6 étapes : création ou collecte, traitement, analyse, publication, archivage, réutilisation comme illustré dans la Figure de l'IUMSP. Il est important de comprendre chacune de ces étapes afin de mettre en place une gestion adéquate tout au long du cycle.

Il est également important de bien comprendre, conceptuellement, les termes associés à ces étapes:

  • Durant l’étape de création des données, il s’agit de les recueillir selon les protocoles de recherche et la méthodologie décidés en amont ;
  • Durant l’étape de traitement des données, le chercheur rend ces données analysables en respectant les lois et les considérations éthiques en vigueur (par ex : anonymisation) ;
  • Durant l’étape d’analyse des données, le chercheur analyse, selon les méthodes arrêtées en amont dans le design de recherche et avec les logiciels spécialisés nécessaires pour analyser les données ;
  • Durant l’étape de publication des données, le chercheur sélectionne une partie de ses données, par exemple celles qui permettront à d’autres chercheurs de reproduire le design de recherche, pour les mettre à disposition de la communauté en respectant les contraintes éthiques nécessaires ;
  • Durant l’étape d’archivage des données, celles-ci sont rendues disponible pendant une durée déterminée ;
  • Enfin durant l’étape de réutilisation des données, les données sont non seulement accessibles (elles sont stockées de manière appropriées) mais elles sont également lisibles (tout chercheur peut les utiliser pendant la durée de leur archivage pour conduire une recherche avec).

Il s’agit donc de distinguer entre données actives de recherche et préservation d’une partie de ces données. Les données actives de recherche sont les données en cours d’utilisation par le chercheur alors que les données archivées et préservées sont des données qui ont déjà été analysées et qui sont là pour consultation et/ou utilisation dans le cadre d’une autre recherche. Notons également, tout en relativisant ce chiffre, que l’échelle de temps par rapport à la préservation des données est généralement la suivante : le long terme, dans ce domaine, signifie une durée de 10 ans.

Pour optimiser la gestion du cycle de vie des données, il s’agit, en amont, de considérer les deux phases – la phase active et la phase d’archivage / préservation. En procédant de la sorte, en choisissant d’emblée des formats répondant aux besoins et compatibles avec les deux phases, en réfléchissant au processus de sélection des données qui devront être préservées en amont, la gestion dans son entièreté s’en trouve facilitée. Afin de se poser les bonnes questions, le Data Management Plan (DMP) du FNS est un excellent outil.

Quelques lois relatives à la protection des données personnelles

Algérie :

Europe :

Maroc :

Suisse :

Tunisie :


Ressources