« Data Repositories » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
Ligne 3 : Ligne 3 :


==Définition Générale==
==Définition Générale==
Un dépôt (repository) est un terme général faisant référence à un espace utilisé pour stocker des données de façon centralisée. Les données en question sont censées être partagées au sein d’une communauté définie.
Un data repository (dépôt de données, répertoire de données) est un terme général faisant référence à un espace utilisé pour stocker des données de façon centralisée. Les données en question sont censées être partagées au sein d’une communauté définie.
Par convention, on distingue les dépôts de données (data repositories), comme Zenodo, ainsi que les dépôts de logiciels (data software), comme GitHub.  
Par convention, on distingue les data repositories, comme Zenodo, ainsi que les data software (dépôts de logiciels), comme GitHub.  
Les dépôts de données regroupent en premier lieu des données de recherche, à l’état brut ou traitées à différents niveaux. Le but de ce partage est, selon son contexte, de favoriser l’accès, la réutilisation et le référencement des données.
Les data repositories regroupent en premier lieu des données de recherche, à l’état brut ou traitées à différents niveaux. Le but de ce partage est, selon son contexte, de favoriser l’accès, la réutilisation et le référencement des données.


==Standards==
==Standards==

Version du 18 octobre 2017 à 13:52

Page en construction Groupe Arthur, Jessica, Quentin, Philippe

Définition Générale

Un data repository (dépôt de données, répertoire de données) est un terme général faisant référence à un espace utilisé pour stocker des données de façon centralisée. Les données en question sont censées être partagées au sein d’une communauté définie. Par convention, on distingue les data repositories, comme Zenodo, ainsi que les data software (dépôts de logiciels), comme GitHub. Les data repositories regroupent en premier lieu des données de recherche, à l’état brut ou traitées à différents niveaux. Le but de ce partage est, selon son contexte, de favoriser l’accès, la réutilisation et le référencement des données.

Standards

Caractéristiques et Types

On peut distinguer plusieurs types de dépôts de données selon leurs caractéristiques ou les usages qui en sont faits ; par exemple, différencier un repository contenant des données de recherches au sein d’une institution, à des fins de référencement et de stockage, et un repository stockant des données de recherche accessibles à tous, à des fins de diffusion. Le site web https://www.re3data.org/, moteur spécialisé en recherches dans les repositories, classifie les données selon les critères suivants :

  • Information : présence d’informations supplémentaires sur les données
  • Accès : quel degré d’accessibilité autorise le dépôt ? (Consultation, téléchargement, dépôt libre, etc.)
  • Licences : licences de réutilisation des données (cf. pages sur les licences)
  • Identifiant persistant : présence éventuelle d’un identifiant universel, comme le DOI
  • Certificats et standards : standards de qualité des données, ou adhésion à une norme de métadonnées
  • Conditions d’utilisation
  • Revue par des tiers : vérification des données ou non par un tiers

Les data repositories se caractérisent donc essentiellement par les types de données qu’ils hébergent, le degré d’accès qu’ils y accordent, et les licences sous lesquelles ces données peuvent éventuellement être réutilisées. L’enjeu principal pour un repository est de faciliter au maximum la recherche d’informations, que ce soit via des critères de recherches ou des métadonnées.

Exemples de Repositories

Voici ci-dessous une sélection de dépôts parmi les plus connus:

  • re3data est un registre global de répertoires de données de recherches. On y trouve des des répertoires de données pour différentes disciplines académiques.
  • OpenDOAR est un registre mondialement reconnu de répertoires de données en accès libre.
  • Dryad est une organisation à but non-lucratif
  • Eudat est une infrastructure européenne à implémenter dans son institution
  • Figshare est une entreprise offrant ses services aux chercheurs et aux éditeurs
  • Harvard Dataverse est un réseau de répertoires
  • Zenodo est un serveur développé et hébergé au CERN

Exemples d'utilisation

Un Data repository peut servir à publier des articles de recherches, l’objectif étant de permettre une meilleure diffusion et un accès libre auxdits articles, dans une optique d’Open Research Data (ORD). Un Data repository permet aussi de prépublier un article qui est en attente de publication dans une revue spécialisée ou un livre. Ainsi, la recherche est disponible en accès anticipé et permet le référencement dans d’autres recherches sans attendre sa distribution par les maisons d’éditions. Il est tout autant possible d’y déposer que d’y chercher des travaux, grâce aux métadonnées de ceux-ci, et ainsi de trouver des références pour de nouveaux travaux, comme on le ferait sur un moteur de recherche plus classique, mais moins spécifique, et donc moins efficace. En résumé, un Data Repository peut constituer une plateforme de partage de données de recherche et d’articles scientifiques en libre d’accès, pour autant que l’on respecte les règles élémentaires de référencements (voir la page Licences).

La plupart des Data Repositories permettent l’obtention d’un DOI (Digital object identifier ) qui est un identifiant invariable qui permet de référencer votre travail. Ces DOI sont également utilisés dans des bases de données bibliographiques, qui répertorient toutes les catégories de documents de recherche.

Références