« Data Repositories » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
Ligne 22 : Ligne 22 :
*Informations générales : présence d’informations supplémentaires sur les données
*Informations générales : présence d’informations supplémentaires sur les données
*Services/accessibilité : quel degré d’accessibilité autorise le dépôt ? (Consultation, téléchargement, dépôt libre, etc.)
*Services/accessibilité : quel degré d’accessibilité autorise le dépôt ? (Consultation, téléchargement, dépôt libre, etc.)
*Licences : licences de réutilisation des données (cf. [[Licences d’exploitation]])
*Licences : licences de réutilisation des données (cf. [[Licences d'exploitation]])
*Standards de métadonnées : adhésion à une norme de métadonnées, utilisation d'un identifiant persistant (DOI, ISBN,...)
*Standards de métadonnées : adhésion à une norme de métadonnées, utilisation d'un identifiant persistant (DOI, ISBN,...)
*Standards techniques : Format des données, types de fichiers autorisés
*Standards techniques : Format des données, types de fichiers autorisés
Ligne 60 : Ligne 60 :
En résumé, un data repository peut constituer une plateforme de partage de données de recherche et d’articles scientifiques en libre d’accès, pour autant que l’on respecte les règles élémentaires de référencements (voir la page [[Licences d'exploitation]]).
En résumé, un data repository peut constituer une plateforme de partage de données de recherche et d’articles scientifiques en libre d’accès, pour autant que l’on respecte les règles élémentaires de référencements (voir la page [[Licences d'exploitation]]).


La plupart des data repositories permettent l’obtention d’un DOI (Digital Object Identifier ) qui est un identifiant invariable qui permet de référencer votre travail. Ces DOI sont également utilisés dans des bases de données bibliographiques, qui répertorient toutes les catégories de documents de recherche. Il s'agit d'un standard de métadonnées très répandu.
La plupart des data repositories permettent l’obtention d’un DOI (Digital Object Identifier) qui est un identifiant invariable qui permet de référencer votre travail. Ces DOI sont également utilisés dans des bases de données bibliographiques, qui répertorient toutes les catégories de documents de recherche. Il s'agit d'un standard de métadonnées très répandu.


Aujourd'hui, de plus en plus d'institutions et de périodiques scientifiques adoptent une approche de type "open research", soutenue par des repositories. Cette approche accorde des avantages en termes de visibilité et de flexibilité dans la publications de travaux et de données.
Aujourd'hui, de plus en plus d'institutions et de périodiques scientifiques adoptent une approche de type "open research", soutenue par des repositories. Cette approche accorde des avantages en termes de visibilité et de flexibilité dans la publications de travaux et de données.

Version du 16 novembre 2017 à 14:44

Cet article est en construction: un auteur est en train de le modifier.

En principe, le ou les auteurs en question devraient bientôt présenter une meilleure version.



Définition Générale

Un data repository (dépôt de données ou répertoire de données) est un terme général faisant référence à un espace utilisé pour stocker des données de façon centralisée. Les données en question sont censées être partagées au sein d’une communauté définie. Par convention, on distingue les data repositories, comme Zenodo, des data software (dépôts de logiciels), comme GitHub. Les data repositories regroupent en premier lieu des données de recherche, à l’état brut ou traitées à différents niveaux. Le but de ce partage est, selon son contexte, de favoriser l’accès, la réutilisation et/ou le référencement des données.

Pour plus de lisibilité, nous utiliserons le terme "data repository", puisque c'est en anglais que nous trouvons plus facilement des informations sur le sujet.

Caractéristiques et Types

Types

La principale distinction que l'on peut trouver est celle entre les data repositories et les data software : il s'agit essentiellement d'un type de données différent, qui peut induire des spécificités dans leur usage. Par exemple, il est possible de déployer directement une application web sur Github. En dehors de cela, on classifiera avant tout les repositories sur la façon de classifier leurs données.

Classification des données

Selon leurs caractéristiques, ou les usages qui en sont faits, il est possible de différencier un repository contenant des données de recherches au sein d’une institution à des fins de référencement et de stockage. On peut aussi trouver des repositories stockant des données de recherche accessibles à tous, à des fins de diffusion.

Le site web https://www.re3data.org/, moteur spécialisé en recherches dans les repositories, classifie les données selon les critères suivants :

Représentation des critères de classification Re3Data. Source: Making research data repositories visible : the re3data.org registry. PeerJ PrePrints 1:e21v1 - novembre 2017
  • Informations générales : présence d’informations supplémentaires sur les données
  • Services/accessibilité : quel degré d’accessibilité autorise le dépôt ? (Consultation, téléchargement, dépôt libre, etc.)
  • Licences : licences de réutilisation des données (cf. Licences d'exploitation)
  • Standards de métadonnées : adhésion à une norme de métadonnées, utilisation d'un identifiant persistant (DOI, ISBN,...)
  • Standards techniques : Format des données, types de fichiers autorisés
  • Conditions d’utilisation : aspects légaux
  • Standards de qualité : revue par des tiers, vérification des données

L’enjeu principal pour un repository, du fait de la quantité de données qui s'y trouvent, est de faciliter au maximum la recherche d’informations, via des critères de recherches permettant la navigation parmi des métadonnées. De nombreux standards de métadonnées existent sur le web, certains étant spécifiques à des disciplines particulières.

Finalités

On peut globalement distinguer les utilités suivantes aux data repositories :

  • Objectif éducatif : le repository peut servir de base de connaissances accessible aux étudiants ou utilisable comme répertoire de ressources commun par des enseignants
  • Objectif de recherche : l'accessibilité de données et de résultats de recherches favorisent la circulation des connaissances et donc la tenue de nouvelles recherches
  • Objectif de classification/entreposage : le stockage centralisé de données, selon un standard de classification est une forme d'archivage efficace

Les data repositories se caractérisent donc essentiellement par les types de données qu’ils hébergent, le degré d’accès qu’ils y accordent, et les licences sous lesquelles ces données peuvent éventuellement être réutilisées.

Exemples de Repositories

Voici ci-dessous une sélection de repositories parmi les plus connus:

Re3data.org

re3data est un registre global de data repositories. On y trouve des data repositories pour différentes disciplines académiques. Ce registre à été développé dans le but de contrer l'apparition hétérogène des data repositories et de les indexer de façon structurée.

Autres data repositories connus

  • OpenDOAR est un annuaire mondialement reconnu de data repositories en accès libre.
  • Dryad est un data repository développé par une institution à but non-lucratif
  • Eudat (est un data repository privé que chaque institution peut installer en interne) est une infrastructure européenne à implémenter dans son institution
  • Figshare est une entreprise offrant ses services aux chercheurs et aux éditeurs
  • Harvard Dataverse est un réseau de repositories
  • Zenodo est un serveur développé et hébergé au CERN

Open data : un exemple d'utilisation

Un data repository peut servir à publier des articles de recherches, l’objectif étant de permettre une meilleure diffusion et un accès libre auxdits articles, dans une optique d’Open Research Data (ORD). Un data repository permet aussi de prépublier un article qui est en attente de publication dans une revue spécialisée ou un livre. Ainsi, la recherche est disponible en accès anticipé et permet le référencement dans d’autres recherches sans attendre sa distribution par les maisons d’éditions. Il est tout autant possible d’y déposer que d’y chercher des travaux, grâce aux métadonnées de ceux-ci, et ainsi de trouver des références pour de nouveaux travaux, comme on le ferait sur un moteur de recherche plus classique, mais moins spécifique, et donc moins efficace. En résumé, un data repository peut constituer une plateforme de partage de données de recherche et d’articles scientifiques en libre d’accès, pour autant que l’on respecte les règles élémentaires de référencements (voir la page Licences d'exploitation).

La plupart des data repositories permettent l’obtention d’un DOI (Digital Object Identifier) qui est un identifiant invariable qui permet de référencer votre travail. Ces DOI sont également utilisés dans des bases de données bibliographiques, qui répertorient toutes les catégories de documents de recherche. Il s'agit d'un standard de métadonnées très répandu.

Aujourd'hui, de plus en plus d'institutions et de périodiques scientifiques adoptent une approche de type "open research", soutenue par des repositories. Cette approche accorde des avantages en termes de visibilité et de flexibilité dans la publications de travaux et de données.

Références

Dépôt (informatique). (2017, octobre 1). Wikipédia, l'encyclopédie libre. Page consultée le 22:23, octobre 1, 2017 à partir de http://fr.wikipedia.org/w/index.php?title=D%C3%A9p%C3%B4t_(informatique)&oldid=141138173.

Learning objects repositories. (2011, October 19). EduTech Wiki, A resource kit for educational technology teaching, practice and research. Retrieved 14:12, November 2, 2017 from http://edutechwiki.unige.ch/mediawiki/index.php?title=Learning_objects_repositories&oldid=35629.

Learning object repository. (2013, October 24). EduTech Wiki, A resource kit for educational technology teaching, practice and research. Retrieved 14:04, November 2, 2017 from http://edutechwiki.unige.ch/mediawiki/index.php?title=Learning_object_repository&oldid=48878.

http://guides.ucf.edu/metadata/dataRepositories

https://www.re3data.org/

Pampel H, Vierkant P, Scholze F, Bertelmann R, Kindling M, Klump J, Goebelbecker H, Gundlach J, Schirmbacher P, Dierolf U. (2013) Making research data repositories visible: the re3data.org registry. PeerJ PrePrints 1:e21v1 https://doi.org/10.7287/peerj.preprints.21v1