Discussion:Data Repositories
Discussions - peer review -- Kristina (discussion) 8 novembre 2017 à 12:06 (CET)
Bonjour,
Bravo pour la création de cette page - Data Repositories. Elle est bien structurée et contient les informations clés. Les liens permettent aux lecteurs d'aller plus loins et approfondir leurs connaissances.
Toutefois, je vous propose quelques points d'améliorations.
Proposition 1: Chapitre: Caractéristiques et Types. Vous parlez plus de la classification que des Types de dépôts. L'information étant déjà mentionnée dans le texte, nécessiterait la rendre plus explicite (ex. bullet points, image.. autre?). Sauf erreur, il manque un type de dépôts - "Discipline-specific data repository".
Proposition 2: Chapitre: Caractéristiques et Types. Vous élaborez la classification des données selon les critères RE3Data mais ils ne correspondent pas à l'image qu'on voit à droite. Cela est en peu confus pour un lecteur. Il faudra soit décrire l'image et ainsi approfondir la classification. Soit changer l'image qui correspond d'avantage à la classification proposée.
Proposition 3. Vous utilisez le mot "Data Repositories" en anglais tout au long de votre article alors que le texte est en français. Serait-il possible d'utiliser le terme "Dépôts de données"? Ou alors, expliquer au tout début de l'article que vous allez utiliser le terme en anglais. Qu'en pensez-vous?
Ceci dit, c'est un bon travail :-) Cordialement, Kristina
Discussions - peer review -- Dauve (discussion)
Dans l’ensemble, votre page wiki explique bien ce que sont les “Data repositories” et répond bien aux questions : Quoi? Comment et pourquoi? Votre paragraphe “finalités” notamment me semble bien expliquer le but de ces répertoires.
Ci dessous quelques petites remarques.
Définition Je ne comprends pas votre phrase: “Par convention, on distingue les data repositories, comme Zenodo, ainsi que les data software (dépôts de logiciels), comme GitHub.” à la place de “ainsi que les” ne serait ce pas “des”
Classification des données Vous indiquez qu’il existe deux types de repository, l’un pour le stockage, l’autre pour la diffusion. Puis vous introduisez l’exemple de re3data, mais sans préciser à quel type de repository il appartient.
Schéma Le schéma utilisé aurait pu être refait avec les indications en français (celles que vous mentionnez dans votre texte) , afin de ne pas avoir de mélanges de deux langues, bien que je sois consciente que “data repository” est un “terme général” utilisé tel quel, même en Français.
A rajouter Peut être expliquer brièvement (pour ne pas dépasser votre sujet), qui et comment les personnes déposent leur données en prenant un exemple comme sur re3data. Par exemple si les personnes doivent ouvrir un compte. Mentionner aussi que pour déposer sur re3data notamment (je ne sais pas comment fonctionnent les autres), il faut faire partie d'“une entité juridique, telle qu'une institution durable”; sinon on peut avoir l’impression que n’importe qui peut déposer quelque chose.
Ajouter également que pour avoir accès aux Data Repositories , même si l’accès est gratuit il faut en général ouvrir un compte. Personnellement je ne sais pas quelles sont les portées d’ouvrir un compte pour un accès plutôt que d’avoir accès sans compte…
Discussions - peer review -- Azmira (discussion)
Votre article explique bien ce qu'est un dépôt de donnée. Vous avez bien structurer votre document avec une définition générale et les caractéristiques au départ, pour ensuite donner un exemple plus concret de l'utilisation d'un type de repository. De plus, le graphique proposé permet de mieux visualiser la classification des données.
Voici quelques points qui posent problème dans la compréhension, selon moi :
- C'est difficile à comprendre la nuance que vous effectuez entre le dépôt de logiciel et le dépôt des documents de recherches, si j'ai bien compris la distinction proposée.
- Concernant les exemples de repositories fournies, vous pourriez un peu détailler les caractéristiques des ces repositories (domaine académique, type de données, accessibilité etc...) , pour mieux orienter le lecteur sur le type de repositories à choisir selon son besoin.
- A mon avis, il faut aussi contextualiser un peu historiquement l'évolution de ces repositories surtout dans le domaine de la recherche ( si ces informations existent ), ca permet de bien introduire le sujet traité.
En dehors, de ces remarques la qualité du contenu me semble pertinent et très clair, résumant bien le sujet traité.
Discussions - peer review -- Andréa (discussion) 10 novembre 2017 à 10:55 (CET)
Hello tous, Jessica, Arthur, Quentin et Philippe,
Tout d'abord, je tiens à vous féliciter pour ce texte qui est très clair et bien rédigé. J'ai eu beaucoup de plaisir à le lire. Cela m'a fait d'ailleurs une belle révision par rapport au cours de Jean-Blaise Claivaz et Audrey Bellier d'octobre dernier. J'ai aussi apprécié l'illustration que vous avez retenue.
J'ai prélevé quelques questions d'ordre général concernant le fonctionnement des Data Repositories (DR), qui suivent ci-dessous :
- Quand est-ce que ces DR ont été créés ? Ou en tout cas quel était le premier DR créé et en quelle date ? Par quelle institution ?
- Combien de DR, de bases de données et d'utilisateurs sont recensés à ce jour ?
- Comment peut-on accéder aux data repositories ?
- Pour déposer ou télécharger des données, faut-il créer un login et être inscrit ?
Les citations et la bibliographie
Vous citez plusieurs pages web externes et/ou internes à Edutechwiki, mais soit il n'y a pas le lien explicite cliquable "inclus" dans texte, soit l'URL figure dans le texte. Si je ne me trompe pas, dans le wiki on devrait trouver des liens cliquables (avec l'URL "cachée") ou des références aux liens (style [1], [2], [3], etc). Les adresses URL des sites devraient donc figurer dans la bibliographie, et non pas être saisies en toutes lettres au milieu du texte. Cf. la bibliographie de notre page sur les licences d'exploitation. Il faudrait donc relire tout le texte et corriger ainsi la mention aux autres sites ou pages. D'ailleurs, c'est pareil pour la légende de l'illustration.
Autre détail à ce sujet... dans chaque paragraphe, s'il s'agit de PARAPHRASES des textes que vous avez retrouvés sur des sites web, il faut mentionner la source de base, du style [1] ou [2] etc., renvoyant le lecteur à la bibliographie. Finalement, la bibliographie que vous citez paraît "sortie du rien", vu qu'il n'y a pas mention à ces sites dans le texte (ou en tout cas pas à tous).
Chapitre "1 Définition générale"
La dernière phrase aborde le besoin de favoriser l'accès aux données, etc. A ce sujet, j'ai quelques questions :
- Comment les DR favorisent le partage ?
- Est-ce qu'ils suscitent les chercheurs à les utiliser d'une forme quelconque (mailing, publicité, etc.) ?
- Comment se font-ils connaître des chercheurs ?
Chapitre "2.1 Classification des données"
- La première phrase est trop longue. Elle s'étend sur 4 lignes à l'impression. Il vaut mieux la partager en 2 ou 3 phrases.
- 4e puce de la liste : qu'est-ce qu'un "identifiant universel" ?
Chapitre "3.1 Re3data.org"
- Qu'est-ce qu'un "registre global" ? Est-ce que ce site est aussi un DR ou pas ?
Chapitre "3.2 Autres repositories connus"
- opendoar : même question que sur le mot "registre" ci-dessus
- dryad : mais... est-ce aussi un DR ?
- eudat : est-ce donc une plateforme (du style Moodle) que chaque institution implémente comme elle le souhaite ?
Commentaires d'ensemble (Nicolas S.) -- Nicolas (discussion) 22 janvier 2019 à 22:25 (CET)
Le sujet est bien défini dans la première section.
La question du "référentiel de [base de] données" (fin de première section et deuxième section) est très problématique: d'une part, elle est plagiée sur Wikipédia (avec des tentatives de faire des variations qui parfois changent le sens) ! D'autre part, on ne comprend pas pourquoi tout à coup on aborde la notion de "référentiel de données", sans la définir. La confusion devient totale quand on y met "les données principales du client", qui laissent penser que le référentiel contient les données principales, alors qu'il s'agit des métadonnées. A réécrire totalement donc. En fait, ce qui serait plus cohérent ce serait de faire une partie sur les métadonnées, en expliquant très simplement ce que c'est.
Concernant l'historique, il faudrait préciser les sources.
C’est une bonne idée d’intégrer une carte conceptuelle. Cependant, son objectif n’est pas clair. Il serait plus intéressant de définir une problématique précise à laquelle la carte répond. Aussi, il est possible de suivre les quelques principes pour créer une carte conceptuelle, car il s’agit ici plutôt d’une carte heuristique cf: Carte conceptuelle En l’état, elle met en évidence les points à aborder, mais elle n’est pas suffisamment explicative
Dans la partie "Classification des données", les critères proposés, tirés de Re3data (référence précise manquante), sont plus des données associées à un jeu de donnée, plutôt qu'une liste de types de données (ce qu'évoque "classification des données"). A clarifier.
6.2: OpenDOAR n'est pas un data repositories mais un annuaire. A remonter donc dans ou à côté de 6.1
En 7.2, pour les exemples, on parle des publications. Le terme "data repository" est en effet un peu ambigüe à ce propos, mais l'exemple typique c'est la mise en ligne de données brutes de recherche. C'est d'ailleurs ce qu'on trouve en introduction: "Les data repositories regroupent en premier lieu des données de recherche, à l’état brut ou traitées à différents niveaux.". Il faut refocaliser le 7.2 sur les données de recherche permettant d'écrire les publications.
La partie "Problème" (le titre pourrait être reformulé) doit être clarifiée. On pointe plus un problème de fiabilité de certains data repositories, qu'un problème général des data repositories. Expliquer davantage.