« Tutoriel wikidata » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
Ligne 111 : Ligne 111 :
== Liens ==
== Liens ==


; Documentation officielle en français
; Documentation officielle en français (structure des entrées)


* [https://www.wikidata.org/wiki/Help:Items/fr Help:Items/fr]
* [https://www.wikidata.org/wiki/Help:Items/fr Help:Items/fr]
Ligne 119 : Ligne 119 :
* [https://www.wikidata.org/wiki/Help:Ranking/fr Help:Ranking/fr]
* [https://www.wikidata.org/wiki/Help:Ranking/fr Help:Ranking/fr]
* [https://www.wikidata.org/wiki/Help:Qualifiers/fr Help:Qualifiers/fr]
* [https://www.wikidata.org/wiki/Help:Qualifiers/fr Help:Qualifiers/fr]
=== Wikidata query service ===
* [https://www.mediawiki.org/wiki/Wikidata_query_service Wikidata query service]
* [https://www.mediawiki.org/wiki/Wikidata_query_service/User_Manual#SPARQL_endpoint Wikidata query service/User Manual]

Version du 7 novembre 2016 à 17:15

Cet article est une ébauche à compléter. Une ébauche est une entrée ayant un contenu (très) maigre et qui a donc besoin d'un auteur.

Introduction

«Wikidata est un projet de la Wikimedia Foundation : une base de données libre, collaborative et multilingue, qui collecte des données structurées pour alimenter Wikipédia, Wikimedia Commons, les autres projets Wikimedia et bien plus encore.» ([https://www.wikidata.org/wiki/Wikidata:Introduction/fr Wikidata:Introduction, nov 2016).

Les données structurées de Wikidata sont libres (Creative Commons Transfert dans le Domaine Public (CC0 1.0)) et multilingues. Les données incluent aussi leurs sources et des liens.

Schéma de données

Chaque entrée dans la base de données est appelé élément (français), item (Anglais) et Objekt (Allemamd). Autrement dit, la base de données et composé d'objets structurées que l'on appelle éléments, entrées ou items.

Chaque item a un identifieur unique (débuant avec la lettre Qqui permet de le retrouver. Par exemple:

Chaque item doit être notable (par exemple se retrouver dans une entrée d'un site de Wikimedia comme Wikipedia, Wiktionary, Wikibooks, WikiNews, etc. Chaque item doit être unique (une seule entrée / item). Ces items peuvent être reliés.

Structure des entrées

Un élément (item) est object structuré qui contient les type de composants suivantes:

  • Le libellé (Angl. label, All. Bezeichnung) définit le nom le plus connu de l'objet.
  • La description (Angl. description, All. Beschreibung) donne une définition courte d'une entrée. Cette description comprends quelques mot, ne constitue pas une phrase et suit quelques règles (minuscules, pas de ponctuation, pas d'articles, pas de phrase).
  • Les alias (All. Alternativnamen) donnent des noms alternatives aux libellés.
  • Les liens de sites incluent un URL et un titre et doivent pointer vers des pages provenant de Wikimedia. Pour chaque langue vous pouvez ajouter un lien par type de site et on peut indiquer la qualité (badge).
  • Les declarations (Angl. statements, All. Aussagen) définissent des propriétés avec une ou plusieurs valeurs. Il s'agit donc des données structurées que l'on a sur un objet.
Exemple de Educational technology:
Statements
Propriété Valeur
industry education
subclass of technology

Types de propriétés et valeurs

Les propriétés sont typées, et aussi définies par des entrées dans wikidata. Par exemple industry est définie dans l'entrée P452) avec le libellé (label) industry, la description industry of company or organization et quelques alias comme field of action ou sector.

Chaque propriété est un type de données, par exemple industry est un item. En novembre 2016, il y avait 11 types dans la liste des types de données

Finalement chaque propriété est à son tour décrit par des déclarations (statements).

Les valeurs

  • Une valeur peut être simple ou multiple

les qualificatifs

  • Les qualificatifs (Angl. qualifiers) permettent de modifier la portée d'un élément, indiquer la manière dont une valeur a été obtenue, mettre des restrictions sur la portée d'une valeur ou inclure d'autres détails nécessaires à l'interprétation de la valeur.

Les références

  • indiquent la source

Les rangs

  • Les rang (Angl. ranking) constituent une mécanique permettant d’annoter plusieurs valeurs pour une déclaration, c-a-d indiquer un statut comme preferred, normal ou deprecated

Utilisation de wikidata

Actuellement, tout le monde peut consulter les entrées et on peut électroniquement accéder aux contenus

API JSON

MediaWiki API

  • Pas très utile dans ce contexte ?

Requêtes structurées

On peu interroger Wikidata avec SPARQL

Exemple pour trouver les plus grandes villes qui ont un maire femme:

#Largest cities with female mayor
#added before 2016-10
SELECT DISTINCT ?city ?cityLabel ?mayor ?mayorLabel 
WHERE 
{
	?city wdt:P31/wdt:P279* wd:Q515 .  # find instances of subclasses of city
	?city p:P6 ?statement .            # with a P6 (head of goverment) statement
	?statement ps:P6 ?mayor .          # ... that has the value ?mayor
	?mayor wdt:P21 wd:Q6581072 .       # ... where the ?mayor has P21 (sex or gender) female
	FILTER NOT EXISTS { ?statement pq:P582 ?x }  # ... but the statement has no P582 (end date) qualifier
	 
	# Now select the population value of the ?city
	# (wdt: properties use only statements of "preferred" rank if any, usually meaning "current population")
	?city wdt:P1082 ?population .
	# Optionally, find English labels for city and mayor:
	SERVICE wikibase:label {
		bd:serviceParam wikibase:language "en" .
	}
}
ORDER BY DESC(?population)
LIMIT 10

Requêtes structurées via API

Pas encore implémenté (nov 2016)

Liens

Documentation officielle en français (structure des entrées)

Wikidata query service