1
Wikidata
Quand Wikipedia s’intéresse aux données
RELIER LES DONNÉES : UN ENJEU MAJEUR POUR
LES USAGES ?
27 MARS 2014, PA...
2
Mais où sont les données dans Wikipedia ?
Wikipedia : une masse insoupçonnée de données structurées
3
Où sont les données ?
4
Où sont les données ?
Etiquette principale de l’entité
5
Où sont les données ?
Etiquette principale de l’entité
Liens Interwikis
6
Où sont les données ?
Etiquette principale de l’entité
Liens Interwikis
Infobox
7
Où sont les données ?
Etiquette principale de l’entité
Liens Interwikis
Image
8
Où sont les données ?
Etiquette principale de l’entité
Liens Interwikis
Image
Donnée
9
Où sont les données ?
Etiquette principale de l’entité
Liens Interwikis
Image
Nature de la donnée
Valeur de la donnée
10
Où sont les données ?
11
Où sont les données ?
Lien vers des notices d’autorités
des bibliothèques
12
Où sont les données ?
Lien vers des pages équivalentes
dans d’autres projets de la
Wikimedia Foundation
Lien vers des n...
13
Où sont les données ?
Lien vers des pages équivalentes
dans d’autres projets de la
Wikimedia Foundation
Lien vers des n...
14
Où sont les données ?
Etiquette principale de l’entité
Liens Interwikis
Infobox
15
Où sont les données ?
Etiquette principale de l’entité
Liens Interwikis
Infobox
Coordonnées géographiques
16
Où sont les données
Lien vers des pages équivalentes
dans d’autres projets de la
Wikimedia Foundation
Catégories
17
Où sont les données ?
18
Où sont les données ?
Liens
Interwikis
19
Où sont les données ?
Liens
Interwikis
Alignement avec un
identifiant d’autorité
20
Où sont les données ?
Liens
Interwikis
Liste de médias associés
et organisés
21
A quoi peuvent servir ces données ?
Wikipedia : un pivot pour relier les données
22
Créer du lien exploitable par les machines
23
Créer du lien exploitable par les machines
24
Créer du lien exploitable par les machines
25
Créer du lien exploitable par les machines
26
Créer du lien exploitable par les machines
27
Créer du lien exploitable par les machines
28
Créer du lien exploitable par les machines
29
Créer du lien exploitable par les machines
30
Pour construire de nouvelles applications
31
32
33
34
35
Créer du lien exploitable par les machines
36
Créer du lien exploitable par les machines
37
Créer du lien exploitable par les machines
38
Créer du lien exploitable par les machines
39
Créer du lien exploitable par les machines
40
Créer du lien exploitable par les machines
41
Créer du lien exploitable par les machines
42
Créer du lien exploitable par les machines
43
Créer du lien exploitable par les machines
44
Pour construire de nouvelles applications
http://labs.antidot.net/widgets/monuments
45
46
47
48
49
Comment récupérer ces données ?
Dbpedia : le pionnier
50
Dbpedia et SemanticPedia
832 000 personnes, 639 000
lieux, 116 000 albums musicaux,
78 000 films...
DBPedia permet de f...
51
Dbpedia : le centre du LOD
De par la nature et la richesse de Wikipedia, Dbpedia est devenu le centre
d’un vaste réseau...
52
Les limites
Données structurées complexes à
modifier dans les Wikipedias
Délai d’attente pour disposer de la mise à
jou...
53
Comment harmoniser les données de
Wikipedia et en faciliter l’édition ?
Wikidata : le petit nouveau
Disclaimer : cette ...
54
Wikidata
Projet officiel de la Wikimedia
Foundation
Développée à partir de 2012 à
l’initiative de l’association
Wikimed...
55
La gestion des liens interlangues
Ancien système Nouveau système
Gestion disséminée (données
dispersées sur 280 Wikipéd...
56
La gestion des liens interlangues
[[af:Victor Hugo]]
[[als:Victor Hugo]]
[[an:Victor Hugo]]
[[ar: ]]
[[arz: ]]
[[ast:Vi...
57
La gestion des infobox
Ancien système Nouveau système
données dispersées (280 Wikipédias) données centralisées
mise à j...
58
La gestion des infobox
{{Infobox Conjoint politique
| nom = Berthe Faure
| image = Faure.1212301544-1-
.jpg
| légende =...
59
Anatomie d’un élément dans Wikidata
libellé (nom, label)
cf.
description
cf.
alias
cf.
liens interlangues
60
Anatomie d’un élément dans Wikidata
affirmation (claim)
propriété (property) valeur (value) éventuellement des qualific...
61
La récupération des données
Négociation de contenu
(XML, RDF/XML, JSON, Turtle…)
API MediaWiki
enrichie
Dump full ou
jo...
62
Outils autour de Wikidata
Permet de faire des
requêtes complexes
sur la base de
données
Résultat au format
JSON.
● http...
63
Outils autour de Wikidata
Mise en page avancée
des données de
Wikidata
http://tools.wmflabs.org/reasonator/
Reasonator
64
Exemple de réutilisation
Les musées de France
Mashup en reliant une
dizaine de jeux de
données dont
Wikidata, data.bnf....
65
MERCI
DES QUESTIONS ?
Prochain SlideShare
Chargement dans…5
×

Wikidata : quand Wikipédia s'intéresse aux données

3 798 vues

Publié le

Diaporama de la présentation effectuée le 27 mars 2014 à Numa (Paris) à l'occasion de la journée "Relier les données : un enjeu majeur pour les usages ?" et du lancement de la plate-forme Datalift

Publié dans : Technologie
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
3 798
Sur SlideShare
0
Issues des intégrations
0
Intégrations
675
Actions
Partages
0
Téléchargements
30
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Wikidata : quand Wikipédia s'intéresse aux données

  1. 1. 1 Wikidata Quand Wikipedia s’intéresse aux données RELIER LES DONNÉES : UN ENJEU MAJEUR POUR LES USAGES ? 27 MARS 2014, PARIS Gautier Poupeau gpoupeau@antidot.net @lespetitescases http://www.lespetitescases.net
  2. 2. 2 Mais où sont les données dans Wikipedia ? Wikipedia : une masse insoupçonnée de données structurées
  3. 3. 3 Où sont les données ?
  4. 4. 4 Où sont les données ? Etiquette principale de l’entité
  5. 5. 5 Où sont les données ? Etiquette principale de l’entité Liens Interwikis
  6. 6. 6 Où sont les données ? Etiquette principale de l’entité Liens Interwikis Infobox
  7. 7. 7 Où sont les données ? Etiquette principale de l’entité Liens Interwikis Image
  8. 8. 8 Où sont les données ? Etiquette principale de l’entité Liens Interwikis Image Donnée
  9. 9. 9 Où sont les données ? Etiquette principale de l’entité Liens Interwikis Image Nature de la donnée Valeur de la donnée
  10. 10. 10 Où sont les données ?
  11. 11. 11 Où sont les données ? Lien vers des notices d’autorités des bibliothèques
  12. 12. 12 Où sont les données ? Lien vers des pages équivalentes dans d’autres projets de la Wikimedia Foundation Lien vers des notices d’autorités des bibliothèques
  13. 13. 13 Où sont les données ? Lien vers des pages équivalentes dans d’autres projets de la Wikimedia Foundation Lien vers des notices d’autorités des bibliothèques Catégories
  14. 14. 14 Où sont les données ? Etiquette principale de l’entité Liens Interwikis Infobox
  15. 15. 15 Où sont les données ? Etiquette principale de l’entité Liens Interwikis Infobox Coordonnées géographiques
  16. 16. 16 Où sont les données Lien vers des pages équivalentes dans d’autres projets de la Wikimedia Foundation Catégories
  17. 17. 17 Où sont les données ?
  18. 18. 18 Où sont les données ? Liens Interwikis
  19. 19. 19 Où sont les données ? Liens Interwikis Alignement avec un identifiant d’autorité
  20. 20. 20 Où sont les données ? Liens Interwikis Liste de médias associés et organisés
  21. 21. 21 A quoi peuvent servir ces données ? Wikipedia : un pivot pour relier les données
  22. 22. 22 Créer du lien exploitable par les machines
  23. 23. 23 Créer du lien exploitable par les machines
  24. 24. 24 Créer du lien exploitable par les machines
  25. 25. 25 Créer du lien exploitable par les machines
  26. 26. 26 Créer du lien exploitable par les machines
  27. 27. 27 Créer du lien exploitable par les machines
  28. 28. 28 Créer du lien exploitable par les machines
  29. 29. 29 Créer du lien exploitable par les machines
  30. 30. 30 Pour construire de nouvelles applications
  31. 31. 31
  32. 32. 32
  33. 33. 33
  34. 34. 34
  35. 35. 35 Créer du lien exploitable par les machines
  36. 36. 36 Créer du lien exploitable par les machines
  37. 37. 37 Créer du lien exploitable par les machines
  38. 38. 38 Créer du lien exploitable par les machines
  39. 39. 39 Créer du lien exploitable par les machines
  40. 40. 40 Créer du lien exploitable par les machines
  41. 41. 41 Créer du lien exploitable par les machines
  42. 42. 42 Créer du lien exploitable par les machines
  43. 43. 43 Créer du lien exploitable par les machines
  44. 44. 44 Pour construire de nouvelles applications http://labs.antidot.net/widgets/monuments
  45. 45. 45
  46. 46. 46
  47. 47. 47
  48. 48. 48
  49. 49. 49 Comment récupérer ces données ? Dbpedia : le pionnier
  50. 50. 50 Dbpedia et SemanticPedia 832 000 personnes, 639 000 lieux, 116 000 albums musicaux, 78 000 films... DBPedia permet de faire des requêtes complexes sur les données de Wikipedia, et de relier d’autres ensembles de données du Web à Wikipedia. http://dbpedia.org Mis au point et maintenu depuis 2006 par Universität Leipzig, Freie Universität Berlin et la société OpenLink Software dans le cadre du projet 4 millions de choses dont : La version française de Dbpedia est maintenue et développée depuis 2013 par Winimics (INRIA) en partenariat avec Wikimedia France et le Ministère de la Culture http://fr.dbpedia.org/
  51. 51. 51 Dbpedia : le centre du LOD De par la nature et la richesse de Wikipedia, Dbpedia est devenu le centre d’un vaste réseau de jeux de données reliées selon les principes du Linked Data
  52. 52. 52 Les limites Données structurées complexes à modifier dans les Wikipedias Délai d’attente pour disposer de la mise à jour (dbpedia mis à jour une fois par an) Données dispersées dans les différentes versions de Dbpedia Dbpedia ne propose pas un niveau de service compatible avec des impératifs de production Complexité de certaines extractions
  53. 53. 53 Comment harmoniser les données de Wikipedia et en faciliter l’édition ? Wikidata : le petit nouveau Disclaimer : cette partie utilise les slides de Coyau (http://commons.wikimedia.org/wiki/File:2013- 09_Introduction_%C3%A0_Wikidata.pdf) disponible en CC-BY-SA. Merci à lui !
  54. 54. 54 Wikidata Projet officiel de la Wikimedia Foundation Développée à partir de 2012 à l’initiative de l’association Wikimedia Deutschland Ouvert à tous Les données sont libres : CC0 Le site est entièrement multilingue Objectif 1er : centraliser et faciliter la maintenance des données structurées des Wikipedias
  55. 55. 55 La gestion des liens interlangues Ancien système Nouveau système Gestion disséminée (données dispersées sur 280 Wikipédias) Gestion centralisée Maintenance par une noria de robots Collecte par robots (sauf ambiguïté), maintenance à la main
  56. 56. 56 La gestion des liens interlangues [[af:Victor Hugo]] [[als:Victor Hugo]] [[an:Victor Hugo]] [[ar: ]] [[arz: ]] [[ast:Victor Hugo]] [[az:Viktor Hüqo]] [[bat-smg:Victor Hugo]] [[ba:Гюго, Виктор]] [[be-x-old:Віктор Юго]] [[be:Віктор Гюго]] [[bg:Виктор Юго]] [[bn: ]] [[br:Victor Hugo]] [[cv:Виктор Гюго]] [[cy:Victor Hugo]] [[da:Victor Hugo]] [[de:Victor Hugo]] [[diq:Victor Hugo]] [[el:Βίκτωρ Ουγκώ]] [[en:Victor Hugo]] Ancien système Wikipédia Nouveau système Wikidata
  57. 57. 57 La gestion des infobox Ancien système Nouveau système données dispersées (280 Wikipédias) données centralisées mise à jour variable selon les Wikipédias gestion simplifiée des données
  58. 58. 58 La gestion des infobox {{Infobox Conjoint politique | nom = Berthe Faure | image = Faure.1212301544-1- .jpg | légende = Dessin supposé de Berthe Faure, debout et de dos, lors du décès de son mari (une du ''[[Le Petit Journal (quotidien)|Petit Journal]]''). | statut = [[Liste des épouses des présidents de la République française|Épouse du {{7e}} président de la République française]] | début = {{date|17|janvier|1895}} | fin = {{date|16|février|1899}}<br /><small>(4 ans et 29 jours)</small> | conjoint = [[Félix Faure]] | prédécesseur = [[Hélène Casimir- Perier]] | successeur = [[Marie-Louise Loubet]] | nom de naissance = Marie-Mathilde Berthe Belluot | date de naissance = {{date de naissance|21|février|1842}} | lieu de naissance = | date de décès = [[1920]] (à 78 ans) | lieu de décès = | profession = }}
  59. 59. 59 Anatomie d’un élément dans Wikidata libellé (nom, label) cf. description cf. alias cf. liens interlangues
  60. 60. 60 Anatomie d’un élément dans Wikidata affirmation (claim) propriété (property) valeur (value) éventuellement des qualificateurs (qualifiers) référence, source (reference, source) rang (rank) déclaration (statement)
  61. 61. 61 La récupération des données Négociation de contenu (XML, RDF/XML, JSON, Turtle…) API MediaWiki enrichie Dump full ou journalier
  62. 62. 62 Outils autour de Wikidata Permet de faire des requêtes complexes sur la base de données Résultat au format JSON. ● http://wikidataquery.eu WikiDataQuery
  63. 63. 63 Outils autour de Wikidata Mise en page avancée des données de Wikidata http://tools.wmflabs.org/reasonator/ Reasonator
  64. 64. 64 Exemple de réutilisation Les musées de France Mashup en reliant une dizaine de jeux de données dont Wikidata, data.bnf.fr, Dbpedia, data.gouv.fr, Wikimedia Commons, Instagram, Twitter… http://labs.antidot.net/museesdefrance/
  65. 65. 65 MERCI DES QUESTIONS ?

×