Wikimedia ♥ Open data
A Love Story
Pierre-Carl Langlais (Wikimédia France)
Alexander Doria (Wikipédia)
@Dorialexander (Twi...
La Galaxie wikimédia
dimanche 16 mars 14
Une gestion collaborative
dimanche 16 mars 14
Comment le web sémantique a
failli devenir le web 2.0
The SemanticWeb is not a separateWeb but an extension of the
current...
Une accélération récente
dimanche 16 mars 14
L’émergence d’un écosystème
de la donnée : le linked-data
dimanche 16 mars 14
L’émergence d’un écosystème
de la donnée : le linked-data
dimanche 16 mars 14
L’open data, au service des
communautés wikimédiennes
dimanche 16 mars 14
Compléter les articles
Les données démographiques françaises sont automatisées
grâce aux données ouvertes de l’INSEE
diman...
Garantir la vérifiabilité
Un jeu de donnée de data.gouv cité comme référence dans
l’article sur le « Musée de l’Orangerie »...
Encourager le libre accès
La bibliothèqueWikisource envisage d’héberger des références
en libre accès
dimanche 16 mars 14
L’apport des données
wikimédiennes
dimanche 16 mars 14
Une sécurité juridique
dimanche 16 mars 14
Une sécurité juridique
dimanche 16 mars 14
Une bonne indexation
Le code source wikimédien : un terrain de jeu idéal pour le
parsing. Extrait du « Bastards Books of R...
Une couverture exhaustive
Classification du contenu deWikipédia en anglais par
Kittur & Chi (2009)
dimanche 16 mars 14
Des informations fiables
Résumé de l’état de l’art par Piotr Konieczny :
« Wikipedia works in practice, not in theory »
dim...
Des utilisations croissantes
La plupart des 7000 articles de recherche consacrés à
Wikipédia recensés par Nicolas Jullien ...
Récupérer les données de
Wikipédia : les intermédiaires
dimanche 16 mars 14
Intermédiaires « simples »
API, Dumps, etc.
dimanche 16 mars 14
DBPedia
Un projet d’exploration des données wikipédiennes initiés par
des universitaires allemands en 2007
dimanche 16 mar...
DBPedia
Le système d’extraction mis en œuvre par DBPedia : une sorte
de parsing amélioré.
dimanche 16 mars 14
DBPedia
Le résultat du parsing
dimanche 16 mars 14
DBPedia Spotlight
Une application permettant de lier rapidement les entités d’un
texte à l’ontologie de DBPedia
dimanche 1...
Semanticpedia
Une collaboration entre l’État français,Wikimédia France et
l’Inria qui s’inscrit dans la continuité de DBPe...
Semanticpedia
Plusieurs projets spécifiques sont envisagés à partir de la
création de la DBPedia francophone
dimanche 16 ma...
Semanticpedia
Un exemple d’application emblématique : le Joconde lab
dimanche 16 mars 14
Wikidata
Un projetWikimédia autonome, qui vise à constituer une base
de la connaissance libre
dimanche 16 mars 14
Wikidata
Une coupure progressive avecWikipédia : les imports
automatiques de données deWikipédia, sans source tierces, ne
...
Wikidata
Les données sont ajoutées dans une interface spécifique :
un quintuplet sujet-prédicat-objet-qualificateur-référenc...
Un choix philosophique
A challenge is that the traditional « top-down » model of
designing an ontology or schema before de...
Des ontologies collaboratives
DBPedia inclut actuellement 529 classes et 2333 propriétés
importées des infobox deWikipédia...
Des ontologies collaboratives
L’ontologie deWikidata donne lieu à un débat constant au sein
de la communauté.
dimanche 16 ...
Récupérer les données
DBPedia s’inscrit dans la continuité du SemanticWeb duW3C :
requêtes SPARQL et données RDF
dimanche ...
Récupérer les données
Wikidata s’appuie sur toute une série d’outils externes
dimanche 16 mars 14
Perspectives
dimanche 16 mars 14
Prochain SlideShare
Chargement dans…5
×

Wikimedia & open data. A love story

960 vues

Publié le

Presentation for the 2014 edition of So Data, a French annual conference on data science. It adresses mostly the positive relationship between the Wikimedia projects and the semantic open data movement and provides a brief introduction to DBPedia, Semanticpedia and Wikidata.

Publié dans : Formation
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
960
Sur SlideShare
0
Issues des intégrations
0
Intégrations
45
Actions
Partages
0
Téléchargements
5
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Wikimedia & open data. A love story

  1. 1. Wikimedia ♥ Open data A Love Story Pierre-Carl Langlais (Wikimédia France) Alexander Doria (Wikipédia) @Dorialexander (Twitter) HotelWikipédia (Rue89) dimanche 16 mars 14
  2. 2. La Galaxie wikimédia dimanche 16 mars 14
  3. 3. Une gestion collaborative dimanche 16 mars 14
  4. 4. Comment le web sémantique a failli devenir le web 2.0 The SemanticWeb is not a separateWeb but an extension of the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation.The first steps in weaving the SemanticWeb into the structure of the existingWeb are already under way. In the near future, these developments will usher in significant new functionality as machines become much better able to process and "understand" the data that they merely display at present. Tim Berners-Lee, The SemanticWeb, 2001 dimanche 16 mars 14
  5. 5. Une accélération récente dimanche 16 mars 14
  6. 6. L’émergence d’un écosystème de la donnée : le linked-data dimanche 16 mars 14
  7. 7. L’émergence d’un écosystème de la donnée : le linked-data dimanche 16 mars 14
  8. 8. L’open data, au service des communautés wikimédiennes dimanche 16 mars 14
  9. 9. Compléter les articles Les données démographiques françaises sont automatisées grâce aux données ouvertes de l’INSEE dimanche 16 mars 14
  10. 10. Garantir la vérifiabilité Un jeu de donnée de data.gouv cité comme référence dans l’article sur le « Musée de l’Orangerie » dimanche 16 mars 14
  11. 11. Encourager le libre accès La bibliothèqueWikisource envisage d’héberger des références en libre accès dimanche 16 mars 14
  12. 12. L’apport des données wikimédiennes dimanche 16 mars 14
  13. 13. Une sécurité juridique dimanche 16 mars 14
  14. 14. Une sécurité juridique dimanche 16 mars 14
  15. 15. Une bonne indexation Le code source wikimédien : un terrain de jeu idéal pour le parsing. Extrait du « Bastards Books of Ruby » dimanche 16 mars 14
  16. 16. Une couverture exhaustive Classification du contenu deWikipédia en anglais par Kittur & Chi (2009) dimanche 16 mars 14
  17. 17. Des informations fiables Résumé de l’état de l’art par Piotr Konieczny : « Wikipedia works in practice, not in theory » dimanche 16 mars 14
  18. 18. Des utilisations croissantes La plupart des 7000 articles de recherche consacrés à Wikipédia recensés par Nicolas Jullien (2012) utilisent Wikipédia comme une source d’information dimanche 16 mars 14
  19. 19. Récupérer les données de Wikipédia : les intermédiaires dimanche 16 mars 14
  20. 20. Intermédiaires « simples » API, Dumps, etc. dimanche 16 mars 14
  21. 21. DBPedia Un projet d’exploration des données wikipédiennes initiés par des universitaires allemands en 2007 dimanche 16 mars 14
  22. 22. DBPedia Le système d’extraction mis en œuvre par DBPedia : une sorte de parsing amélioré. dimanche 16 mars 14
  23. 23. DBPedia Le résultat du parsing dimanche 16 mars 14
  24. 24. DBPedia Spotlight Une application permettant de lier rapidement les entités d’un texte à l’ontologie de DBPedia dimanche 16 mars 14
  25. 25. Semanticpedia Une collaboration entre l’État français,Wikimédia France et l’Inria qui s’inscrit dans la continuité de DBPedia dimanche 16 mars 14
  26. 26. Semanticpedia Plusieurs projets spécifiques sont envisagés à partir de la création de la DBPedia francophone dimanche 16 mars 14
  27. 27. Semanticpedia Un exemple d’application emblématique : le Joconde lab dimanche 16 mars 14
  28. 28. Wikidata Un projetWikimédia autonome, qui vise à constituer une base de la connaissance libre dimanche 16 mars 14
  29. 29. Wikidata Une coupure progressive avecWikipédia : les imports automatiques de données deWikipédia, sans source tierces, ne sont pas recommandés… dimanche 16 mars 14
  30. 30. Wikidata Les données sont ajoutées dans une interface spécifique : un quintuplet sujet-prédicat-objet-qualificateur-références dimanche 16 mars 14
  31. 31. Un choix philosophique A challenge is that the traditional « top-down » model of designing an ontology or schema before developing the data breaks down at the scale of theWeb: both data and metadata must constantly evolve, and they must serve many different communities. Hence there has been a recent movement to build the SemanticWeb grass-roots-style. Auer et alii, « DBPedia, a nucleus for a web of open data », 2007 dimanche 16 mars 14
  32. 32. Des ontologies collaboratives DBPedia inclut actuellement 529 classes et 2333 propriétés importées des infobox deWikipédia dimanche 16 mars 14
  33. 33. Des ontologies collaboratives L’ontologie deWikidata donne lieu à un débat constant au sein de la communauté. dimanche 16 mars 14
  34. 34. Récupérer les données DBPedia s’inscrit dans la continuité du SemanticWeb duW3C : requêtes SPARQL et données RDF dimanche 16 mars 14
  35. 35. Récupérer les données Wikidata s’appuie sur toute une série d’outils externes dimanche 16 mars 14
  36. 36. Perspectives dimanche 16 mars 14

×