SlideShare une entreprise Scribd logo
1  sur  36
Télécharger pour lire hors ligne
Wikimedia ♥ Open data
A Love Story
Pierre-Carl Langlais (Wikimédia France)
Alexander Doria (Wikipédia)
@Dorialexander (Twitter)
HotelWikipédia (Rue89)
dimanche 16 mars 14
La Galaxie wikimédia
dimanche 16 mars 14
Une gestion collaborative
dimanche 16 mars 14
Comment le web sémantique a
failli devenir le web 2.0
The SemanticWeb is not a separateWeb but an extension of the
current one, in which information is given well-defined meaning, better
enabling computers and people to work in cooperation.The first steps
in weaving the SemanticWeb into the structure of the existingWeb are
already under way. In the near future, these developments
will usher in significant new functionality as machines become much
better able to process and "understand" the data that they merely
display at present.
Tim Berners-Lee, The SemanticWeb, 2001
dimanche 16 mars 14
Une accélération récente
dimanche 16 mars 14
L’émergence d’un écosystème
de la donnée : le linked-data
dimanche 16 mars 14
L’émergence d’un écosystème
de la donnée : le linked-data
dimanche 16 mars 14
L’open data, au service des
communautés wikimédiennes
dimanche 16 mars 14
Compléter les articles
Les données démographiques françaises sont automatisées
grâce aux données ouvertes de l’INSEE
dimanche 16 mars 14
Garantir la vérifiabilité
Un jeu de donnée de data.gouv cité comme référence dans
l’article sur le « Musée de l’Orangerie »
dimanche 16 mars 14
Encourager le libre accès
La bibliothèqueWikisource envisage d’héberger des références
en libre accès
dimanche 16 mars 14
L’apport des données
wikimédiennes
dimanche 16 mars 14
Une sécurité juridique
dimanche 16 mars 14
Une sécurité juridique
dimanche 16 mars 14
Une bonne indexation
Le code source wikimédien : un terrain de jeu idéal pour le
parsing. Extrait du « Bastards Books of Ruby »
dimanche 16 mars 14
Une couverture exhaustive
Classification du contenu deWikipédia en anglais par
Kittur & Chi (2009)
dimanche 16 mars 14
Des informations fiables
Résumé de l’état de l’art par Piotr Konieczny :
« Wikipedia works in practice, not in theory »
dimanche 16 mars 14
Des utilisations croissantes
La plupart des 7000 articles de recherche consacrés à
Wikipédia recensés par Nicolas Jullien (2012) utilisent
Wikipédia comme une source d’information
dimanche 16 mars 14
Récupérer les données de
Wikipédia : les intermédiaires
dimanche 16 mars 14
Intermédiaires « simples »
API, Dumps, etc.
dimanche 16 mars 14
DBPedia
Un projet d’exploration des données wikipédiennes initiés par
des universitaires allemands en 2007
dimanche 16 mars 14
DBPedia
Le système d’extraction mis en œuvre par DBPedia : une sorte
de parsing amélioré.
dimanche 16 mars 14
DBPedia
Le résultat du parsing
dimanche 16 mars 14
DBPedia Spotlight
Une application permettant de lier rapidement les entités d’un
texte à l’ontologie de DBPedia
dimanche 16 mars 14
Semanticpedia
Une collaboration entre l’État français,Wikimédia France et
l’Inria qui s’inscrit dans la continuité de DBPedia
dimanche 16 mars 14
Semanticpedia
Plusieurs projets spécifiques sont envisagés à partir de la
création de la DBPedia francophone
dimanche 16 mars 14
Semanticpedia
Un exemple d’application emblématique : le Joconde lab
dimanche 16 mars 14
Wikidata
Un projetWikimédia autonome, qui vise à constituer une base
de la connaissance libre
dimanche 16 mars 14
Wikidata
Une coupure progressive avecWikipédia : les imports
automatiques de données deWikipédia, sans source tierces, ne
sont pas recommandés…
dimanche 16 mars 14
Wikidata
Les données sont ajoutées dans une interface spécifique :
un quintuplet sujet-prédicat-objet-qualificateur-références
dimanche 16 mars 14
Un choix philosophique
A challenge is that the traditional « top-down » model of
designing an ontology or schema before developing the data
breaks down at the scale of theWeb: both data and metadata
must constantly evolve, and they must serve many different
communities. Hence there has been a recent movement to
build the SemanticWeb grass-roots-style.
Auer et alii, « DBPedia, a nucleus for a web of open
data », 2007
dimanche 16 mars 14
Des ontologies collaboratives
DBPedia inclut actuellement 529 classes et 2333 propriétés
importées des infobox deWikipédia
dimanche 16 mars 14
Des ontologies collaboratives
L’ontologie deWikidata donne lieu à un débat constant au sein
de la communauté.
dimanche 16 mars 14
Récupérer les données
DBPedia s’inscrit dans la continuité du SemanticWeb duW3C :
requêtes SPARQL et données RDF
dimanche 16 mars 14
Récupérer les données
Wikidata s’appuie sur toute une série d’outils externes
dimanche 16 mars 14
Perspectives
dimanche 16 mars 14

Contenu connexe

Tendances

2 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt20112 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt2011
Fleury Christine
 
Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web Sémantique
Yves Otis
 

Tendances (14)

Réseaux de bibliothèques à l'ère du cloud : que partager ? comment travailler...
Réseaux de bibliothèques à l'ère du cloud : que partager ? comment travailler...Réseaux de bibliothèques à l'ère du cloud : que partager ? comment travailler...
Réseaux de bibliothèques à l'ère du cloud : que partager ? comment travailler...
 
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
Artefacts attestés et conservés, cotes historiques, factices, actuelles... Po...
 
L'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de BiblissimaL'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de Biblissima
 
Introduction à Linked Data
Introduction à Linked DataIntroduction à Linked Data
Introduction à Linked Data
 
Bibliothèques Virtuelles Humanistes
Bibliothèques Virtuelles HumanistesBibliothèques Virtuelles Humanistes
Bibliothèques Virtuelles Humanistes
 
Réseaux de bibliothèques à l'ère du cloud : que partager ? comment travailler...
Réseaux de bibliothèques à l'ère du cloud : que partager ? comment travailler...Réseaux de bibliothèques à l'ère du cloud : que partager ? comment travailler...
Réseaux de bibliothèques à l'ère du cloud : que partager ? comment travailler...
 
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
Les référentiels Biblissima : épine dorsale du portail Biblissima et de IIIF-...
 
Faire de la recherche publique un "bien commun"
Faire de la recherche publique un "bien commun"Faire de la recherche publique un "bien commun"
Faire de la recherche publique un "bien commun"
 
Biblissima : construire un observatoire interopérable pour le Moyen Âge et la...
Biblissima : construire un observatoire interopérable pour le Moyen Âge et la...Biblissima : construire un observatoire interopérable pour le Moyen Âge et la...
Biblissima : construire un observatoire interopérable pour le Moyen Âge et la...
 
J.-B. Claivaz (Uni. Genève) - L'archive ouverte UNIGE. Une archive institutio...
J.-B. Claivaz (Uni. Genève) - L'archive ouverte UNIGE. Une archive institutio...J.-B. Claivaz (Uni. Genève) - L'archive ouverte UNIGE. Une archive institutio...
J.-B. Claivaz (Uni. Genève) - L'archive ouverte UNIGE. Une archive institutio...
 
2 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt20112 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt2011
 
L’indexation des éditions de sources et la conception de base(s) prosopograph...
L’indexation des éditions de sources et la conception de base(s) prosopograph...L’indexation des éditions de sources et la conception de base(s) prosopograph...
L’indexation des éditions de sources et la conception de base(s) prosopograph...
 
Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web Sémantique
 
5@7 AtoS Aix - Open Data en PACA
5@7 AtoS Aix - Open Data en PACA5@7 AtoS Aix - Open Data en PACA
5@7 AtoS Aix - Open Data en PACA
 

Similaire à Wikimedia & open data. A love story

infrastructure numerique_focusweb_cnfpt2011
 infrastructure numerique_focusweb_cnfpt2011 infrastructure numerique_focusweb_cnfpt2011
infrastructure numerique_focusweb_cnfpt2011
Fleury Christine
 
Crepuq presentation web semantique 30 avril
Crepuq presentation web semantique 30 avrilCrepuq presentation web semantique 30 avril
Crepuq presentation web semantique 30 avril
Louise O'Neill
 
2 focus web
2 focus web2 focus web
2 focus web
ABES
 
Formation Culture numerique - Focus sur le Web
Formation Culture numerique -  Focus sur le WebFormation Culture numerique -  Focus sur le Web
Formation Culture numerique - Focus sur le Web
ABES
 
Les sites web des bibliothèques : évolutions et animation
Les sites web des bibliothèques : évolutions et animationLes sites web des bibliothèques : évolutions et animation
Les sites web des bibliothèques : évolutions et animation
Dujol Lionel
 

Similaire à Wikimedia & open data. A love story (20)

DBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du publicDBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du public
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec Wikidata
 
Services intelligents pour le web social et l'internet des objets intro 2017
Services intelligents pour le web social et l'internet des objets   intro 2017Services intelligents pour le web social et l'internet des objets   intro 2017
Services intelligents pour le web social et l'internet des objets intro 2017
 
Le web participatif en bibliotheque publique
Le web participatif en bibliotheque publiqueLe web participatif en bibliotheque publique
Le web participatif en bibliotheque publique
 
infrastructure numerique_focusweb_cnfpt2011
 infrastructure numerique_focusweb_cnfpt2011 infrastructure numerique_focusweb_cnfpt2011
infrastructure numerique_focusweb_cnfpt2011
 
Présentation Comité de projets Inria Sophia
Présentation Comité de projets Inria SophiaPrésentation Comité de projets Inria Sophia
Présentation Comité de projets Inria Sophia
 
Crepuq presentation web semantique 30 avril
Crepuq presentation web semantique 30 avrilCrepuq presentation web semantique 30 avril
Crepuq presentation web semantique 30 avril
 
IIIF et Biblissima
IIIF et BiblissimaIIIF et Biblissima
IIIF et Biblissima
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
 
Generation open — From open access to the scientific commons
Generation open — From open access to the scientific commonsGeneration open — From open access to the scientific commons
Generation open — From open access to the scientific commons
 
2 focus web
2 focus web2 focus web
2 focus web
 
Le web participatif en bibliotheque publique
Le web participatif en bibliotheque publiqueLe web participatif en bibliotheque publique
Le web participatif en bibliotheque publique
 
Formation Culture numerique - Focus sur le Web
Formation Culture numerique -  Focus sur le WebFormation Culture numerique -  Focus sur le Web
Formation Culture numerique - Focus sur le Web
 
Présentation de SemanticPedia à SemWebPro 2012
Présentation de SemanticPedia à SemWebPro 2012Présentation de SemanticPedia à SemWebPro 2012
Présentation de SemanticPedia à SemWebPro 2012
 
Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)
 
Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?
 
Les sites web des bibliothèques : évolutions et animation
Les sites web des bibliothèques : évolutions et animationLes sites web des bibliothèques : évolutions et animation
Les sites web des bibliothèques : évolutions et animation
 
Outils de publications sur le web en bibliothèque
Outils de publications sur le web en bibliothèqueOutils de publications sur le web en bibliothèque
Outils de publications sur le web en bibliothèque
 
La diffusion d'archives à l'aide du Web 2.0, exemple Musée McCord - AAQ 2013
La diffusion d'archives à l'aide du Web 2.0, exemple Musée McCord - AAQ 2013La diffusion d'archives à l'aide du Web 2.0, exemple Musée McCord - AAQ 2013
La diffusion d'archives à l'aide du Web 2.0, exemple Musée McCord - AAQ 2013
 
Bibliothèques et crowdsourcing
Bibliothèques et crowdsourcingBibliothèques et crowdsourcing
Bibliothèques et crowdsourcing
 

Dernier

L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
Faga1939
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
ikospam0
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
ssuserc72852
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
AmgdoulHatim
 

Dernier (18)

La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
Formation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptxFormation qhse - GIASE saqit_105135.pptx
Formation qhse - GIASE saqit_105135.pptx
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
Les roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptxLes roches magmatique géodynamique interne.pptx
Les roches magmatique géodynamique interne.pptx
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
Conférence Sommet de la formation 2024 : Développer des compétences pour la m...
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
Chapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon CoursChapitre 2 du cours de JavaScript. Bon Cours
Chapitre 2 du cours de JavaScript. Bon Cours
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 

Wikimedia & open data. A love story