SlideShare une entreprise Scribd logo
1  sur  25
Télécharger pour lire hors ligne
SemanticPedia,
le DBpedia francophone.
            Alexandre Monnin
                     INRIA (Wimmics)
Institut de Recherche et d’Innovation du Centre Pompidou
   Université Paris 1 Panthéon-Sorbonne (PhiCo, EXeCo)
                      CNAM (DICEN)
Dbpedia.org :
principale application du Web de
            données
1-05-2007
31-03-2008
27-03-2009
19-09-2011
Trois acteurs
Pourquoi un nouveau nom ?
Aucune volonté de faire original à tout prix.
O Les outils de DBpedia sont réutilisés,
O L’ingénieur en charge du projet, Julien
  Cojan, est le représentant francophone de
  DBpedia.org,
O Les données de SemanticPedia sont
  disponibles sur fr.dbpedia.org
Mais alors, pourquoi ???
On note également des différences :
O Wikimédia France a ouvert un « Lab » consacré à la
  sémantisation de ses outils. Wikipédia n’est que le
  premier de la liste,
O Le fait est qu'une association comme Wikimédia
  France, dont le but premier est le soutien à Wikipédia
  et aux contributeurs de Wikipédia, met désormais à
  disposition des outils qui vont être utiles à Wikipédia,
  aux contributeurs, et plus globalement qui aident à la
  diffusion et réutilisation de l’encyclopédie.
O Le projet comprend enfin une part d’innovation
  propre
Techniquement
Extracteurs réutilisés
O LabelExtractor
O GeoExtractor
O InfoboxExtractor
O PageLinksExtractor
O WikiPageExtractor
O MappingExtractor
O HomepageExtractor
Extracteurs employés sans
  modifier le code-source
O ArticleCategoriesExtractor
O CategoryLabelExtractor
O ExternalLinksExtractor
O PageIdExtractor
O RedirectExtractor
O RevisionIdExtractor
O SkosCategoriesExtractor
Extracteurs pour lequels de
nouveaux paramètres ont été
          ajoutés
O DisambiguationExtractor
O ImageExtractor
O InterLanguageLinksExtractor
O PndExtractor
O PersondataExtractor
Innovation, retours
d’expériences et améliorations
Un projet mûr
Depuis 2006 les nombreux retours
d’expériences permettent d’envisager de
nouvelles fonctionnalités.
O A titre d’exemple, l’amélioration de la pérennité des
  URIs : d’après Yves Raimond* (BBC) lors de chaque
  mise à jour du dump de DBpedia, 20% des liens
  deviennent caducs. Il est possible de faire mieux
  comme en témoigne Dbpedia lite (et le projet HDA de
  l’IRI).
O L’historique et les pages de discussions font également
  partie du périmètre du projet pour mieux refléter le
  caractère contributif de Wikipédia.
Dernièrement, un alignement entre les
données de DBpedia lite, DBpedia, Freebase a
été entrepris sur DBpedia lite. Cela fait
également parti des possibilités envisagées.
Quels liens entre Wikimédia
 France et SemanticPedia ?
L’enrichissement va dans les
          deux sens
O Le traitement des templates, infobox et autres
  licences sur Wikipédia est complexe. L’aide de la
  communauté s’avère indispensable.
O A l’inverse, les premiers dumps de
  SemanticPedia ont permis de mesurer le
  nombre d’entrées en français ne disposant pas
  de liens interlangues avec d’autres versions de
  Wikipédia en langues étrangères : plus de 400
  000 sur un corpus de 1 200 000 articles (soit
  1/3 du total !).
Créer un écosystème viable
O Parmi les retours d’expériences glanés certains l’ont
  été durant le séminaire muséologie organisé par l’IRI
  et financé par le Ministère de la Culture,
O Le projet HDA-BO & Lab entend sensibiliser les
  institutions culturelles aux apports du tagging
  sémantique grâce à SemanticPedia/Dbpedia tout en
  proposant un enrichissement du corpus de Wikipédia
O L’IRI et Alcatel Bell Labs lancent un projet pour le
  mois de septembre autour de la sémantisation des
  données « sociale » de Wikipédia avec pour objectif
  de mettre au point un système de suivi des articles
  de Wikipédia et de notification afin de s’assurer de la
  pertinence d’une URI de DBpedia dans le temps.
Conclusion
O De plus en plus d’institutions culturelles
  travaillent avec Wikimédia France, il y a fort
  à parier que le mouvement se poursuivra de
  plus belle grâce SemanticPedia.
O L’apport des entreprises est attendu pour
  enrichir l’écosystème décrit tantôt, par
  exemple en connectant SemanticPedia à
  d’autres corpus et ontologies, plus
  spécialisés.
P.S. : un vœu




Espérons que l’enrichissement demeurera
mutuel, tant que faire se peut !
Merci !*
*Tout particulièrement à Bertrand
Sajus, Fabien Gandon, Julien Cojan,
Adrienne Alix et Thibault Grouas.

Contenu connexe

En vedette

Du cycle de vie des données au cycle de vie des objets. Disputatio : Wikipédi...
Du cycle de vie des données au cycle de vie des objets. Disputatio : Wikipédi...Du cycle de vie des données au cycle de vie des objets. Disputatio : Wikipédi...
Du cycle de vie des données au cycle de vie des objets. Disputatio : Wikipédi...Alexandre Monnin
 
Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...Alexandre Monnin
 
Présentation de Wikisocialedits au lancement de SemanticPedia
Présentation de Wikisocialedits au lancement de SemanticPediaPrésentation de Wikisocialedits au lancement de SemanticPedia
Présentation de Wikisocialedits au lancement de SemanticPediaAlexandre Monnin
 
Présentation du web de données
Présentation du web de donnéesPrésentation du web de données
Présentation du web de donnéesAlexandre Monnin
 
Museums & Mobile Survey 2013
Museums & Mobile Survey 2013Museums & Mobile Survey 2013
Museums & Mobile Survey 2013Loic Tallon
 
Ouvrir un service de lecture sur tablettes et liseuses en bibliothèque
Ouvrir un service de lecture sur tablettes et liseuses en bibliothèqueOuvrir un service de lecture sur tablettes et liseuses en bibliothèque
Ouvrir un service de lecture sur tablettes et liseuses en bibliothèquecatherine muller
 
La ressource Web : dialectique du changement et de la permanence et émergence...
La ressource Web : dialectique du changement et de la permanence et émergence...La ressource Web : dialectique du changement et de la permanence et émergence...
La ressource Web : dialectique du changement et de la permanence et émergence...Alexandre Monnin
 
DBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du publicDBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du publicAlexandre Monnin
 
Supports nomades en bibliothèque
Supports nomades en bibliothèqueSupports nomades en bibliothèque
Supports nomades en bibliothèqueAlice Bernard
 
Livre numérique en bibliothèque publique : s'engager ou se marginaliser
Livre numérique en bibliothèque publique : s'engager ou se marginaliserLivre numérique en bibliothèque publique : s'engager ou se marginaliser
Livre numérique en bibliothèque publique : s'engager ou se marginaliserDujol Lionel
 

En vedette (13)

Du cycle de vie des données au cycle de vie des objets. Disputatio : Wikipédi...
Du cycle de vie des données au cycle de vie des objets. Disputatio : Wikipédi...Du cycle de vie des données au cycle de vie des objets. Disputatio : Wikipédi...
Du cycle de vie des données au cycle de vie des objets. Disputatio : Wikipédi...
 
Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...
 
Tagging thd
Tagging thdTagging thd
Tagging thd
 
Webscience montpellier
Webscience montpellierWebscience montpellier
Webscience montpellier
 
Présentation de Wikisocialedits au lancement de SemanticPedia
Présentation de Wikisocialedits au lancement de SemanticPediaPrésentation de Wikisocialedits au lancement de SemanticPedia
Présentation de Wikisocialedits au lancement de SemanticPedia
 
Présentation du web de données
Présentation du web de donnéesPrésentation du web de données
Présentation du web de données
 
Museums & Mobile Survey 2013
Museums & Mobile Survey 2013Museums & Mobile Survey 2013
Museums & Mobile Survey 2013
 
Ouvrir un service de lecture sur tablettes et liseuses en bibliothèque
Ouvrir un service de lecture sur tablettes et liseuses en bibliothèqueOuvrir un service de lecture sur tablettes et liseuses en bibliothèque
Ouvrir un service de lecture sur tablettes et liseuses en bibliothèque
 
La ressource Web : dialectique du changement et de la permanence et émergence...
La ressource Web : dialectique du changement et de la permanence et émergence...La ressource Web : dialectique du changement et de la permanence et émergence...
La ressource Web : dialectique du changement et de la permanence et émergence...
 
Archilab 2013
Archilab 2013Archilab 2013
Archilab 2013
 
DBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du publicDBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du public
 
Supports nomades en bibliothèque
Supports nomades en bibliothèqueSupports nomades en bibliothèque
Supports nomades en bibliothèque
 
Livre numérique en bibliothèque publique : s'engager ou se marginaliser
Livre numérique en bibliothèque publique : s'engager ou se marginaliserLivre numérique en bibliothèque publique : s'engager ou se marginaliser
Livre numérique en bibliothèque publique : s'engager ou se marginaliser
 

Similaire à Présentation de SemanticPedia à SemWebPro 2012

Actualités et perspectives de IIIF
Actualités et perspectives de IIIFActualités et perspectives de IIIF
Actualités et perspectives de IIIFEquipex Biblissima
 
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)Equipex Biblissima
 
Les chercheurs et wikipédia v1.1 bruno dewailly
Les chercheurs et wikipédia v1.1   bruno dewaillyLes chercheurs et wikipédia v1.1   bruno dewailly
Les chercheurs et wikipédia v1.1 bruno dewaillyBruno2wi
 
Urfist Wiki Version Courte
Urfist Wiki Version CourteUrfist Wiki Version Courte
Urfist Wiki Version CourteDavid Liziard
 
Nouvelles méthodes de développement web avec les technologies centrées doc...
Nouvelles méthodes de développement web avec les technologies centrées doc...Nouvelles méthodes de développement web avec les technologies centrées doc...
Nouvelles méthodes de développement web avec les technologies centrées doc...stsire
 
Wikis & wikipédia du point de vue du bibliothécaire
Wikis & wikipédia du point de vue du bibliothécaireWikis & wikipédia du point de vue du bibliothécaire
Wikis & wikipédia du point de vue du bibliothécaireSylvain Machefert
 
Initiation au web 2.0 : principes et présentation des différents outils
Initiation au web 2.0 : principes et présentation des différents outilsInitiation au web 2.0 : principes et présentation des différents outils
Initiation au web 2.0 : principes et présentation des différents outilsURFIST de Paris
 
Elsevier doc électronique
Elsevier doc électroniqueElsevier doc électronique
Elsevier doc électroniqueBibliolab
 
Elsevier doc électronique
Elsevier doc électroniqueElsevier doc électronique
Elsevier doc électroniqueBibliolab
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataBorderCloud
 
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnementRetour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnementAntoine Blanchard
 
Le web 2.0 pour les bibliothèques
Le web 2.0 pour les bibliothèquesLe web 2.0 pour les bibliothèques
Le web 2.0 pour les bibliothèquesURFIST de Rennes
 
Bibliothèques et crowdsourcing
Bibliothèques et crowdsourcingBibliothèques et crowdsourcing
Bibliothèques et crowdsourcingPauline Moirez
 
Portail Bibliothèque du Finistère BDF29
Portail Bibliothèque du Finistère BDF29Portail Bibliothèque du Finistère BDF29
Portail Bibliothèque du Finistère BDF29Association Bibop
 

Similaire à Présentation de SemanticPedia à SemWebPro 2012 (20)

Actualités et perspectives de IIIF
Actualités et perspectives de IIIFActualités et perspectives de IIIF
Actualités et perspectives de IIIF
 
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
Introduction aux protocoles IIIF. Formation Enssib 23.01.2019 (Régis Robineau)
 
Les chercheurs et wikipédia v1.1 bruno dewailly
Les chercheurs et wikipédia v1.1   bruno dewaillyLes chercheurs et wikipédia v1.1   bruno dewailly
Les chercheurs et wikipédia v1.1 bruno dewailly
 
Urfist Wiki Version Courte
Urfist Wiki Version CourteUrfist Wiki Version Courte
Urfist Wiki Version Courte
 
Nouvelles méthodes de développement web avec les technologies centrées doc...
Nouvelles méthodes de développement web avec les technologies centrées doc...Nouvelles méthodes de développement web avec les technologies centrées doc...
Nouvelles méthodes de développement web avec les technologies centrées doc...
 
Urfist Wiki 2007
Urfist Wiki 2007Urfist Wiki 2007
Urfist Wiki 2007
 
Wikis & wikipédia du point de vue du bibliothécaire
Wikis & wikipédia du point de vue du bibliothécaireWikis & wikipédia du point de vue du bibliothécaire
Wikis & wikipédia du point de vue du bibliothécaire
 
Initiation au web 2.0 : principes et présentation des différents outils
Initiation au web 2.0 : principes et présentation des différents outilsInitiation au web 2.0 : principes et présentation des différents outils
Initiation au web 2.0 : principes et présentation des différents outils
 
Wikis 2008
Wikis 2008Wikis 2008
Wikis 2008
 
Elsevier doc électronique
Elsevier doc électroniqueElsevier doc électronique
Elsevier doc électronique
 
Elsevier doc électronique
Elsevier doc électroniqueElsevier doc électronique
Elsevier doc électronique
 
IIIF et Biblissima
IIIF et BiblissimaIIIF et Biblissima
IIIF et Biblissima
 
Bibliothèques et Web 2.0
Bibliothèques et Web 2.0Bibliothèques et Web 2.0
Bibliothèques et Web 2.0
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec Wikidata
 
Wikis 2008
Wikis 2008Wikis 2008
Wikis 2008
 
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnementRetour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
Retour sur 5 années d'évolution des problématiques IST : rapport d'étonnement
 
Le web 2.0 pour les bibliothèques
Le web 2.0 pour les bibliothèquesLe web 2.0 pour les bibliothèques
Le web 2.0 pour les bibliothèques
 
Bibliothèques et crowdsourcing
Bibliothèques et crowdsourcingBibliothèques et crowdsourcing
Bibliothèques et crowdsourcing
 
Web 2.0
Web 2.0Web 2.0
Web 2.0
 
Portail Bibliothèque du Finistère BDF29
Portail Bibliothèque du Finistère BDF29Portail Bibliothèque du Finistère BDF29
Portail Bibliothèque du Finistère BDF29
 

Plus de Alexandre Monnin

La 5G comme "commun négatif"
La 5G comme "commun négatif"La 5G comme "commun négatif"
La 5G comme "commun négatif"Alexandre Monnin
 
The (de)feasibility of smart cities
The (de)feasibility of smart citiesThe (de)feasibility of smart cities
The (de)feasibility of smart citiesAlexandre Monnin
 
Quel avenir pour le numérique
Quel avenir pour le numériqueQuel avenir pour le numérique
Quel avenir pour le numériqueAlexandre Monnin
 
The Future Web (we can afford)
The Future Web (we can afford)The Future Web (we can afford)
The Future Web (we can afford)Alexandre Monnin
 
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?Alexandre Monnin
 
L'obsolescence à programmer
L'obsolescence à programmer L'obsolescence à programmer
L'obsolescence à programmer Alexandre Monnin
 
Approcher en pragmatiste les mondes en train de se défaire
Approcher en pragmatiste les mondes en train de se défaireApprocher en pragmatiste les mondes en train de se défaire
Approcher en pragmatiste les mondes en train de se défaireAlexandre Monnin
 
​Le numérique est notre futur mais quel est notre avenir ? (R)évolution num...
​Le numérique est notre futur  mais quel est notre avenir ?  (R)évolution num...​Le numérique est notre futur  mais quel est notre avenir ?  (R)évolution num...
​Le numérique est notre futur mais quel est notre avenir ? (R)évolution num...Alexandre Monnin
 
Quel avenir pour le Web et le numérique à l’heure de l’Anthropocène ?
Quel avenir pour le Web et le numérique à  l’heure de l’Anthropocène ? Quel avenir pour le Web et le numérique à  l’heure de l’Anthropocène ?
Quel avenir pour le Web et le numérique à l’heure de l’Anthropocène ? Alexandre Monnin
 
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)Alexandre Monnin
 
 Asynchronous futures: Digital technologies at the time of the Anthropocene
 Asynchronous futures: Digital technologies at the time of the Anthropocene Asynchronous futures: Digital technologies at the time of the Anthropocene
 Asynchronous futures: Digital technologies at the time of the AnthropoceneAlexandre Monnin
 
La question de la durabilité des technologies de calcul et de télécommunication
La question de la durabilité des technologies de calcul et de télécommunicationLa question de la durabilité des technologies de calcul et de télécommunication
La question de la durabilité des technologies de calcul et de télécommunicationAlexandre Monnin
 
Le monde devient numérique, a-t-il les moyens de le rester ?
Le monde devient numérique, a-t-il les moyens de le rester ?Le monde devient numérique, a-t-il les moyens de le rester ?
Le monde devient numérique, a-t-il les moyens de le rester ?Alexandre Monnin
 
A quoi peuvent servir les technologies « smart » en regard d’une vision réa...
A quoi peuvent servir les  technologies « smart » en regard  d’une vision réa...A quoi peuvent servir les  technologies « smart » en regard  d’une vision réa...
A quoi peuvent servir les technologies « smart » en regard d’une vision réa...Alexandre Monnin
 
Transition numérique et effondrement écologique : quel monde d'après ?
Transition numérique et effondrement écologique : quel monde d'après ?Transition numérique et effondrement écologique : quel monde d'après ?
Transition numérique et effondrement écologique : quel monde d'après ?Alexandre Monnin
 
Façonner les données. Travail et valeur de l'information
Façonner les données. Travail et valeur de l'informationFaçonner les données. Travail et valeur de l'information
Façonner les données. Travail et valeur de l'informationAlexandre Monnin
 
Routines et improvisation, à propos de Computation and Human Experience de Ph...
Routines et improvisation, à propos de Computation and Human Experience de Ph...Routines et improvisation, à propos de Computation and Human Experience de Ph...
Routines et improvisation, à propos de Computation and Human Experience de Ph...Alexandre Monnin
 
The Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
The Knowledge ecology: Epistemic Credit and the Technologically Extended MindThe Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
The Knowledge ecology: Epistemic Credit and the Technologically Extended MindAlexandre Monnin
 

Plus de Alexandre Monnin (20)

La 5G comme "commun négatif"
La 5G comme "commun négatif"La 5G comme "commun négatif"
La 5G comme "commun négatif"
 
The (de)feasibility of smart cities
The (de)feasibility of smart citiesThe (de)feasibility of smart cities
The (de)feasibility of smart cities
 
What Future for ICT?
What Future for ICT?What Future for ICT?
What Future for ICT?
 
Quel avenir pour le numérique
Quel avenir pour le numériqueQuel avenir pour le numérique
Quel avenir pour le numérique
 
The Future Web (we can afford)
The Future Web (we can afford)The Future Web (we can afford)
The Future Web (we can afford)
 
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?
 
L'obsolescence à programmer
L'obsolescence à programmer L'obsolescence à programmer
L'obsolescence à programmer
 
Approcher en pragmatiste les mondes en train de se défaire
Approcher en pragmatiste les mondes en train de se défaireApprocher en pragmatiste les mondes en train de se défaire
Approcher en pragmatiste les mondes en train de se défaire
 
​Le numérique est notre futur mais quel est notre avenir ? (R)évolution num...
​Le numérique est notre futur  mais quel est notre avenir ?  (R)évolution num...​Le numérique est notre futur  mais quel est notre avenir ?  (R)évolution num...
​Le numérique est notre futur mais quel est notre avenir ? (R)évolution num...
 
Cours sur REST
Cours sur RESTCours sur REST
Cours sur REST
 
Quel avenir pour le Web et le numérique à l’heure de l’Anthropocène ?
Quel avenir pour le Web et le numérique à  l’heure de l’Anthropocène ? Quel avenir pour le Web et le numérique à  l’heure de l’Anthropocène ?
Quel avenir pour le Web et le numérique à l’heure de l’Anthropocène ?
 
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)
 
 Asynchronous futures: Digital technologies at the time of the Anthropocene
 Asynchronous futures: Digital technologies at the time of the Anthropocene Asynchronous futures: Digital technologies at the time of the Anthropocene
 Asynchronous futures: Digital technologies at the time of the Anthropocene
 
La question de la durabilité des technologies de calcul et de télécommunication
La question de la durabilité des technologies de calcul et de télécommunicationLa question de la durabilité des technologies de calcul et de télécommunication
La question de la durabilité des technologies de calcul et de télécommunication
 
Le monde devient numérique, a-t-il les moyens de le rester ?
Le monde devient numérique, a-t-il les moyens de le rester ?Le monde devient numérique, a-t-il les moyens de le rester ?
Le monde devient numérique, a-t-il les moyens de le rester ?
 
A quoi peuvent servir les technologies « smart » en regard d’une vision réa...
A quoi peuvent servir les  technologies « smart » en regard  d’une vision réa...A quoi peuvent servir les  technologies « smart » en regard  d’une vision réa...
A quoi peuvent servir les technologies « smart » en regard d’une vision réa...
 
Transition numérique et effondrement écologique : quel monde d'après ?
Transition numérique et effondrement écologique : quel monde d'après ?Transition numérique et effondrement écologique : quel monde d'après ?
Transition numérique et effondrement écologique : quel monde d'après ?
 
Façonner les données. Travail et valeur de l'information
Façonner les données. Travail et valeur de l'informationFaçonner les données. Travail et valeur de l'information
Façonner les données. Travail et valeur de l'information
 
Routines et improvisation, à propos de Computation and Human Experience de Ph...
Routines et improvisation, à propos de Computation and Human Experience de Ph...Routines et improvisation, à propos de Computation and Human Experience de Ph...
Routines et improvisation, à propos de Computation and Human Experience de Ph...
 
The Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
The Knowledge ecology: Epistemic Credit and the Technologically Extended MindThe Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
The Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
 

Présentation de SemanticPedia à SemWebPro 2012

  • 1. SemanticPedia, le DBpedia francophone. Alexandre Monnin INRIA (Wimmics) Institut de Recherche et d’Innovation du Centre Pompidou Université Paris 1 Panthéon-Sorbonne (PhiCo, EXeCo) CNAM (DICEN)
  • 8. Pourquoi un nouveau nom ? Aucune volonté de faire original à tout prix. O Les outils de DBpedia sont réutilisés, O L’ingénieur en charge du projet, Julien Cojan, est le représentant francophone de DBpedia.org, O Les données de SemanticPedia sont disponibles sur fr.dbpedia.org
  • 9. Mais alors, pourquoi ??? On note également des différences : O Wikimédia France a ouvert un « Lab » consacré à la sémantisation de ses outils. Wikipédia n’est que le premier de la liste, O Le fait est qu'une association comme Wikimédia France, dont le but premier est le soutien à Wikipédia et aux contributeurs de Wikipédia, met désormais à disposition des outils qui vont être utiles à Wikipédia, aux contributeurs, et plus globalement qui aident à la diffusion et réutilisation de l’encyclopédie. O Le projet comprend enfin une part d’innovation propre
  • 11. Extracteurs réutilisés O LabelExtractor O GeoExtractor O InfoboxExtractor O PageLinksExtractor O WikiPageExtractor O MappingExtractor O HomepageExtractor
  • 12. Extracteurs employés sans modifier le code-source O ArticleCategoriesExtractor O CategoryLabelExtractor O ExternalLinksExtractor O PageIdExtractor O RedirectExtractor O RevisionIdExtractor O SkosCategoriesExtractor
  • 13. Extracteurs pour lequels de nouveaux paramètres ont été ajoutés O DisambiguationExtractor O ImageExtractor O InterLanguageLinksExtractor O PndExtractor O PersondataExtractor
  • 15. Un projet mûr Depuis 2006 les nombreux retours d’expériences permettent d’envisager de nouvelles fonctionnalités. O A titre d’exemple, l’amélioration de la pérennité des URIs : d’après Yves Raimond* (BBC) lors de chaque mise à jour du dump de DBpedia, 20% des liens deviennent caducs. Il est possible de faire mieux comme en témoigne Dbpedia lite (et le projet HDA de l’IRI). O L’historique et les pages de discussions font également partie du périmètre du projet pour mieux refléter le caractère contributif de Wikipédia.
  • 16.
  • 17. Dernièrement, un alignement entre les données de DBpedia lite, DBpedia, Freebase a été entrepris sur DBpedia lite. Cela fait également parti des possibilités envisagées.
  • 18. Quels liens entre Wikimédia France et SemanticPedia ?
  • 19. L’enrichissement va dans les deux sens O Le traitement des templates, infobox et autres licences sur Wikipédia est complexe. L’aide de la communauté s’avère indispensable. O A l’inverse, les premiers dumps de SemanticPedia ont permis de mesurer le nombre d’entrées en français ne disposant pas de liens interlangues avec d’autres versions de Wikipédia en langues étrangères : plus de 400 000 sur un corpus de 1 200 000 articles (soit 1/3 du total !).
  • 21. O Parmi les retours d’expériences glanés certains l’ont été durant le séminaire muséologie organisé par l’IRI et financé par le Ministère de la Culture, O Le projet HDA-BO & Lab entend sensibiliser les institutions culturelles aux apports du tagging sémantique grâce à SemanticPedia/Dbpedia tout en proposant un enrichissement du corpus de Wikipédia O L’IRI et Alcatel Bell Labs lancent un projet pour le mois de septembre autour de la sémantisation des données « sociale » de Wikipédia avec pour objectif de mettre au point un système de suivi des articles de Wikipédia et de notification afin de s’assurer de la pertinence d’une URI de DBpedia dans le temps.
  • 23. O De plus en plus d’institutions culturelles travaillent avec Wikimédia France, il y a fort à parier que le mouvement se poursuivra de plus belle grâce SemanticPedia. O L’apport des entreprises est attendu pour enrichir l’écosystème décrit tantôt, par exemple en connectant SemanticPedia à d’autres corpus et ontologies, plus spécialisés.
  • 24. P.S. : un vœu Espérons que l’enrichissement demeurera mutuel, tant que faire se peut !
  • 25. Merci !* *Tout particulièrement à Bertrand Sajus, Fabien Gandon, Julien Cojan, Adrienne Alix et Thibault Grouas.