SlideShare une entreprise Scribd logo
1  sur  36
Télécharger pour lire hors ligne
Une	
  introduc,on	
  	
  
au	
  web	
  de	
  données	
  
Vers	
  une	
  infrastructure	
  pour	
  	
  
la	
  valorisa,on	
  des	
  archives	
  ?	
  	
    	
  
Pierre-­‐Antoine	
  Champin	
  
Yannick	
  Prié	
  

LIRIS	
  –	
  UMR	
  5205	
  CNRS	
  	
  
Université	
  Claude	
  Bernard	
  Lyon	
  1	
  
Plan	
  
•  Principes	
  
•  Mise	
  en	
  œuvre	
  
•  Applica,ons	
  
Plan	
  
•  Principes	
  
•  Mise	
  en	
  œuvre	
  
•  Applica,ons	
  
La	
  vision	
  du	
  web	
  séman,que	
  
    •  Passer	
  d’un	
  web…	
  
         – Lisible	
  par	
  les	
  humains	
  
         – Affichable	
  par	
  les	
  
           machines	
  
         – «	
  Devinable	
  »	
  
           par	
  les	
  machines	
  




hUp://www.w3.org/2004/Talks/0120-­‐semweb-­‐umich/	
  
La	
  vision	
  du	
  web	
  séman,que	
  
    •  …	
  à	
  d’un	
  web	
  
         – Lisible	
  par	
  les	
  humains	
  
         – Affichable	
  par	
  les	
  
           machines	
  
         – Manipulable	
  
           par	
  les	
  machines	
  




hUp://www.w3.org/2004/Talks/0120-­‐semweb-­‐umich/	
  
Manipulable	
  par	
  les	
  machines	
  ?	
  
•  Calculs,	
  requêtes	
  
   – Schémas,	
  vocabulaires	
  
   →	
  Web	
  de	
  données	
  


•  Inférences,	
  raisonnement	
  
   – Ontologies,	
  règles…	
  
   →	
  Web	
  Séman-que	
  
Vers	
  le	
  Web	
  de	
  données	
  	
  
Vers	
  le	
  Web	
  de	
  données	
  	
  
Vers	
  le	
  Web	
  de	
  données	
  	
  
Vers	
  le	
  Web	
  de	
  données	
  	
  
Vers	
  le	
  Web	
  de	
  données	
  	
  
Vers	
  le	
  Web	
  de	
  données	
  	
  
Plan	
  
•  Principes	
  
•  Mise	
  en	
  œuvre	
  
•  Applica,ons	
  
Principes	
  du	
  Web	
  de	
  données	
  liées	
  
•  Iden,fica,on	
  uniforme	
  des	
  objets	
  d’intérêt	
  
   – URL	
  /	
  URI	
  
•  Récupéra,on	
  uniforme	
  de	
  données	
  
   – HTTP	
  
   – RDF	
  
•  Hyperliens	
  entre	
  objets	
  d’intérêt	
  
No,on	
  d’URL/URI	
  
•  Un	
  URL/URI	
  iden-fie	
  une	
  ressource	
  
    – mon	
  CV,	
  la	
  ville	
  de	
  Lyon,	
  Albert	
  Jacquard…	
  
•  Le	
  Web	
  de	
  documents	
  donne	
  accès	
  à	
  des	
  
   représenta,ons	
  de	
  ces	
  ressources	
  
    – Mon	
  CV	
  au	
  format	
  PDF	
  
    – La	
  page	
  web	
  de	
  la	
  ville	
  de	
  Lyon	
  
    – L’ar,cle	
  Wikipedia	
  sur	
  Albert	
  Jacquard	
  
No,on	
  de	
  triplet	
  
•  Expression	
  d’une	
  rela,on	
  entre	
  deux	
  ressources	
  
    –  Lyon	
  est	
  le	
  lieu	
  de	
  naissance	
  d’Albert	
  Jacquard	
  
•  Représentable	
  graphiquement	
  :	
  
                                         LieuDeNaissanceDe	
  

                              Lyon	
                             AlbertJacquard	
  

•  Les deux ressources et la relation (tous les objets d’intérêt)
   sont identifiés par un URI
•  On exprime donc cette information par un triplet d’URIs
          •  http://dbpedia.org/resource/Lyon
          •  http://dbpedia.org/ontology/birthPlace
          •  http://dbpedia.org/resource/AlbertJacquard
Graphe	
  de	
  triplets	
  
•  On	
  fusionne	
  les	
  nœuds	
  portant	
  le	
  même	
  URI	
  
   puisqu’ils	
  iden,fient	
  le	
  même	
  objet	
  

                                                             skos:subject	
  

                                      dbpedia:Albert_Jacquard	
                 category:French_gene,cists	
  
          dbpedia-­‐owl:birthPlaceOf	
  	
  

  dbpedia:Lyon	
                      dbpedia:Albert_Jacquard	
  

                 rdfs:label	
  

  dbpedia:Lyon	
                        «	
  Lyon	
  »	
  
Graphe	
  de	
  triplets	
  
•  On	
  fusionne	
  les	
  nœuds	
  portant	
  le	
  même	
  URI	
  
   puisqu’ils	
  iden,fient	
  le	
  même	
  objet	
  


                                                               skos:subject	
  
                                                                                  category:French_gene,cists	
  
          dbpedia-­‐owl:birthPlaceOf	
  	
  

  dbpedia:Lyon	
                        dbpedia:Albert_Jacquard	
  

                       rdfs:label	
  

                                          «	
  Lyon	
  »	
  
Graphe	
  de	
  triplets	
  




hUp://relfinder.dbpedia.org/relfinder.html	
  
SPARQL	
  
•  Langage	
  de	
  requête	
  pour	
  trouver	
  des	
  informa,ons	
  
   dans	
  un	
  graphe	
  
•  Exemple	
  :	
  «	
  Trouver	
  les	
  personnes	
  nées	
  à	
  Lyon	
  
   pendant	
  les	
  années	
  20	
  ?	
  ,	
  avec	
  le	
  cas	
  échéant	
  leur	
  
   date	
  de	
  décès.	
  »	
  

                           dbpedia-­‐owl:birthPlace	
  	
       Lyon	
  

                                  dbpedia-­‐owl:birthDate	
  
              ?	
  p	
                                                         1920	
  <=	
  ?bd	
  <	
  1930	
  


                                                                 ?	
  dd	
  
                           dbpedia-­‐owl:deathDate	
  	
  

                                                                                   hUp://,nyurl.com/2dcsokd	
  
Source	
  d’informa,on,	
  	
  
                     provenance,	
  confiance	
  
•  Agréger	
  des	
  données	
  provenant	
  de	
  plusieurs	
  sources	
  
   nécessite	
  de	
  pouvoir	
  
    –  tracer	
  la	
  provenance	
  des	
  informa,ons	
  
    –  exclure	
  /	
  favoriser	
  certaines	
  sources	
  
    –  qualifier	
  la	
  qualité	
  du	
  résultat	
  final	
  
•  Exemple	
  d’applica,on	
  u,lisant	
  la	
  no,on	
  de	
  
   provenance	
  :	
  
    –  hUp://sig.ma/	
  
Schémas	
  et	
  ontologies	
  
•  RDF	
  définit	
  une	
  syntaxe	
  permeUant	
  de	
  décrire	
  des	
  
   graphes	
  de	
  données	
  
•  Il	
  faut	
  également	
  pouvoir	
  définir	
  le(s)	
  lexique(s)	
  qui	
  
   vont	
  servir	
  à	
  peupler	
  ces	
  graphes	
  de	
  données	
  
•  Plusieurs	
  standards	
  complémentaires	
  
    –  SKOS	
  (thesaurii)	
  
    –  RDF-­‐Schema	
  (schémas,	
  ontologies	
  simples)	
  
    –  OWL	
  (ontologies	
  riches)	
  
SKOS	
  
•  Simple	
  Knowledge	
  Organiza,on	
  System	
  
•  hUp://www.w3.org/2004/02/skos/	
  
•  Descrip,on	
  de	
  thesaurii	
  
    –  Concepts,	
  rela,ons	
  séman,ques	
  et	
  associa,ves	
  
    –  Documenta,on	
  (libellé,	
  notes)	
  
    –  Interopérabilité	
  (alignement	
  de	
  thesaurii)	
  
•  Pas	
  de	
  séman,que	
  formelle	
  associée	
  aux	
  concepts	
  
   eux	
  mêmes	
  
RDF-­‐Schema	
  
•  hUp://www.w3.org/TR/rdf-­‐schema/	
  
•  Hiérarchie	
  de	
  classes	
  et	
  de	
  rela,ons	
  
    – tout	
  CV	
  est	
  un	
  Document,	
  toute	
  Personne	
  est	
  un	
  
      Agent	
  
    – tout	
  auteur	
  est	
  un	
  contributeur	
  
•  Domaine	
  et	
  portée	
  des	
  rela,ons	
  
    – «	
  contributeur	
  »	
  relie	
  un	
  Document	
  à	
  un	
  Agent	
  
•  Permet	
  quelques	
  inférences	
  
    – l’auteur	
  d’un	
  CV	
  est	
  forcément	
  un	
  Agent	
  
Exemple	
  RDF	
  Schema	
  
                                              domain	
                            range	
  
  Niveau	
  des	
  	
        Document	
                    contributeur	
                           Agent	
  
   schémas	
  
                                      subclass	
                           subproperty	
  

contraignent	
                       CV	
                           auteur	
  
                                                                                                      type	
  
                                               type	
  
   Niveau	
  	
  
 métadonnées	
                    hUp://…/                    auteur	
                 hUp://	
  ….	
  /	
  
                                   cv.html	
                                         pageperso.html	
  

   décrivent	
  



  Niveau	
  des	
  	
  
ressources	
  web	
  
OWL	
  
•  Web	
  Ontology	
  Language	
  
•  hUp://www.w3.org/2004/OWL/	
  
•  Séman,que	
  plus	
  riche	
  pour	
  permeUre	
  plus	
  
   d’inférence	
  
    –  tout	
  Document	
  ayant	
  plusieurs	
  auteurs	
  est	
  un	
  
       DocumentCollec,f	
  
    –  deux	
  Personnes	
  auteurs	
  d’un	
  même	
  Document	
  sont	
  en	
  
       rela,on	
  «	
  co-­‐auteur	
  »	
  
•  Héritage	
  IA,	
  logique	
  formelle	
  
Quelques	
  schémas	
  et	
  ontologies	
  
•  DC	
  (Dublin	
  core)	
  	
  
     –  méta-­‐données	
  de	
  documents	
  
     –  hUp://dublincore.org/	
  
•  FOAF	
  (Friend	
  of	
  a	
  friend)	
  	
  
     –  personnes	
  et	
  réseaux	
  sociaux	
  
     –  hUp://www.foaf-­‐project.org/	
  
•  SIOC	
  (Seman,cally	
  Interlinked	
  Online	
  Communi,es)	
  	
  
     –  sites	
  web	
  collabora,fs	
  
     –  hUp://sioc-­‐project.org/	
  

•  Plus	
  de	
  vocabulaires	
  :	
  
     –  hUp://www.schemaweb.info/	
  
Plan	
  
•  Principes	
  
•  Mise	
  en	
  œuvre	
  
•  Applica,ons	
  
Le	
  Web	
  de	
  données	
  en	
  mars	
  2009	
  




hUp://linkeddata.org/	
  
Europeana	
  
•  Exemple	
  avec	
  naviga,on	
  dans	
  le	
  thésaurus	
  SKOS	
  
   de	
  europeana.	
  
   – hUp://eculture.cs.vu.nl/europeana/session/search	
  
Le	
  Web	
  de	
  données	
  en	
  2010	
  
•  Es,ma,on	
  de	
  Chris	
  Bizer	
  à	
  LDOW	
  2010	
  :	
  
    – 13	
  milliards	
  de	
  triplets	
  (informa,on	
  élémentaire)	
  
    – 150	
  million	
  de	
  liens	
  
•  Facebook	
  lance	
  OpenGraph	
  
    – hUp://opengraphprotocol.org/	
  
    – Annota,on	
  séman,que	
  de	
  n’importe	
  quelle	
  page,	
  
      pour	
  offrir	
  les	
  mêmes	
  fonc,onalités	
  qu’une	
  “page	
  
      Facebook”	
  
    – U,lisant	
  les	
  standards	
  du	
  Web	
  de	
  données	
  (RDFa)	
  
Conclusion	
  (1)	
  




•  Le	
  web	
  de	
  données	
  est	
  en	
  croissance	
  (très)	
  
   forte	
  depuis	
  quelques	
  mois	
  	
  
Conclusion	
  (2)	
  
•  Que	
  doit	
  faire	
  une	
  ins,tu,on	
  pour	
  aller	
  sur	
  le	
  
   web	
  de	
  données	
  ?	
  
    – Exposer	
  ses	
  données	
  en	
  RDF	
  
        •  Annota,on	
  des	
  documents	
  
        •  Adapta,on	
  des	
  données	
  brutes	
  
    – U,liser	
  les	
  données	
  des	
  autres	
  	
  
        •  Lier	
  
        •  Croiser	
  les	
  informa,ons	
  
        •  Construire	
  des	
  mashups	
  
Ques,ons	
  ?	
  
Pointeurs	
  
•  Standards	
  :	
  
    – hUp://www.w3.org/standards/seman,cweb/	
  
•  Sources	
  de	
  données	
  :	
  
    – hUp://dbpedia.org/	
  
•  Ou,ls	
  de	
  visualisa,on,	
  requêtage	
  :	
  	
  
    – hUp://sindice.com/	
  
    – hUp://sameas.org/	
  
Exemple	
  de	
  requête	
  SPARQL	
  
SELECT	
  ?p,	
  ?dd	
  
WHERE	
  {	
  
	
  	
  ?p	
  
	
  	
  	
  	
  	
  	
  dbpedia-­‐owl:birthPlace	
  	
  :Lyon	
  ;	
  
	
  	
  	
  	
  	
  	
  dbpedia-­‐owl:birthDate	
  ?bd	
  .	
  

	
  	
  OPTIONAL	
  {	
  ?p	
  dbpedia-­‐owl:deathDate	
  ?dd	
  	
  }	
  

	
  	
  FILTER	
  (?bd	
  >=	
  "1920"^^xsd:date	
  
	
  	
  	
  	
  	
  	
  	
  &&	
  ?bd	
  <	
  	
  "1930"^^xsd:date)	
  
}	
  

hUp://,nyurl.com/2dcsokd	
  

Contenu connexe

En vedette

Les Portails De BibliothèQue
Les Portails De BibliothèQueLes Portails De BibliothèQue
Les Portails De BibliothèQue
cyberdoc
 
Restitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeRestitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliotheque
Julien Sicot
 
Le catalogue à l'heure du web social
Le catalogue à l'heure du web socialLe catalogue à l'heure du web social
Le catalogue à l'heure du web social
Dujol Lionel
 
Les sites web des bibliothèques : évolutions et animation
Les sites web des bibliothèques : évolutions et animationLes sites web des bibliothèques : évolutions et animation
Les sites web des bibliothèques : évolutions et animation
Dujol Lionel
 
Reflexiones de un bloguero laboralista sobre el empleo y la formación. Recopi...
Reflexiones de un bloguero laboralista sobre el empleo y la formación. Recopi...Reflexiones de un bloguero laboralista sobre el empleo y la formación. Recopi...
Reflexiones de un bloguero laboralista sobre el empleo y la formación. Recopi...
Universidad Autónoma de Barcelona
 
Federico garcía lorca
Federico garcía lorcaFederico garcía lorca
Federico garcía lorca
JOSÉ TOMÁS
 

En vedette (20)

Enjeux Des Catalogues Et Des Portails En BibliothèQue
Enjeux Des Catalogues Et Des Portails En BibliothèQueEnjeux Des Catalogues Et Des Portails En BibliothèQue
Enjeux Des Catalogues Et Des Portails En BibliothèQue
 
Les réseaux sociaux, quels usages ?
Les réseaux sociaux, quels usages ?Les réseaux sociaux, quels usages ?
Les réseaux sociaux, quels usages ?
 
Les coulisses du "non-guide"
Les coulisses du "non-guide"Les coulisses du "non-guide"
Les coulisses du "non-guide"
 
Les Portails De BibliothèQue
Les Portails De BibliothèQueLes Portails De BibliothèQue
Les Portails De BibliothèQue
 
Construire une communication web 2.0 dans une petite bibliothèque
Construire une communication web 2.0 dans une petite bibliothèqueConstruire une communication web 2.0 dans une petite bibliothèque
Construire une communication web 2.0 dans une petite bibliothèque
 
Restitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliothequeRestitution veille sur les portails de bibliotheque
Restitution veille sur les portails de bibliotheque
 
Conception d'un site web
Conception d'un site webConception d'un site web
Conception d'un site web
 
communication et bibliothèque : le plan de communication
communication et bibliothèque : le plan de communicationcommunication et bibliothèque : le plan de communication
communication et bibliothèque : le plan de communication
 
Regard sur la communication des bibliothèques
Regard sur la communication des bibliothèquesRegard sur la communication des bibliothèques
Regard sur la communication des bibliothèques
 
Le catalogue à l'heure du web social
Le catalogue à l'heure du web socialLe catalogue à l'heure du web social
Le catalogue à l'heure du web social
 
Portails, blogs et wikis, des outils pour la médiathèque - CNFPT Corse - sept...
Portails, blogs et wikis, des outils pour la médiathèque - CNFPT Corse - sept...Portails, blogs et wikis, des outils pour la médiathèque - CNFPT Corse - sept...
Portails, blogs et wikis, des outils pour la médiathèque - CNFPT Corse - sept...
 
Créer un Scoop.it pour partager une veille
Créer un Scoop.it pour partager une veilleCréer un Scoop.it pour partager une veille
Créer un Scoop.it pour partager une veille
 
Les sites web des bibliothèques : évolutions et animation
Les sites web des bibliothèques : évolutions et animationLes sites web des bibliothèques : évolutions et animation
Les sites web des bibliothèques : évolutions et animation
 
Quelques exemples de communication de la bibliothèque Louise Michel
Quelques exemples de communication de la bibliothèque Louise MichelQuelques exemples de communication de la bibliothèque Louise Michel
Quelques exemples de communication de la bibliothèque Louise Michel
 
Création de site web de bibliothèque (v3) : la quadrature du cercle?
Création de site web de bibliothèque (v3) : la quadrature du cercle?Création de site web de bibliothèque (v3) : la quadrature du cercle?
Création de site web de bibliothèque (v3) : la quadrature du cercle?
 
Reflexiones de un bloguero laboralista sobre el empleo y la formación. Recopi...
Reflexiones de un bloguero laboralista sobre el empleo y la formación. Recopi...Reflexiones de un bloguero laboralista sobre el empleo y la formación. Recopi...
Reflexiones de un bloguero laboralista sobre el empleo y la formación. Recopi...
 
Lavie 1212891057561590-8
Lavie 1212891057561590-8Lavie 1212891057561590-8
Lavie 1212891057561590-8
 
Meningitis
MeningitisMeningitis
Meningitis
 
Federico garcía lorca
Federico garcía lorcaFederico garcía lorca
Federico garcía lorca
 
Presentation cdi
Presentation cdiPresentation cdi
Presentation cdi
 

Similaire à Une introduction au web de données

Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01
Parc De Camargue
 

Similaire à Une introduction au web de données (20)

Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01
 
Séminaire Inria IST - Référentiels et interoperabilité (1)
Séminaire Inria IST - Référentiels et interoperabilité (1)Séminaire Inria IST - Référentiels et interoperabilité (1)
Séminaire Inria IST - Référentiels et interoperabilité (1)
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens.
 
Omeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériquesOmeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériques
 
Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!! Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!!
 
Adbs2012 presentation
Adbs2012 presentationAdbs2012 presentation
Adbs2012 presentation
 
Nouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèquesNouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèques
 
CRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de donnéesCRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de données
 
Isidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de donnéesIsidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de données
 
Medialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesMedialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donnees
 
Semantic web introduction
Semantic web introductionSemantic web introduction
Semantic web introduction
 
Module 2 Formation des doctorants
Module 2 Formation des doctorantsModule 2 Formation des doctorants
Module 2 Formation des doctorants
 
Jabes 2012 - Tutoriel, vers le Web de données
Jabes 2012 - Tutoriel, vers le Web de donnéesJabes 2012 - Tutoriel, vers le Web de données
Jabes 2012 - Tutoriel, vers le Web de données
 
Linked Open Data
Linked Open DataLinked Open Data
Linked Open Data
 
Du cycle de vie des données au cycle de vie des objets. Disputatio : Wikipédi...
Du cycle de vie des données au cycle de vie des objets. Disputatio : Wikipédi...Du cycle de vie des données au cycle de vie des objets. Disputatio : Wikipédi...
Du cycle de vie des données au cycle de vie des objets. Disputatio : Wikipédi...
 
Skos transformation
Skos transformationSkos transformation
Skos transformation
 
Portails documentaires et référentiels du Web sémantique : exemples et enjeu...
Portails documentaires et  référentiels du Web sémantique : exemples et enjeu...Portails documentaires et  référentiels du Web sémantique : exemples et enjeu...
Portails documentaires et référentiels du Web sémantique : exemples et enjeu...
 
Web sémantique
Web sémantique Web sémantique
Web sémantique
 
Ontologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationOntologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformation
 

Plus de Yannick Prié

Assessing the use of a Trace-Based Synchronous Tool for distant language tut...
Assessing the use of a Trace-Based Synchronous Tool for distant language tut...Assessing the use of a Trace-Based Synchronous Tool for distant language tut...
Assessing the use of a Trace-Based Synchronous Tool for distant language tut...
Yannick Prié
 

Plus de Yannick Prié (15)

Ouvrir les boîtes noires de la mission herschel
Ouvrir les boîtes noires de la mission herschel Ouvrir les boîtes noires de la mission herschel
Ouvrir les boîtes noires de la mission herschel
 
Des usages de lecture à la réingénierie des cours Vers des tableaux de bord ...
Des usages de lecture à la réingénierie des cours  Vers des tableaux de bord ...Des usages de lecture à la réingénierie des cours  Vers des tableaux de bord ...
Des usages de lecture à la réingénierie des cours Vers des tableaux de bord ...
 
Travail intellectuel, traces et réflexivité
Travail intellectuel, traces et réflexivitéTravail intellectuel, traces et réflexivité
Travail intellectuel, traces et réflexivité
 
DEScribe : Descriptive Experience Sampling appliqué au desktop
DEScribe : Descriptive Experience Sampling appliqué au desktopDEScribe : Descriptive Experience Sampling appliqué au desktop
DEScribe : Descriptive Experience Sampling appliqué au desktop
 
Advene : Annotate Digital Vidéo, Echange on the NEt - Journée Arpège
Advene : Annotate Digital Vidéo, Echange on the NEt - Journée ArpègeAdvene : Annotate Digital Vidéo, Echange on the NEt - Journée Arpège
Advene : Annotate Digital Vidéo, Echange on the NEt - Journée Arpège
 
Réintégrations formelles du sens dans le système numérique
Réintégrations formelles du sens dans le système numériqueRéintégrations formelles du sens dans le système numérique
Réintégrations formelles du sens dans le système numérique
 
DIAM : Towards a Model for Describing Appropriation Processes Through the Evo...
DIAM : Towards a Model for Describing Appropriation Processes Through the Evo...DIAM : Towards a Model for Describing Appropriation Processes Through the Evo...
DIAM : Towards a Model for Describing Appropriation Processes Through the Evo...
 
Pour une ingénierie des connaissances dynamiques. Prendre en compte la dynam...
Pour une ingénierie  des connaissances dynamiques. Prendre en compte la dynam...Pour une ingénierie  des connaissances dynamiques. Prendre en compte la dynam...
Pour une ingénierie des connaissances dynamiques. Prendre en compte la dynam...
 
VISU : Une plateforme de visioconférence à base de traces pour le tutorat à d...
VISU : Une plateforme de visioconférence à base de traces pour le tutorat à d...VISU : Une plateforme de visioconférence à base de traces pour le tutorat à d...
VISU : Une plateforme de visioconférence à base de traces pour le tutorat à d...
 
Vers une phénoménologie des inscriptions numériques. Dynamique de l’activité ...
Vers une phénoménologie des inscriptions numériques. Dynamique de l’activité ...Vers une phénoménologie des inscriptions numériques. Dynamique de l’activité ...
Vers une phénoménologie des inscriptions numériques. Dynamique de l’activité ...
 
Assessing the use of a Trace-Based Synchronous Tool for distant language tut...
Assessing the use of a Trace-Based Synchronous Tool for distant language tut...Assessing the use of a Trace-Based Synchronous Tool for distant language tut...
Assessing the use of a Trace-Based Synchronous Tool for distant language tut...
 
Traces numeriques explicites
Traces numeriques explicitesTraces numeriques explicites
Traces numeriques explicites
 
Une introduction au concept d'autopoièse
Une introduction au concept d'autopoièseUne introduction au concept d'autopoièse
Une introduction au concept d'autopoièse
 
Traces numériques, identités, personnalités
Traces numériques, identités, personnalitésTraces numériques, identités, personnalités
Traces numériques, identités, personnalités
 
Réflexivité et visualisation interactive de traces
Réflexivité et visualisation interactive de tracesRéflexivité et visualisation interactive de traces
Réflexivité et visualisation interactive de traces
 

Dernier

Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
AmgdoulHatim
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
ikospam0
 

Dernier (16)

python-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdfpython-Cours Officiel POO Python-m103.pdf
python-Cours Officiel POO Python-m103.pdf
 
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
CompLit - Journal of European Literature, Arts and Society - n. 7 - Table of ...
 
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean EudesNeuvaine de la Pentecôte avec des textes de saint Jean Eudes
Neuvaine de la Pentecôte avec des textes de saint Jean Eudes
 
Télécommunication et transport .pdfcours
Télécommunication et transport .pdfcoursTélécommunication et transport .pdfcours
Télécommunication et transport .pdfcours
 
Cours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiquesCours Généralités sur les systèmes informatiques
Cours Généralités sur les systèmes informatiques
 
les_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhkles_infections_a_streptocoques.pptkioljhk
les_infections_a_streptocoques.pptkioljhk
 
L application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptxL application de la physique classique dans le golf.pptx
L application de la physique classique dans le golf.pptx
 
Bilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdfBilan énergétique des chambres froides.pdf
Bilan énergétique des chambres froides.pdf
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptxCopie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
Copie de Engineering Software Marketing Plan by Slidesgo.pptx.pptx
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
L'expression du but : fiche et exercices niveau C1 FLE
L'expression du but : fiche et exercices  niveau C1 FLEL'expression du but : fiche et exercices  niveau C1 FLE
L'expression du but : fiche et exercices niveau C1 FLE
 
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptxIntégration des TICE dans l'enseignement de la Physique-Chimie.pptx
Intégration des TICE dans l'enseignement de la Physique-Chimie.pptx
 
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANKRAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
RAPPORT DE STAGE D'INTERIM DE ATTIJARIWAFA BANK
 
Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024Echos libraries Burkina Faso newsletter 2024
Echos libraries Burkina Faso newsletter 2024
 
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projetFormation échiquéenne jwhyCHESS, parallèle avec la planification de projet
Formation échiquéenne jwhyCHESS, parallèle avec la planification de projet
 

Une introduction au web de données

  • 1. Une  introduc,on     au  web  de  données   Vers  une  infrastructure  pour     la  valorisa,on  des  archives  ?       Pierre-­‐Antoine  Champin   Yannick  Prié   LIRIS  –  UMR  5205  CNRS     Université  Claude  Bernard  Lyon  1  
  • 2. Plan   •  Principes   •  Mise  en  œuvre   •  Applica,ons  
  • 3. Plan   •  Principes   •  Mise  en  œuvre   •  Applica,ons  
  • 4. La  vision  du  web  séman,que   •  Passer  d’un  web…   – Lisible  par  les  humains   – Affichable  par  les   machines   – «  Devinable  »   par  les  machines   hUp://www.w3.org/2004/Talks/0120-­‐semweb-­‐umich/  
  • 5. La  vision  du  web  séman,que   •  …  à  d’un  web   – Lisible  par  les  humains   – Affichable  par  les   machines   – Manipulable   par  les  machines   hUp://www.w3.org/2004/Talks/0120-­‐semweb-­‐umich/  
  • 6. Manipulable  par  les  machines  ?   •  Calculs,  requêtes   – Schémas,  vocabulaires   →  Web  de  données   •  Inférences,  raisonnement   – Ontologies,  règles…   →  Web  Séman-que  
  • 7. Vers  le  Web  de  données    
  • 8. Vers  le  Web  de  données    
  • 9. Vers  le  Web  de  données    
  • 10. Vers  le  Web  de  données    
  • 11. Vers  le  Web  de  données    
  • 12. Vers  le  Web  de  données    
  • 13. Plan   •  Principes   •  Mise  en  œuvre   •  Applica,ons  
  • 14. Principes  du  Web  de  données  liées   •  Iden,fica,on  uniforme  des  objets  d’intérêt   – URL  /  URI   •  Récupéra,on  uniforme  de  données   – HTTP   – RDF   •  Hyperliens  entre  objets  d’intérêt  
  • 15. No,on  d’URL/URI   •  Un  URL/URI  iden-fie  une  ressource   – mon  CV,  la  ville  de  Lyon,  Albert  Jacquard…   •  Le  Web  de  documents  donne  accès  à  des   représenta,ons  de  ces  ressources   – Mon  CV  au  format  PDF   – La  page  web  de  la  ville  de  Lyon   – L’ar,cle  Wikipedia  sur  Albert  Jacquard  
  • 16. No,on  de  triplet   •  Expression  d’une  rela,on  entre  deux  ressources   –  Lyon  est  le  lieu  de  naissance  d’Albert  Jacquard   •  Représentable  graphiquement  :   LieuDeNaissanceDe   Lyon   AlbertJacquard   •  Les deux ressources et la relation (tous les objets d’intérêt) sont identifiés par un URI •  On exprime donc cette information par un triplet d’URIs •  http://dbpedia.org/resource/Lyon •  http://dbpedia.org/ontology/birthPlace •  http://dbpedia.org/resource/AlbertJacquard
  • 17. Graphe  de  triplets   •  On  fusionne  les  nœuds  portant  le  même  URI   puisqu’ils  iden,fient  le  même  objet   skos:subject   dbpedia:Albert_Jacquard   category:French_gene,cists   dbpedia-­‐owl:birthPlaceOf     dbpedia:Lyon   dbpedia:Albert_Jacquard   rdfs:label   dbpedia:Lyon   «  Lyon  »  
  • 18. Graphe  de  triplets   •  On  fusionne  les  nœuds  portant  le  même  URI   puisqu’ils  iden,fient  le  même  objet   skos:subject   category:French_gene,cists   dbpedia-­‐owl:birthPlaceOf     dbpedia:Lyon   dbpedia:Albert_Jacquard   rdfs:label   «  Lyon  »  
  • 19. Graphe  de  triplets   hUp://relfinder.dbpedia.org/relfinder.html  
  • 20. SPARQL   •  Langage  de  requête  pour  trouver  des  informa,ons   dans  un  graphe   •  Exemple  :  «  Trouver  les  personnes  nées  à  Lyon   pendant  les  années  20  ?  ,  avec  le  cas  échéant  leur   date  de  décès.  »   dbpedia-­‐owl:birthPlace     Lyon   dbpedia-­‐owl:birthDate   ?  p   1920  <=  ?bd  <  1930   ?  dd   dbpedia-­‐owl:deathDate     hUp://,nyurl.com/2dcsokd  
  • 21. Source  d’informa,on,     provenance,  confiance   •  Agréger  des  données  provenant  de  plusieurs  sources   nécessite  de  pouvoir   –  tracer  la  provenance  des  informa,ons   –  exclure  /  favoriser  certaines  sources   –  qualifier  la  qualité  du  résultat  final   •  Exemple  d’applica,on  u,lisant  la  no,on  de   provenance  :   –  hUp://sig.ma/  
  • 22. Schémas  et  ontologies   •  RDF  définit  une  syntaxe  permeUant  de  décrire  des   graphes  de  données   •  Il  faut  également  pouvoir  définir  le(s)  lexique(s)  qui   vont  servir  à  peupler  ces  graphes  de  données   •  Plusieurs  standards  complémentaires   –  SKOS  (thesaurii)   –  RDF-­‐Schema  (schémas,  ontologies  simples)   –  OWL  (ontologies  riches)  
  • 23. SKOS   •  Simple  Knowledge  Organiza,on  System   •  hUp://www.w3.org/2004/02/skos/   •  Descrip,on  de  thesaurii   –  Concepts,  rela,ons  séman,ques  et  associa,ves   –  Documenta,on  (libellé,  notes)   –  Interopérabilité  (alignement  de  thesaurii)   •  Pas  de  séman,que  formelle  associée  aux  concepts   eux  mêmes  
  • 24. RDF-­‐Schema   •  hUp://www.w3.org/TR/rdf-­‐schema/   •  Hiérarchie  de  classes  et  de  rela,ons   – tout  CV  est  un  Document,  toute  Personne  est  un   Agent   – tout  auteur  est  un  contributeur   •  Domaine  et  portée  des  rela,ons   – «  contributeur  »  relie  un  Document  à  un  Agent   •  Permet  quelques  inférences   – l’auteur  d’un  CV  est  forcément  un  Agent  
  • 25. Exemple  RDF  Schema   domain   range   Niveau  des     Document   contributeur   Agent   schémas   subclass   subproperty   contraignent   CV   auteur   type   type   Niveau     métadonnées   hUp://…/ auteur   hUp://  ….  /   cv.html   pageperso.html   décrivent   Niveau  des     ressources  web  
  • 26. OWL   •  Web  Ontology  Language   •  hUp://www.w3.org/2004/OWL/   •  Séman,que  plus  riche  pour  permeUre  plus   d’inférence   –  tout  Document  ayant  plusieurs  auteurs  est  un   DocumentCollec,f   –  deux  Personnes  auteurs  d’un  même  Document  sont  en   rela,on  «  co-­‐auteur  »   •  Héritage  IA,  logique  formelle  
  • 27. Quelques  schémas  et  ontologies   •  DC  (Dublin  core)     –  méta-­‐données  de  documents   –  hUp://dublincore.org/   •  FOAF  (Friend  of  a  friend)     –  personnes  et  réseaux  sociaux   –  hUp://www.foaf-­‐project.org/   •  SIOC  (Seman,cally  Interlinked  Online  Communi,es)     –  sites  web  collabora,fs   –  hUp://sioc-­‐project.org/   •  Plus  de  vocabulaires  :   –  hUp://www.schemaweb.info/  
  • 28. Plan   •  Principes   •  Mise  en  œuvre   •  Applica,ons  
  • 29. Le  Web  de  données  en  mars  2009   hUp://linkeddata.org/  
  • 30. Europeana   •  Exemple  avec  naviga,on  dans  le  thésaurus  SKOS   de  europeana.   – hUp://eculture.cs.vu.nl/europeana/session/search  
  • 31. Le  Web  de  données  en  2010   •  Es,ma,on  de  Chris  Bizer  à  LDOW  2010  :   – 13  milliards  de  triplets  (informa,on  élémentaire)   – 150  million  de  liens   •  Facebook  lance  OpenGraph   – hUp://opengraphprotocol.org/   – Annota,on  séman,que  de  n’importe  quelle  page,   pour  offrir  les  mêmes  fonc,onalités  qu’une  “page   Facebook”   – U,lisant  les  standards  du  Web  de  données  (RDFa)  
  • 32. Conclusion  (1)   •  Le  web  de  données  est  en  croissance  (très)   forte  depuis  quelques  mois    
  • 33. Conclusion  (2)   •  Que  doit  faire  une  ins,tu,on  pour  aller  sur  le   web  de  données  ?   – Exposer  ses  données  en  RDF   •  Annota,on  des  documents   •  Adapta,on  des  données  brutes   – U,liser  les  données  des  autres     •  Lier   •  Croiser  les  informa,ons   •  Construire  des  mashups  
  • 35. Pointeurs   •  Standards  :   – hUp://www.w3.org/standards/seman,cweb/   •  Sources  de  données  :   – hUp://dbpedia.org/   •  Ou,ls  de  visualisa,on,  requêtage  :     – hUp://sindice.com/   – hUp://sameas.org/  
  • 36. Exemple  de  requête  SPARQL   SELECT  ?p,  ?dd   WHERE  {      ?p              dbpedia-­‐owl:birthPlace    :Lyon  ;              dbpedia-­‐owl:birthDate  ?bd  .      OPTIONAL  {  ?p  dbpedia-­‐owl:deathDate  ?dd    }      FILTER  (?bd  >=  "1920"^^xsd:date                &&  ?bd  <    "1930"^^xsd:date)   }   hUp://,nyurl.com/2dcsokd  

Notes de l'éditeur

  1. NB: ce ne sont pas des coutants de pensée opposés, mais deux tendances parallèles et complémentaires, qui utilisent les mêmes technologies, mais ont des focus différents. Nous avons employé le terme Web de données, parce que c’est un pré-requis au Web Sémantique, mais on va en fait parler un peu des deux…
  2. On peut rendre les informations « contenues » dans les documents en y ajoutant des annotations destinées aux machines PA: Je suis toujours pas convaincu par la précédence historique les 2 moitiés du Web de données  Mais au moins pédagogiquement, je suis d’accord qu’il est préférable d’amener les choses progressivement.
  3. Pour les données natives, elles sont déjà manipulables par des machines, on pourrait donc en principe les exposer directement. Comme il faut s’appuyer sur des standards communs (tout comme les documents sont basés sur HTML), il peut être nécessaire de les adapter.
  4. Variations sur le thème précédent : On peut générer des documents annotés plutôt que d’exposer les données en les adaptant : exemple d’une page d’un produit sur un site commercial On peut également stocker des données nativement dans les formats standards, et les exposer directement
  5. En italique, les technos utilisées. Entre parenthèse, on retrouve les ingrédients qui constituent le Web de documents. On voit donc bien que le Web de données est une extension assez directe des principes du Web.
  6. Expliquer que URL er URI sont synonymes, mais avec un focus différent (identification et accès) Déjà sur le Web de documents, la distinction entre ressource et représentation, identification et accès existe ! (redirections, URLs abstraites pour les documents versionéns, etc…)
  7. PA: Attention avec le terme « relation » qui peut désigner tantôt l’arc, tantôt le prédicat. Je l’utilise pour « prédicat » dans le texte. Je pense qu’il ne faut pas entrer explicitement dans ce débat, sauf si on a la questions; l’exemple est à mon avis assez clair. Il faut juste faire attention à l’oral de se tenir à ce sens de « relation » (et parler de l’information, du triplet ou de l’arc pour l’autre).
  8. Ici on est passé des URIs aux CURIEs. Pas sûr qu’il faille rendrer dans le détail, à moins qu’il n’y ait une question.
  9. Lyon et Stanford university retrouve Jacquard,et qqn d’autre, mais le graphe reste petit. Lyon et Switzerland donne des résultats plus touffus et rigolos… mais pas d’Albert Jacquard  Bizarrement, de nombreuses infos sur lui ne sont pas retrouvées par Relfinder…) Pour pas avoir l’air trop bête : John Harsanyi était un économiste Jonathan Gagnoud est un footballeur suisse
  10. J’ai mis le SQL à la fin.
  11. Faire remarquer que « auteur » et « contributeur » sont des relations
  12. On peut maintenant expliquer brièvement que les bulles sont des sources de données, que les liens représentent les liens vers les ressources « appartenant » à d’autres sources, permettant donc de naviguer d’une source à l’autre, et de requêter le graphe global
  13. Exemple Europeana : affichage des propriétés, navigation par propriété, puis exploration d’une propriété elle-même pour voir le SKOS/rdf-schema. La propriété Creator, par exemple, « remonte » jusqu’à dc:creator .
  14. Causer à la fin du logiciel libre ? Vous pouvez préparer une présentation ppt. La BM est dotée d’une connexion Internet qui fonctionne parfaitement et d’un PC. En revanche la BM préconise : - de ne pas utiliser de logiciels libres (préférer les logicielsMicrosoft, version ppt 2003) - d&apos;apporter la présentation sur une clé USB et non sur un ordinateur - de veiller à ce que la taille du fichier ppt n&apos;excède pas 20 Mo