SlideShare une entreprise Scribd logo
Le Web sémantique.
Un Web de métadonnées

  Tutoriel JABES 2010
WEB DE DOCUMENTS
                        VS
          WEB DE DONNÉES

Le Web est une collection de documents (HTML,
PDF…)

Le Web devient une collection de bases de données
(RDF, RDFa)
hier   aujourd’hui   demain
Données



                                      Page HTML

LE CONTENU DES DONNÉES EST
 UTILISÉ DANS UN DOCUMENT
           HTML

Le Document HTML est fait pour être lu par des
humains ;
pas pour être exploité par des programmes
hier   aujourd’hui   demain
Page
                                       HTML
 Données
                                          Donnée
                                            s



                                        HTML + RDFa

       LES DONNÉES SONT
       PRÉSENTES DANS LE
        DOCUMENT HTML
Le Document HTML + RDFa peut être lu par des humains
et exploité par des programmes
La base de données est dans le Web, pas sous le Web
(deep Web)
La victoire des métadonnées

• Rich snippets

• SearchMonkey

• Open Graph Protocol
Métadonnées de…
•   Documents
•   Produits commerciaux
•   Entreprises et autres organismes
•   Événements
•   Jeux
•   Recettes de cuisine
Métadonnées de recette Google
Property               Description
name (fn)              Required. The name of the dish.
recipeType (tag)       The type of dish: for example, appetizer, entree, dessert ...
photo                  Image of the dish being prepared.
published              The date the recipe was published, in ISO date format.
summary                A short summary describing the dish.
review                 A review of the dish. Can include nested review information.
prepTime               The length of time it takes to prepare the recipe for dish, in ISO 8601 duration format. Can use min, max as child elements to
                       specify a range of time.
cookTime               The time it takes to actually cook the dish, in ISO 8601 duration format. Can use min, max as child elements to specify a range
                       of time.
totalTime (duration)   The total time it takes to prepare the cook the dish, in ISO 8601 duration format. Can use min, max as child elements to
                       specify a range of time.
nutrition              Nutrition information about the recipe. Can contain the following child elements: servingSize, calories, fat, saturatedFat,
                       unsaturatedFat, carbohydrates, sugar, fiber, protein, cholesterol. These elements are not explicitly part of the hRecipe
                       microformat, but Google will recognize them.
instructions           The steps to make the dish. Can contain the child element instruction, which can be used to annotate each step.
yield                  The quantity produced by the recipe (for example, number of people served, number of servings, etc).
ingredient             An ingredient used in the recipe. Can contain child items name (name of the ingredient) and amount. Use this to identify
                       individual ingredients.
author                 Creator of the recipe. Can include nested person information.
Métadonnées de documents
      selon Yahoo
Métadonnées de documents
      selon Yahoo
L’enjeu
         Que le Web de données
  ne parle pas seulement de vidéos, de
  produits commerciaux, de congrès et de
             recettes de cuisine
              mais également
 des fonds de nos bibliothèques, de nos
thèses, de nos manuscrits, de nos articles,
              de nos revues…
 et de nos auteurs, directeurs de thèse,
       organismes, vocabulaires …
Comment mettre nos métadonnées
   sur le Web de données ?




           Sudoc.zip
Comment mettre nos métadonnées
     sur le Web de données
  sans y mettre nos notices ?

Notices = paquets ficelés

   ! Ouvrir ces paquets !

 Dissection d’une notice MARC
 Vers des métadonnées en RDF
Partons d’une notice Sudoc en UNIMARC
décrivant l’édition commerciale d’une thèse
cam0 22 450
001 134144422
005 20100315113520.000
010 $a978-2-275-03443-0$bbr.$d38 EUR
073 1$a9782275034430
100 $a20090610d2009 k y0frey0103 ba
101 0 $afre
102 $aFR
105 $ay va 001yy
106 $ar
200 1 $aAnthropologie juridique de la personne morale$bTexte imprimé$fJean-
François Quievy,...$gpréface de Didier R. Martin,...
210 $aParis$cLGDJ-Lextenso éd.$dDL 2009
215 $a1 vol. (XI-416 p.)$d24 cm
225 2 $aBibliothèque de droit privé$x0520-0261$vtome 510
306 $aLGDJ = Librairie générale de droit et de jurisprudence
320 $aBibliogr. p. [369]-396. Notes bibliogr. Index
328 0$zTexte remanié de$bThèse de doctorat$cDroit privé$eParis 11$d2008
410 |$tBibliothèque de droit privé$x0520-0261$v510
451 |$tAnthropologie juridique de la personne morale$bTexte imprimé$fJean-François
Quievy$c[S.l.]$n[s.n.]$d2008$p1 vol. (343 p.)
606 $aAnthropologie juridique$2rameau
606 $aSociétés$xDroit$2rameau
606 $aPersonnes morales$2rameau
686 $aKA.111$2local_cujas
700 1$aQuievy$bJean-François$f1980-....$4070
702 1$aMartin$bDidier$f1944-....$4080
801 3$aFR$bAbes$c20100315$gAFNOR
Notice = paquet

Mais j’ai triché
cam0 22 450
001 134144422
005 20100315113520.000
010 $a978-2-275-03443-0$bbr.$d38 EUR                 Liens aux autorités
073 1$a9782275034430
100 $a20090610d2009 k y0frey0103 ba
101 0 $afre
102 $aFR
105 $ay va 001yy
106 $ar
200 1 $aAnthropologie juridique de la personne morale$bTexte imprimé$fJean-
François Quievy,...$gpréface de Didier R. Martin,...
210 $aParis$cLGDJ-Lextenso éd.$dDL 2009
215 $a1 vol. (XI-416 p.)$d24 cm
225 2 $aBibliothèque de droit privé$x0520-0261$vtome 510
306 $aLGDJ = Librairie générale de droit et de jurisprudence
320 $aBibliogr. p. [369]-396. Notes bibliogr. Index
328 0$zTexte remanié de$bThèse de doctorat$cDroit privé$eParis 11$d2008
410 |$0001025449$tBibliothèque de droit privé$x0520-0261$v510
451 |$0127264191$tAnthropologie juridique de la personne morale$bTexte
imprimé$fJean-François Quievy$c[S.l.]$n[s.n.]$d2008$p1 vol. (343 p.)
606 $3028070364$aAnthropologie juridique$2rameau
606 $3027480968$aSociétés$xDroit$2rameau
606 $3027883248$aPersonnes morales$2rameau
686 $aKA.111$2local_cujas
700 1$3127281851$aQuievy$bJean-François$f1980-....$4070
702 1$3086099582$aMartin$bDidier$f1944-....$4080
801 3$aFR$bAbes$c20100315$gAFNOR
Notice bibliographique avec liens aux autorités
                      =
        plusieurs paquets liés entre eux
ap
                  ou




                                                                                   r
                       ra




                                                                               eu
                         ut




                                                                             ct
                              eu




                                                                          ire
                                 r




                                                                     rd
                                                                     ou
                                                                    ap
                                           Id=134144422

                                      Edition de la Thèse
                                     . Titre = « Anthropologie… »
                                     . Langue = « fre »                  app
                 t                                                           a   rtie
             u je                                                                    n
       u   rs                                                                            tà
a   po
ap
                  ou




                                                                    r
                       ra




                                                                eu
                         ut




                                                              ct
                              eu




                                                           ire
                                 r




                                                      rd
                                                      ou
                                                     ap
                                     Id=134144422



                                                          app
                 t                                            a   rtie
             u je                                                     n
       u   rs                                                             tà
a   po


                                     a pour langue
Id=123456789
                                      La thèse comme               a p our
                                           Œuvre                   directeur
                       eur
                  r aut
                                   . Titre = « Anthropologie… »
          a   pou



                                                  a pour édition

                                     Id=134144422
     t



                   a pour langue
   u je
    rs




                                                                   app
                                                                       a
  ou




                                                                           rtie
                                                                               n
ap




                                                                                   tà
Démarche
 • Vider la notice bibliographique
 • Déporter le maximum d’information dans
   des notices d’autorité
       • L’information contenue dans une autorité est
             » séparée
             » plus facile à réutiliser




 Web de données :     une façon de pousser cette logique
                        jusqu’au bout
Défaire le paquet de métadonnées
• Décomposer la notice en affirmations
  élémentaires et indépendantes (triplets)
123456789       est de type         Thèse
123456789       a pour auteur       127281851
127281851       a pour nom          « Jean-Fr. Quiévy »
123456789       a pour édition      134144422
134144422       est de type         Edition
134144422       appartient à        001025449
001025449       est de type          Collection
001025449       a pour titre « Bib. De droit privé »
On est passé de MARC à RDF                        (Resource Description Framework – W3C)




123456789          a pour auteur         127281851

127281851          a pour nom            « J.F. Quiévy »

    • 2 informations indépendantes l’une de l’autre

    • 2 informations dans la même base ou non !
            » Information distribuée sur le Web
Comment faire des liens
si les informations qui composaient le paquet-notice
sont éclatées sur le Web ?
Des informations décentralisées et des
         identifiants globaux

Information gérée par la base catalogue :


http://www.catalogue.org/123456789
   a pour auteur  http://www.referentiel.org/127281851



Information gérée par la base référentiel :

http://www.référentiel.org/127281851
   a pour nom             « J.F. Quiévy »
Qu’est-ce que ça change ?   #1
N’importe qui peut compléter la
            « notice » !
• Car n’importe qui peut affirmer quelque
  chose sur ma thèse

 Exemple :
http://www.ma-bib-perso.org/yann
  possède-un-exemplaire-de
      http://www.catalogue.org/134144422


! Je m’exemplarise dans le Sudoc…          ps : je prête aussi
Qu’est-ce que ça change ?   #2
N’importe qui peut réutiliser mes
           données!
• Car tout le monde comprend les triplets
  RDF (bientôt).

 Exemple :
De nouvelles interfaces, de nouveaux outils


! Où sont les limites du catalogue ? Juste
  une AOC ?
Qu’est-ce que ça change ?   #3
Raisonner
• N’importe qui peut tirer de mes données
  des choses que j’ignorais

• Exemple :
     • Le catalogue dit que ce livre appartient à la
       collection http://www.issn.org/collection/001025449
     • La base ISSN dit que cette collection est une
       collection d’ouvrages de droit privé (règle).
     « on » peut en déduire que ce livre est un livre de
       droit privé (ce qui n’était pas dans la notice)
Qu’est-ce que ça change ?   #4
Lever le dilemme de
            l’interopérabilité
• Dilemme :

      • Populaire mais pauvre (Dublin Core simple)



      • Rester riche et mourir seul dans la dignité (MARC,
        TEF)


• Solution : tef:auteur   sous-propriété de dc:creator
Données ABES dans le Web de
         données
• Calames               RDFa en 2008

• Autorités             Fin 2010

• STAR (thèses élec.)   Fin 2010

• Portail des thèses    2011
Aller plus loin
• RDF Primer
  http://www.w3.org/TR/rdf-primer/

• RDFa (RDF dans une page HTML) Primer
  http://www.w3.org/TR/xhtml-rdfa-primer/
Le Web sémantique : un web de métadonnées

Contenu connexe

En vedette

Razon y proporcion descargas ppt
Razon y proporcion descargas pptRazon y proporcion descargas ppt
Razon y proporcion descargas ppt
Mario Covarrubias
 
Ascada–lösung für die fernüberwachung und steuerung der wasserversorgung
Ascada–lösung für die fernüberwachung und steuerung der wasserversorgungAscada–lösung für die fernüberwachung und steuerung der wasserversorgung
Ascada–lösung für die fernüberwachung und steuerung der wasserversorgung
SIS Group International
 
Introduction and course schedule
Introduction and course scheduleIntroduction and course schedule
Introduction and course schedule
Prabir Chatterjee
 
Verlernte Agilität - Schleichende Fehler in agilen Prozessen
Verlernte Agilität - Schleichende Fehler in agilen ProzessenVerlernte Agilität - Schleichende Fehler in agilen Prozessen
Verlernte Agilität - Schleichende Fehler in agilen Prozessen
Sebastian Bauer
 
Introduccion biologia2
Introduccion biologia2Introduccion biologia2
Introduccion biologia2
UAE
 
L'immobilier à Brest et sur le Finistère
L'immobilier à Brest et sur le FinistèreL'immobilier à Brest et sur le Finistère
L'immobilier à Brest et sur le Finistère
West Courtage
 
Mediengelder - SPIELfilmen Workshop
Mediengelder - SPIELfilmen WorkshopMediengelder - SPIELfilmen Workshop
Mediengelder - SPIELfilmen Workshop
Tausend Medien
 
6. senescyt plan contingenci aresumen2
6.  senescyt plan contingenci aresumen26.  senescyt plan contingenci aresumen2
6. senescyt plan contingenci aresumen2
Presidencia de la República del Ecuador
 
Sólidos Cristalinos
Sólidos CristalinosSólidos Cristalinos
Sólidos Cristalinos
José Escobar
 
Les marchés europeens du crédit immobilier résidentiel en 2014
Les marchés europeens du crédit immobilier résidentiel en 2014Les marchés europeens du crédit immobilier résidentiel en 2014
Les marchés europeens du crédit immobilier résidentiel en 2014
Monimmeuble.com
 
Propuestas Pedagógicas Innovadoras - Comunicación
Propuestas Pedagógicas Innovadoras - ComunicaciónPropuestas Pedagógicas Innovadoras - Comunicación
Propuestas Pedagógicas Innovadoras - Comunicación
Yohnny Carrasco
 
zav
zavzav
Meet the services
Meet the servicesMeet the services
Meet the services
Sciences Po
 
Tresors architecturaux grecs
Tresors architecturaux grecsTresors architecturaux grecs
Tresors architecturaux grecs
Pezou
 
6. senescyt plan contingenci aresumen2
6.  senescyt plan contingenci aresumen26.  senescyt plan contingenci aresumen2
6. senescyt plan contingenci aresumen2
Presidencia de la República del Ecuador
 
KEY-Unit-7 Quiz 0208
KEY-Unit-7 Quiz 0208KEY-Unit-7 Quiz 0208
KEY-Unit-7 Quiz 0208
Thea Moore
 
Obrir documents google docs
Obrir documents google docsObrir documents google docs
Obrir documents google docs
Juan Carlos
 
Amplificateuroprationnel 150310093109-conversion-gate01
Amplificateuroprationnel 150310093109-conversion-gate01Amplificateuroprationnel 150310093109-conversion-gate01
Amplificateuroprationnel 150310093109-conversion-gate01
yeksdech
 

En vedette (20)

Razon y proporcion descargas ppt
Razon y proporcion descargas pptRazon y proporcion descargas ppt
Razon y proporcion descargas ppt
 
Ascada–lösung für die fernüberwachung und steuerung der wasserversorgung
Ascada–lösung für die fernüberwachung und steuerung der wasserversorgungAscada–lösung für die fernüberwachung und steuerung der wasserversorgung
Ascada–lösung für die fernüberwachung und steuerung der wasserversorgung
 
Introduction and course schedule
Introduction and course scheduleIntroduction and course schedule
Introduction and course schedule
 
3.7
3.73.7
3.7
 
Verlernte Agilität - Schleichende Fehler in agilen Prozessen
Verlernte Agilität - Schleichende Fehler in agilen ProzessenVerlernte Agilität - Schleichende Fehler in agilen Prozessen
Verlernte Agilität - Schleichende Fehler in agilen Prozessen
 
Introduccion biologia2
Introduccion biologia2Introduccion biologia2
Introduccion biologia2
 
L'immobilier à Brest et sur le Finistère
L'immobilier à Brest et sur le FinistèreL'immobilier à Brest et sur le Finistère
L'immobilier à Brest et sur le Finistère
 
Mediengelder - SPIELfilmen Workshop
Mediengelder - SPIELfilmen WorkshopMediengelder - SPIELfilmen Workshop
Mediengelder - SPIELfilmen Workshop
 
6. senescyt plan contingenci aresumen2
6.  senescyt plan contingenci aresumen26.  senescyt plan contingenci aresumen2
6. senescyt plan contingenci aresumen2
 
Sólidos Cristalinos
Sólidos CristalinosSólidos Cristalinos
Sólidos Cristalinos
 
Les marchés europeens du crédit immobilier résidentiel en 2014
Les marchés europeens du crédit immobilier résidentiel en 2014Les marchés europeens du crédit immobilier résidentiel en 2014
Les marchés europeens du crédit immobilier résidentiel en 2014
 
Propuestas Pedagógicas Innovadoras - Comunicación
Propuestas Pedagógicas Innovadoras - ComunicaciónPropuestas Pedagógicas Innovadoras - Comunicación
Propuestas Pedagógicas Innovadoras - Comunicación
 
El hombre que no temia a la prensa
El hombre que no temia a la prensaEl hombre que no temia a la prensa
El hombre que no temia a la prensa
 
zav
zavzav
zav
 
Meet the services
Meet the servicesMeet the services
Meet the services
 
Tresors architecturaux grecs
Tresors architecturaux grecsTresors architecturaux grecs
Tresors architecturaux grecs
 
6. senescyt plan contingenci aresumen2
6.  senescyt plan contingenci aresumen26.  senescyt plan contingenci aresumen2
6. senescyt plan contingenci aresumen2
 
KEY-Unit-7 Quiz 0208
KEY-Unit-7 Quiz 0208KEY-Unit-7 Quiz 0208
KEY-Unit-7 Quiz 0208
 
Obrir documents google docs
Obrir documents google docsObrir documents google docs
Obrir documents google docs
 
Amplificateuroprationnel 150310093109-conversion-gate01
Amplificateuroprationnel 150310093109-conversion-gate01Amplificateuroprationnel 150310093109-conversion-gate01
Amplificateuroprationnel 150310093109-conversion-gate01
 

Plus de Y. Nicolas

SOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicatorSOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicator
Y. Nicolas
 
From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.
Y. Nicolas
 
Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)
Y. Nicolas
 
Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014
Y. Nicolas
 
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
Y. Nicolas
 
Jabes2012 : tutoriel web de données
Jabes2012 : tutoriel web de donnéesJabes2012 : tutoriel web de données
Jabes2012 : tutoriel web de données
Y. Nicolas
 
Sudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de données
Y. Nicolas
 
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Y. Nicolas
 
IdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABESIdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABES
Y. Nicolas
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
Y. Nicolas
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
Y. Nicolas
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)
Y. Nicolas
 
Vers un portail des Thèses
Vers un portail des ThèsesVers un portail des Thèses
Vers un portail des Thèses
Y. Nicolas
 
Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)
Y. Nicolas
 
Livres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseauLivres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseau
Y. Nicolas
 
Calames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EADCalames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EAD
Y. Nicolas
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartes
Y. Nicolas
 

Plus de Y. Nicolas (17)

SOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicatorSOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicator
 
From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.
 
Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)
 
Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014
 
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
 
Jabes2012 : tutoriel web de données
Jabes2012 : tutoriel web de donnéesJabes2012 : tutoriel web de données
Jabes2012 : tutoriel web de données
 
Sudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de données
 
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
 
IdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABESIdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABES
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)
 
Vers un portail des Thèses
Vers un portail des ThèsesVers un portail des Thèses
Vers un portail des Thèses
 
Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)
 
Livres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseauLivres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseau
 
Calames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EADCalames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EAD
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartes
 

Dernier

La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...
La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...
La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...
Editions La Dondaine
 
GUIDE POUR L’EVRAS BALISES ET APPRENTISSAGES
GUIDE POUR L’EVRAS BALISES ET APPRENTISSAGESGUIDE POUR L’EVRAS BALISES ET APPRENTISSAGES
GUIDE POUR L’EVRAS BALISES ET APPRENTISSAGES
DjibrilToure5
 
Techno Revo et nations (1789-1848) ).pdf
Techno Revo et nations (1789-1848) ).pdfTechno Revo et nations (1789-1848) ).pdf
Techno Revo et nations (1789-1848) ).pdf
NadineHG
 
Auguste Herbin.pptx Peintre français
Auguste   Herbin.pptx Peintre   françaisAuguste   Herbin.pptx Peintre   français
Auguste Herbin.pptx Peintre français
Txaruka
 
Compréhension orale La famille de Sophie (12).pdf
Compréhension orale  La famille de Sophie (12).pdfCompréhension orale  La famille de Sophie (12).pdf
Compréhension orale La famille de Sophie (12).pdf
lebaobabbleu
 
1e Espaces productifs 2024.Espaces productif
1e Espaces productifs 2024.Espaces productif1e Espaces productifs 2024.Espaces productif
1e Espaces productifs 2024.Espaces productif
NadineHG
 
1e geo metropolisation metropolisation x
1e geo metropolisation metropolisation x1e geo metropolisation metropolisation x
1e geo metropolisation metropolisation x
NadineHG
 
MÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdf
MÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdfMÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdf
MÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdf
lebaobabbleu
 
A1- Compréhension orale - présentations.pdf
A1- Compréhension orale - présentations.pdfA1- Compréhension orale - présentations.pdf
A1- Compréhension orale - présentations.pdf
lebaobabbleu
 

Dernier (9)

La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...
La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...
La Révolution Bénédictine Casadéenne du Livradois-Forez: De Charlemagne à Fra...
 
GUIDE POUR L’EVRAS BALISES ET APPRENTISSAGES
GUIDE POUR L’EVRAS BALISES ET APPRENTISSAGESGUIDE POUR L’EVRAS BALISES ET APPRENTISSAGES
GUIDE POUR L’EVRAS BALISES ET APPRENTISSAGES
 
Techno Revo et nations (1789-1848) ).pdf
Techno Revo et nations (1789-1848) ).pdfTechno Revo et nations (1789-1848) ).pdf
Techno Revo et nations (1789-1848) ).pdf
 
Auguste Herbin.pptx Peintre français
Auguste   Herbin.pptx Peintre   françaisAuguste   Herbin.pptx Peintre   français
Auguste Herbin.pptx Peintre français
 
Compréhension orale La famille de Sophie (12).pdf
Compréhension orale  La famille de Sophie (12).pdfCompréhension orale  La famille de Sophie (12).pdf
Compréhension orale La famille de Sophie (12).pdf
 
1e Espaces productifs 2024.Espaces productif
1e Espaces productifs 2024.Espaces productif1e Espaces productifs 2024.Espaces productif
1e Espaces productifs 2024.Espaces productif
 
1e geo metropolisation metropolisation x
1e geo metropolisation metropolisation x1e geo metropolisation metropolisation x
1e geo metropolisation metropolisation x
 
MÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdf
MÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdfMÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdf
MÉDIATION ORALE - MON NOUVEL APPARTEMENT.pdf
 
A1- Compréhension orale - présentations.pdf
A1- Compréhension orale - présentations.pdfA1- Compréhension orale - présentations.pdf
A1- Compréhension orale - présentations.pdf
 

Le Web sémantique : un web de métadonnées

  • 1. Le Web sémantique. Un Web de métadonnées Tutoriel JABES 2010
  • 2. WEB DE DOCUMENTS VS WEB DE DONNÉES Le Web est une collection de documents (HTML, PDF…) Le Web devient une collection de bases de données (RDF, RDFa)
  • 3. hier aujourd’hui demain
  • 4. Données Page HTML LE CONTENU DES DONNÉES EST UTILISÉ DANS UN DOCUMENT HTML Le Document HTML est fait pour être lu par des humains ; pas pour être exploité par des programmes
  • 5. hier aujourd’hui demain
  • 6. Page HTML Données Donnée s HTML + RDFa LES DONNÉES SONT PRÉSENTES DANS LE DOCUMENT HTML Le Document HTML + RDFa peut être lu par des humains et exploité par des programmes La base de données est dans le Web, pas sous le Web (deep Web)
  • 7. La victoire des métadonnées • Rich snippets • SearchMonkey • Open Graph Protocol
  • 8. Métadonnées de… • Documents • Produits commerciaux • Entreprises et autres organismes • Événements • Jeux • Recettes de cuisine
  • 9. Métadonnées de recette Google Property Description name (fn) Required. The name of the dish. recipeType (tag) The type of dish: for example, appetizer, entree, dessert ... photo Image of the dish being prepared. published The date the recipe was published, in ISO date format. summary A short summary describing the dish. review A review of the dish. Can include nested review information. prepTime The length of time it takes to prepare the recipe for dish, in ISO 8601 duration format. Can use min, max as child elements to specify a range of time. cookTime The time it takes to actually cook the dish, in ISO 8601 duration format. Can use min, max as child elements to specify a range of time. totalTime (duration) The total time it takes to prepare the cook the dish, in ISO 8601 duration format. Can use min, max as child elements to specify a range of time. nutrition Nutrition information about the recipe. Can contain the following child elements: servingSize, calories, fat, saturatedFat, unsaturatedFat, carbohydrates, sugar, fiber, protein, cholesterol. These elements are not explicitly part of the hRecipe microformat, but Google will recognize them. instructions The steps to make the dish. Can contain the child element instruction, which can be used to annotate each step. yield The quantity produced by the recipe (for example, number of people served, number of servings, etc). ingredient An ingredient used in the recipe. Can contain child items name (name of the ingredient) and amount. Use this to identify individual ingredients. author Creator of the recipe. Can include nested person information.
  • 12. L’enjeu Que le Web de données ne parle pas seulement de vidéos, de produits commerciaux, de congrès et de recettes de cuisine mais également des fonds de nos bibliothèques, de nos thèses, de nos manuscrits, de nos articles, de nos revues… et de nos auteurs, directeurs de thèse, organismes, vocabulaires …
  • 13. Comment mettre nos métadonnées sur le Web de données ? Sudoc.zip
  • 14. Comment mettre nos métadonnées sur le Web de données sans y mettre nos notices ? Notices = paquets ficelés ! Ouvrir ces paquets !  Dissection d’une notice MARC  Vers des métadonnées en RDF
  • 15. Partons d’une notice Sudoc en UNIMARC décrivant l’édition commerciale d’une thèse
  • 16. cam0 22 450 001 134144422 005 20100315113520.000 010 $a978-2-275-03443-0$bbr.$d38 EUR 073 1$a9782275034430 100 $a20090610d2009 k y0frey0103 ba 101 0 $afre 102 $aFR 105 $ay va 001yy 106 $ar 200 1 $aAnthropologie juridique de la personne morale$bTexte imprimé$fJean- François Quievy,...$gpréface de Didier R. Martin,... 210 $aParis$cLGDJ-Lextenso éd.$dDL 2009 215 $a1 vol. (XI-416 p.)$d24 cm 225 2 $aBibliothèque de droit privé$x0520-0261$vtome 510 306 $aLGDJ = Librairie générale de droit et de jurisprudence 320 $aBibliogr. p. [369]-396. Notes bibliogr. Index 328 0$zTexte remanié de$bThèse de doctorat$cDroit privé$eParis 11$d2008 410 |$tBibliothèque de droit privé$x0520-0261$v510 451 |$tAnthropologie juridique de la personne morale$bTexte imprimé$fJean-François Quievy$c[S.l.]$n[s.n.]$d2008$p1 vol. (343 p.) 606 $aAnthropologie juridique$2rameau 606 $aSociétés$xDroit$2rameau 606 $aPersonnes morales$2rameau 686 $aKA.111$2local_cujas 700 1$aQuievy$bJean-François$f1980-....$4070 702 1$aMartin$bDidier$f1944-....$4080 801 3$aFR$bAbes$c20100315$gAFNOR
  • 17. Notice = paquet Mais j’ai triché
  • 18. cam0 22 450 001 134144422 005 20100315113520.000 010 $a978-2-275-03443-0$bbr.$d38 EUR Liens aux autorités 073 1$a9782275034430 100 $a20090610d2009 k y0frey0103 ba 101 0 $afre 102 $aFR 105 $ay va 001yy 106 $ar 200 1 $aAnthropologie juridique de la personne morale$bTexte imprimé$fJean- François Quievy,...$gpréface de Didier R. Martin,... 210 $aParis$cLGDJ-Lextenso éd.$dDL 2009 215 $a1 vol. (XI-416 p.)$d24 cm 225 2 $aBibliothèque de droit privé$x0520-0261$vtome 510 306 $aLGDJ = Librairie générale de droit et de jurisprudence 320 $aBibliogr. p. [369]-396. Notes bibliogr. Index 328 0$zTexte remanié de$bThèse de doctorat$cDroit privé$eParis 11$d2008 410 |$0001025449$tBibliothèque de droit privé$x0520-0261$v510 451 |$0127264191$tAnthropologie juridique de la personne morale$bTexte imprimé$fJean-François Quievy$c[S.l.]$n[s.n.]$d2008$p1 vol. (343 p.) 606 $3028070364$aAnthropologie juridique$2rameau 606 $3027480968$aSociétés$xDroit$2rameau 606 $3027883248$aPersonnes morales$2rameau 686 $aKA.111$2local_cujas 700 1$3127281851$aQuievy$bJean-François$f1980-....$4070 702 1$3086099582$aMartin$bDidier$f1944-....$4080 801 3$aFR$bAbes$c20100315$gAFNOR
  • 19. Notice bibliographique avec liens aux autorités = plusieurs paquets liés entre eux
  • 20. ap ou r ra eu ut ct eu ire r rd ou ap Id=134144422 Edition de la Thèse . Titre = « Anthropologie… » . Langue = « fre » app t a rtie u je n u rs tà a po
  • 21. ap ou r ra eu ut ct eu ire r rd ou ap Id=134144422 app t a rtie u je n u rs tà a po a pour langue
  • 22. Id=123456789 La thèse comme a p our Œuvre directeur eur r aut . Titre = « Anthropologie… » a pou a pour édition Id=134144422 t a pour langue u je rs app a ou rtie n ap tà
  • 23. Démarche • Vider la notice bibliographique • Déporter le maximum d’information dans des notices d’autorité • L’information contenue dans une autorité est » séparée » plus facile à réutiliser  Web de données : une façon de pousser cette logique jusqu’au bout
  • 24. Défaire le paquet de métadonnées • Décomposer la notice en affirmations élémentaires et indépendantes (triplets) 123456789 est de type Thèse 123456789 a pour auteur 127281851 127281851 a pour nom « Jean-Fr. Quiévy » 123456789 a pour édition 134144422 134144422 est de type Edition 134144422 appartient à 001025449 001025449 est de type Collection 001025449 a pour titre « Bib. De droit privé »
  • 25. On est passé de MARC à RDF (Resource Description Framework – W3C) 123456789 a pour auteur 127281851 127281851 a pour nom « J.F. Quiévy » • 2 informations indépendantes l’une de l’autre • 2 informations dans la même base ou non ! » Information distribuée sur le Web
  • 26. Comment faire des liens si les informations qui composaient le paquet-notice sont éclatées sur le Web ?
  • 27. Des informations décentralisées et des identifiants globaux Information gérée par la base catalogue : http://www.catalogue.org/123456789 a pour auteur http://www.referentiel.org/127281851 Information gérée par la base référentiel : http://www.référentiel.org/127281851 a pour nom « J.F. Quiévy »
  • 28. Qu’est-ce que ça change ? #1
  • 29. N’importe qui peut compléter la « notice » ! • Car n’importe qui peut affirmer quelque chose sur ma thèse Exemple : http://www.ma-bib-perso.org/yann possède-un-exemplaire-de http://www.catalogue.org/134144422 ! Je m’exemplarise dans le Sudoc… ps : je prête aussi
  • 30. Qu’est-ce que ça change ? #2
  • 31. N’importe qui peut réutiliser mes données! • Car tout le monde comprend les triplets RDF (bientôt). Exemple : De nouvelles interfaces, de nouveaux outils ! Où sont les limites du catalogue ? Juste une AOC ?
  • 32. Qu’est-ce que ça change ? #3
  • 33. Raisonner • N’importe qui peut tirer de mes données des choses que j’ignorais • Exemple : • Le catalogue dit que ce livre appartient à la collection http://www.issn.org/collection/001025449 • La base ISSN dit que cette collection est une collection d’ouvrages de droit privé (règle). « on » peut en déduire que ce livre est un livre de droit privé (ce qui n’était pas dans la notice)
  • 34. Qu’est-ce que ça change ? #4
  • 35. Lever le dilemme de l’interopérabilité • Dilemme : • Populaire mais pauvre (Dublin Core simple) • Rester riche et mourir seul dans la dignité (MARC, TEF) • Solution : tef:auteur sous-propriété de dc:creator
  • 36. Données ABES dans le Web de données • Calames RDFa en 2008 • Autorités Fin 2010 • STAR (thèses élec.) Fin 2010 • Portail des thèses 2011
  • 37. Aller plus loin • RDF Primer http://www.w3.org/TR/rdf-primer/ • RDFa (RDF dans une page HTML) Primer http://www.w3.org/TR/xhtml-rdfa-primer/