SlideShare une entreprise Scribd logo
1  sur  49
Le web de données




             enssib :: 12 octobre 2012
Plan
• Partir de ce qu’on connaît :
  – Base de données + Web = web de données
• Vertus de RDF
• Champs de bataille
  – Syntaxes
  – Vocabulaires
  – Workflows
  – Agrégateurs
Le web de données,
              c’est pas quoi ?

                      Base              Web


Documents             GED              Le Web =
                                   Web de documents



 Données         Base de données   Web de données
Le Web, web de documents

   Données      Documents




   Base de
   données


                       Hyperlien




   Base de
   données
http://fyeah-icebergs.tumblr.com/post/1063474140
Un archipel d’icebergs
• Les données sont cachées sous les pages HTML
  (deep web)
• Seules les pages HTML sont liées entre elles
• Les pages HTML sont faites pour les humains
• Ce que veulent les machines, ce sont des
  données
     • et des données liées
         – car elles se complètent les unes les autres
         – car les liens permettent de naviguer et de découvrir
     • Et des liens qualifiés, signifiants
         – au-delà du « voir aussi » des hyperliens
Le web de données liées

             Données   Documents




             Base de
             données


Liens entre les               Hyperlien
bases de données



             Base de
             données
Le web de données liées

               Données       Documents




               Base de
               données


Liens entre les                     Hyperlien
bases de données



                   Base de
                   données
Persée



                  Une base de données

                                          DOCUMENTS
     id                            auteur             titre
     doi :10.3406/mefr.1959.7458   auteur_mefr_1904   Retractatio




Lien interne à la base

                                            AUTEURS
     id                            nom
     auteur_mefr_1904              Paul Veyne
Sudoc + IdRef

                            Une autre
                         base de données

                                            LIVRES
          id             z7XX                     titrepropre                 editeur
          068391307      027182800                Le Pain et le cirque        Le Seuil




Lien interne à la base

                                        PERSONNES
          id                    nom                                      personnetype
          027182800             Veyne, Paul (1930-….                     0
DOCUMENTS                                        #1 Comment lier
                                                                      la donnée d’une base
id                   auteur             titre                         à la donnée de l’autre base ?
doi :10.3406/mefr.   auteur_mefr_1904   Retractatio
1959.7458
                                                                      #2 Comment lier deux bases
                       AUTEURS                                        qui n’ont pas le même schéma
id                   nom                                              #3 Comment qualifier
auteur_mefr_1904     Paul Veyne
                                                                      la nature de ce lien ?

                                                                      #4 Comment faire tout ça sur
                                                                      le Web, en surface ?



                                                                      LIVRES
                                              id          z7XX             titrepropre editeur
                                              068391307   027182800        Le Pain et le       Le Seuil
                                                                           cirque

                                                                 PERSONNES
             est la même
                                              id               nom                         personnetype
             entité que
                                              027182800        Veyne, Paul (1930-….        0
COMMENT ARRIVER À ÇA ?
Le nuage du web de données liées
Le nuage du web de données liées
Les données ABES sur le web de
données, avec IdRef pour pivot
RDF

UN MODÈLE GÉNÉRAL POUR
DÉCRIRE … N’IMPORTE QUOI
RDF = Graphes                                                                                 « Paul Veyne »


                                                auteur_mefr_1904




           doi:10.3406/
          mefr.1959.7458



                                                 « Retractatio »




En RDF,
          • une ressource (qch) est en relation avec
                                                                   a telle relation avec
               • soit une autre ressource                  qch                              qch


               • soit un mot                               qch
                                                                   a telle relation avec
                                                                                           « mot »
Nommer les relations                                                              « Paul Veyne »


                                                 auteur_mefr_1904




            doi:10.3406/
           mefr.1959.7458



                                                  « Retractatio »




Les relations (prédicats) ont un nom précis.
Ce nom est une URL.                     ex : dc:title = http://purl.org/dc/elements/1.1/title
                                             rda:title | abes:title | isbd:title
Nommer les ressources                                                         « Paul Veyne   »

                                              http://www.per
                                              see.fr/auteur_m
                                              efr_1904/id


        http://dx.doi.org/
           doi:10.3406/
         mefr.1959.7458

                                               « Retractatio »




Les entités (ressources) ont un nom précis.
Ce nom est une URL.                    ex : http://dx.doi.org/doi:10.3406/mefr.1959.7458
                                       ex : http://www.sudoc.fr/092673007/id
Des graphes aux triplets                                                               « Paul Veyne   »

                                                    http://www.per
                                                    see.fr/auteur_m
                                                    efr_1904/id


         http://dx.doi.org/
            doi:10.3406/
          mefr.1959.7458

                                                     « Retractatio »




                                         Ecrire ce graphe


<http://dx.doi.org/doi:10.3406/mefr.1959.7458> dc:title « Retractatio ».
<http://dx.doi.org/doi:10.3406/mefr.1959.7458> dcterms:creator <http://www.persee.fr/auteur_mefr_1904/id>.

< http://www.persee.fr/auteur_mefr_1904/id > foaf:name « Paul Veyne ».


                                            Triplets RDF
2 bases séparées                                                                    « Paul Veyne   »

                                             http://www.per
                                             see.fr/auteur_m
                                             efr_1904/id


        http://dx.doi.org/
           doi:10.3406/
         mefr.1959.7458

                                               « Retractatio »




         http://dx.doi.org/   truc:subject   http://id.loc.gov/au   skos:prefLabel
            doi:10.3406/                     thorities/subjects/s                        « Credit »
          mefr.1959.7458                     h85033856




Deux sites en RDF peuvent parler de la même chose – explicitement ici (même nom (URL)).
On agrège les 2 bases                                                             « Paul Veyne   »


                                              http://www.per
                                            see.fr/auteur_me
                                            fr_1904/id




     http://dx.doi.org/                      « Retractatio »
        doi:10.3406/
      mefr.1959.7458




                                           http://id.loc.gov/au   skos:prefLabel
                                           thorities/subjects/s                        « Credit »
                                           h85033856




L’agrégation des données est immédiate
Deux sites en RDF peuvent parler de la même chose.
Mais pas forcément de la même manière (pas de schéma ou de vocabulaire unique)
2 bases séparées                                                                     « Paul Veyne   »

                                              http://www.per
                                              see.fr/auteur_m
                                              efr_1904/id


        http://dx.doi.org/
           doi:10.3406/
         mefr.1959.7458

                                                « Retractatio »




                             truc:subject     http://id.loc.gov/au   skos:prefLabel
         http://www.truc.                                                                 « Credit »
                                              thorities/subjects/s
          co.nz/wyz123                        h85033856




Deux sites en RDF peuvent parler de la même chose – implicitement ici (deux noms différents !)
 Problème pour les agréger
2 bases séparées                                                                 « Paul Veyne   »

                                          http://www.per
                                          see.fr/auteur_m
                                          efr_1904/id


      http://dx.doi.org/
         doi:10.3406/
       mefr.1959.7458

                                            « Retractatio »




                           truc:subject   http://id.loc.gov/au   skos:prefLabel
       http://www.truc.                                                               « Credit »
                                          thorities/subjects/s
        co.nz/wyz123                      h85033856


                                          http://dx.doi.org/
                                          doi:10.3406/
                                          mefr.1959.7458




 Dire explicitement       qu’il s’agit de la même entité avec owl:sameAs
On agrège les 2 bases                                                                  « Paul Veyne   »


         owl:sameAs                                 http://www.per
                                                  see.fr/auteur_me
                                                  fr_1904/id

         http://dx.doi.org/
            doi:10.3406/
          mefr.1959.7458

                                                   « Retractatio »




                                                 http://id.loc.gov/au   skos:prefLabel
          http://www.truc.                                                                   « Credit »
                                                 thorities/subjects/s
           co.nz/wyz123       truc:subject       h85033856



        owl:sameAs


Grâce à owl:sameAS, la fusion est totale : tout ce qu’on dit de l’un est aussi vrai de l’autre
Paul Veyne dans le RDF de VIAF
                                     http://viaf.org/viaf/108250528/rdf.xml

  http://viaf.org
 /viaf/108250528
                                                                 Le Veyne
      owl:sameAs




                                                                 de VIAF
                                                                 et
                                                                 le Veyne
                                                                 d’IdRef
                                                                 ne font
                                                                 qu’un
http://www.idref.fr
  /027182800/id
On ajoute un peu de sémantique

                       rda:subject
                                          http://id.loc.gov/au    skos:prefLabel
    http://www.truc.                                                               « Credit »
                                          thorities/subjects/s
     co.nz/wyz123                         h85033856




                          rdfs:subPropertyOf                                        Schémas RDF
      rda:subject                                           dcterms:subject
                                                                                    Ontologies




Le schéma RDF ajoute des informations sur le vocabulaire utilisé (propriétés des propriétés et
des classes)
Ce qui permet de faire du raisonnement 
On en déduit que…

                        rda:subject
                                          http://id.loc.gov/au     skos:prefLabel
    http://www.truc.                                                                « Credit »
                                          thorities/subjects/s
     co.nz/wyz123                         h85033856




                           rdfs:subPropertyOf                                        Schémas RDF
       rda:subject                                          dcterms:subject
                                                                                     Ontologies




     http://www.truc.
                        dcterms:subject     http://id.loc.gov/au
      co.nz/wyz123
                                            thorities/subjects/s                     Triplets déduits
                                            h85033856




Le raisonnement permet d’ajouter des informations (triplets).
En l’occurrence, il permet d’exprimer automatiquement en Dublin Core un triplet qui utilisait
un vocabulaire truc non standard
Aujourd’hui                     Fonds
                               Calames



               Livre
              Sudoc

                                                          Auteur IdRef


                    Thèse
                   theses.fr
                                                                  owl:sameAs



                                                              Auteur
                                                               VIAF

                               Auteur
                                BnF                  owl:sameAs



                                                                  Auteur
                                          Auteur                   ISNI
                                         Wikipedia
Demain                     Fonds
                          Calames



          Livre
         Sudoc

                                                      Auteur IdRef


               Thèse
              theses.fr



                                                owl:sameAs

                                                          Auteur
                                                           VIAF

                          Auteur
                           BnF




                                                             Auteur
                                     Auteur                   ISNI
                                    Wikipedia
+ articles, éditions
                                                                           scientifiques,
  Après-demain peut-être ?                                   Fonds         numérisation, etc.
                                                            Calames

        Livre
       Worldcat
                                            Livre
                                           Sudoc

                                   cite                                                     Auteur IdRef

         Données                                 Thèse
          brutes                                theses.fr

                                      a pour                                      owl:sameAs
+ brevets,
projets ANR,
                                      dérivé
etc.                                                 Auteur
                                                    HAL CCSD
                                                                                                  Auteur
                                                                                                   VIAF
                    Article
                   HAL CCSD
                                                            Auteur
                                                             BnF                  owl:sameAs
                   + CrossRef,
                   revues,
                   indicateurs
                   d’usage, etc.
                                                                                                    Auteur
                                                                       Auteur                        ISNI
                                                                      Wikipedia
VERTUS
Vertu                                  Effet
RDF offre un modèle universel   Inutile de chercher le format
  qui permet d’exprimer toute      miracle qui marchera pour
  donnée, quelle que soit la       le MARC du Sudoc et
  norme de description.            d’IdRef, le TEF de
Cela rend bien plus facile         STAR, l’EAD de
  l’agrégation de données          Calames, l’ONIX de tel
  diverses                         éditeur, le A++ de Springer
                                   (Lic. Nat.), le Bloubiboulga
                                   de tel autre, etc.



                                #abes #hubdedonnées
Vertu                                Effet
RDF n’impose pas de schéma    Devons-nous utiliser RDA,
  unique. On peut mixer les     Dublin Core ou un
  vocabulaires                  vocabulaire bibliographique
                                à nous ?
                              On peut faire les trois.
                              On peut aussi utiliser un
                                vocabulaire dont le schéma
                                explicite ses relations avec
                                un vocabulaire standard
                              (cf. truc:subject et dcterms:subject)

                              #ouverturedesdonnées #hubdedonnées
Vertu                           Effet
RDF rend les données   La notice d’autorité n’a pas
  extensibles.             besoin de tout stocker sur
                           une personne.
                       Il vaut mieux en dire le strict
                           nécessaire et faire des liens
                           vers d’autres sources (ex :
                           dictionnaires biographiques
                           … en RDF)
                       Idem pour les données
                           bibliographiques (prix,
                           recensions, influences, etc.)

                       #idref #ist #wikipedia #webofdata
DOCUMENTS
id                   auteur             titre
doi :10.3406/mefr.   auteur_mefr_1904   Retractatio
1959.7458


                       AUTEURS
id                   nom
auteur_mefr_1904     Paul Veyne




                                                                      LIVRES
                                              id          z7XX             titrepropre editeur
                                              068391307   027182800        Le Pain et le       Le Seuil
                                                                           cirque

                                                                 PERSONNES
             est la même
                                              id               nom                         personnetype
             entité que
                                              027182800        Veyne, Paul (1930-….        0
id                      auteur             type                       id                  titre            type
   doi :10.3406/mefr.      auteur_mefr_1904   Document                   doi :10.3406/mef    Retractatio      Document
   1959.7458                                                             r.1959.7458
                                                              2                                                          2


   id                     nom                 type                               id                        sameAs
   auteur_mefr_1904       Paul Veyne          Personne
                                                              2                  auteur_mefr_1904          027182800
                                                                                                                             1
       On éclate nos bases !                                                              Tel ID désigne la même entité
                                                                                          que tel autre ID
       A la limite, 1 base = 1 triplet
068391307 titrepropre «Le Pain et le cirque»                                     id                        S’applique à
  id                    titrepropre
                                                                                 z7XX                      Personne
  068391307             Le Pain et le
                        cirque
                                                                                                                             1
                                        1                                                La relation z7XX porte toujours
  id                    editeur               id              type                        sur des entités de type Personne.
  068391307             Le Seuil              068391307       Livre
                                        1                                        1       Donc, on peut en conclure que
                                                                                         027182800 est de type Personne.
  id                    z7XX                  id          nom
  068391307             027182800             027182800   Veyne, Paul (1930-….           [Pas la peine de le dire,
                                        1                                            1
                                                                                         on le déduit (Raisonnement)]
Vertu                                 Effet
RDF permet de raisonner sur    Dans le projet SudocAD, on a
  les données, pour les          essayé de déduire quelle
  enrichir ou contrôler leur     est la bonne autorité à lier à
  cohérence                      une notice bibliographique.




                               #hubdedonnées #sudocad #qualinca
Vertu                             Effet
RDF a son propre langage   SPARQL permet d’interroger
  d’interrogation des        les données telles qu’on les
  données : SPARQL           a modélisées – et non
                             l’inverse : modéliser de telle
                             manière pour pouvoir
                             interroger ceci ou cela




                           #marché #niche #ouvrezlesfenêtres
Les données
<http://dx.doi.org/doi:10.3406/mefr.1959.7458> dc:title « Retractatio ».
<http://dx.doi.org/doi:10.3406/mefr.1959.7458> dcterms:creator <http://www.persee.fr/auteur904/id>.
< http://www.persee.fr/auteur904/id > foaf:name « Paul Veyne ».




                                          La requête
SELECT     ?truc        {
?truc       dc:title « Retractatio ».
?truc       dcterms:creator ?bidule.
? bidule    foaf:name « Paul Veyne ».
}


                                          La réponse
<http://dx.doi.org/doi:10.3406/mefr.1959.7458>
Vertu                              Effet
RDF, c’est pas réservé aux   Les bibliothèques peuvent
  bibliothécaires               accéder à un marché
                                générique :
                                  –   Logiciels
                                  –   Services
                                  –   Ressources humaines
                                  –   Formations
                                  –   Consultants




                             #marché #niche #ouvrezlesfenêtres
CHAMPS DE BATAILLE
Quelle(s) syntaxe(s) RDF ?
Différentes syntaxes possibles   Ce qui compte
• RDF en XML                     • C’est le modèle (spo) et le
• RDF Ntriples                     contenu (tel vocabulaire…)
• RDF N3
• RDF Turtle                     • RDF dans la page web ou
• RDFa                             dans une autre page ?
• Microdata                      • Ou dans les deux ?
                                      – Et alors, même contenu ou
                                        variantes ?
• Excel-RDF ;)


                                 #rdf #syntaxe #rdf #rdfa #microdata
Quel(s) vocabulaire(s) RDF ?
Différentes manières de dire la
même chose                        Questions ?
• dc:title                        • Utiliser un vocabulaire pro
• rda:title                         spécialisé (RDA, FRBRoo) ou
                                    un vocabulaire « grand
   – rda:titleProper
                                    public (schema.org,
• schema:name                       Facebook Open Graph) ?
• og:title                        • Les deux (redondance, un
• Etc.                              peu, bcp…)
                                  • En principe, un outil de
                                    raisonnement peut passer
                                    d’un vocabulaire à l’autre,
                                    mais dans les faits…

                                  #rdf #vocabulaires
Quel(s) vocabulaire(s) RDF dans quelle
  syntaxe ? Un compromis possible
Côté cour                         Côté jardin

• Utiliser un vocabulaire         • Utiliser les vocabulaires pro
  grand public dans le RDF          dans des pages dédiées aux
  des pages HTML (RDFa)             métadonnées (RDF/XML,
   – Notamment pour les moteurs     NTriples…)
     de recherche comme Google
     ou Yahoo




                                  #rdf #vocabulaires
Workflows.
          Du RDF à tous les étages ?
RDF pas partout                 Questions
• Ouverture des données OK      • RDF juste pour l’extérieur ?
• Stockage des données ?        • Technologies assez mures et
• Manipulation des données ?      performantes pour
• Edition des données par un      stockage, manipulation et
  utilisateur professionnel ?     recherche à grande échelle
                                  ?
                                • L’utilisateur professionnel
                                  doit-il comprendre RDF ?
                                  Jusqu’où ?


                                #rdf #technologies #formation
Les grossistes du RDF
Acteurs
•   Moteurs de recherche généralistes    • La publication des
     – Google (dont Freebase)              métadonnées RDF peut et doit
     – Yahoo                               être décentralisée (sources de
•   Moteurs de recherche RDF               référence)
    généralistes
     – Sindice                           • Mais il faut bien agréger pour
     – FactForge                              – Recherche intégrée
•   Moteur de recherche RDF                   – Enrichissement
    spécialisé                           • Garder les données ouvertes
     – Isidore
                                              – Quelles conditions juridiques ?
•   Hébergeur de données et de                – Métadonnées de provenance
    services
     –   Kasabi                          • Gérer les doublons de triplets
     –   Sindice                              – Provenance, confiance…
     –   Freebase
     –   Et autre data marketplaces cf

                                         #rdf #opendata #centralisation #web
En savoir plus

• Infos : http://punktokomo.abes.fr/tag/semantique-web/

• Outil : inspector.sindice.com

• Tutos : http://web-semantique.developpez.com/tutoriels/

Contenu connexe

En vedette

Introduction à la gestion des métadonnées
Introduction à la gestion des métadonnéesIntroduction à la gestion des métadonnées
Introduction à la gestion des métadonnéesOpen Data Support
 
Resultado auditoria ciudadana
Resultado auditoria ciudadana Resultado auditoria ciudadana
Resultado auditoria ciudadana Ciudadano Activo
 
Este Vide0 L0 He Cread0 Especialmente Para Ti
Este Vide0 L0 He Cread0 Especialmente Para TiEste Vide0 L0 He Cread0 Especialmente Para Ti
Este Vide0 L0 He Cread0 Especialmente Para Tijonathan2012
 
Abschlusspräsentation Online Marketing
Abschlusspräsentation Online MarketingAbschlusspräsentation Online Marketing
Abschlusspräsentation Online Marketingdafcommunity
 
Balanced Scorecard - Vortragsunterlagen_Version 2014-01-02
Balanced Scorecard - Vortragsunterlagen_Version 2014-01-02Balanced Scorecard - Vortragsunterlagen_Version 2014-01-02
Balanced Scorecard - Vortragsunterlagen_Version 2014-01-02ICV
 
Abfertigungskassen: Vergleich der Anbieter
Abfertigungskassen: Vergleich der AnbieterAbfertigungskassen: Vergleich der Anbieter
Abfertigungskassen: Vergleich der AnbieterBetriebsratakooe
 
1ª parte del proyecto
1ª parte del proyecto1ª parte del proyecto
1ª parte del proyectoiue
 
Cepr08 pps act3_equipo3_final
Cepr08 pps act3_equipo3_finalCepr08 pps act3_equipo3_final
Cepr08 pps act3_equipo3_finalcepr08TAC
 
Congreso "Convivencia en intistituciones educativas".
Congreso "Convivencia en intistituciones educativas".Congreso "Convivencia en intistituciones educativas".
Congreso "Convivencia en intistituciones educativas".Mª Emilia Contrera.
 
Animació japonesa
Animació japonesaAnimació japonesa
Animació japonesapepotam
 
Presentacio
PresentacioPresentacio
Presentaciomodcube
 
Volta ao Nosso Mundo
Volta ao Nosso MundoVolta ao Nosso Mundo
Volta ao Nosso MundoBiaEsteves
 

En vedette (20)

Introduction à la gestion des métadonnées
Introduction à la gestion des métadonnéesIntroduction à la gestion des métadonnées
Introduction à la gestion des métadonnées
 
Saulo turismo
Saulo turismoSaulo turismo
Saulo turismo
 
Resultado auditoria ciudadana
Resultado auditoria ciudadana Resultado auditoria ciudadana
Resultado auditoria ciudadana
 
Este Vide0 L0 He Cread0 Especialmente Para Ti
Este Vide0 L0 He Cread0 Especialmente Para TiEste Vide0 L0 He Cread0 Especialmente Para Ti
Este Vide0 L0 He Cread0 Especialmente Para Ti
 
Abschlusspräsentation Online Marketing
Abschlusspräsentation Online MarketingAbschlusspräsentation Online Marketing
Abschlusspräsentation Online Marketing
 
Balanced Scorecard - Vortragsunterlagen_Version 2014-01-02
Balanced Scorecard - Vortragsunterlagen_Version 2014-01-02Balanced Scorecard - Vortragsunterlagen_Version 2014-01-02
Balanced Scorecard - Vortragsunterlagen_Version 2014-01-02
 
Abfertigungskassen: Vergleich der Anbieter
Abfertigungskassen: Vergleich der AnbieterAbfertigungskassen: Vergleich der Anbieter
Abfertigungskassen: Vergleich der Anbieter
 
Bloque pacie1
Bloque pacie1Bloque pacie1
Bloque pacie1
 
1ª parte del proyecto
1ª parte del proyecto1ª parte del proyecto
1ª parte del proyecto
 
Vol19ag
Vol19agVol19ag
Vol19ag
 
Cepr08 pps act3_equipo3_final
Cepr08 pps act3_equipo3_finalCepr08 pps act3_equipo3_final
Cepr08 pps act3_equipo3_final
 
Guia 6.
Guia  6.Guia  6.
Guia 6.
 
Congreso "Convivencia en intistituciones educativas".
Congreso "Convivencia en intistituciones educativas".Congreso "Convivencia en intistituciones educativas".
Congreso "Convivencia en intistituciones educativas".
 
Animació japonesa
Animació japonesaAnimació japonesa
Animació japonesa
 
Presentacio
PresentacioPresentacio
Presentacio
 
Hispalis
HispalisHispalis
Hispalis
 
Cine
CineCine
Cine
 
Pésentation yehp!
Pésentation yehp!Pésentation yehp!
Pésentation yehp!
 
Volta ao Nosso Mundo
Volta ao Nosso MundoVolta ao Nosso Mundo
Volta ao Nosso Mundo
 
Tendencias
TendenciasTendencias
Tendencias
 

Plus de Y. Nicolas

SOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicatorSOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicatorY. Nicolas
 
From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.Y. Nicolas
 
Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)Y. Nicolas
 
Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014Y. Nicolas
 
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...Y. Nicolas
 
Sudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesY. Nicolas
 
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...Y. Nicolas
 
IdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABESIdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABESY. Nicolas
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011Y. Nicolas
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèseY. Nicolas
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Y. Nicolas
 
Vers un portail des Thèses
Vers un portail des ThèsesVers un portail des Thèses
Vers un portail des ThèsesY. Nicolas
 
Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)Y. Nicolas
 
Livres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseauLivres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseauY. Nicolas
 
Calames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EADCalames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EADY. Nicolas
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesY. Nicolas
 

Plus de Y. Nicolas (16)

SOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicatorSOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicator
 
From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.
 
Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)
 
Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014
 
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
 
Sudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de données
 
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
 
IdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABESIdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABES
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)
 
Vers un portail des Thèses
Vers un portail des ThèsesVers un portail des Thèses
Vers un portail des Thèses
 
Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)
 
Livres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseauLivres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseau
 
Calames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EADCalames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EAD
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartes
 

Dernier

présentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurprésentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurdinaelchaine
 
Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipM2i Formation
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
Présentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxPrésentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxpopzair
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptssusercbaa22
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...Faga1939
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptxSAID MASHATE
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxlamourfrantz
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.Franck Apolis
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxssusercbaa22
 
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfMICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfssuser40e112
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptssusercbaa22
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxssuserbd075f
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertChristianMbip
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...M2i Formation
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
Grammaire pour les élèves de la 6ème.doc
Grammaire pour les élèves de la  6ème.docGrammaire pour les élèves de la  6ème.doc
Grammaire pour les élèves de la 6ème.docKarimKhrifech
 

Dernier (20)

présentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteurprésentation sur l'échafaudage dans des travaux en hauteur
présentation sur l'échafaudage dans des travaux en hauteur
 
Formation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadershipFormation M2i - Comprendre les neurosciences pour développer son leadership
Formation M2i - Comprendre les neurosciences pour développer son leadership
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
Présentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptxPrésentation de cartes d'extension zhr..pptx
Présentation de cartes d'extension zhr..pptx
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
MaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.pptMaintenanceLa Maintenance Corrective.ppt
MaintenanceLa Maintenance Corrective.ppt
 
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
LA MONTÉE DE L'ÉDUCATION DANS LE MONDE DE LA PRÉHISTOIRE À L'ÈRE CONTEMPORAIN...
 
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
666148532-Formation-Habilitation-ELECTRIQUE-ENTREPRISE-MARS-2017.pptx
 
Cours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptxCours-irrigation_et_drainage_cours1.pptx
Cours-irrigation_et_drainage_cours1.pptx
 
A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.A3iFormations, organisme de formations certifié qualiopi.
A3iFormations, organisme de formations certifié qualiopi.
 
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptxApproche-des-risques-par-l’analyse-des-accidents-1.pptx
Approche-des-risques-par-l’analyse-des-accidents-1.pptx
 
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdfMICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
MICROBIOLOGIE ENDODONTIQUE english and frensh 25 nov 2020.pdf
 
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.pptMécanique Automobile LE TURBOCOMPRESSEUR.ppt
Mécanique Automobile LE TURBOCOMPRESSEUR.ppt
 
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptxSUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
SUPPORT DE SUR COURS_GOUVERNANCE_SI_M2.pptx
 
systeme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expertsysteme expert_systeme expert_systeme expert
systeme expert_systeme expert_systeme expert
 
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
Formation M2i - Intelligence Artificielle Comment booster votre productivité ...
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Grammaire pour les élèves de la 6ème.doc
Grammaire pour les élèves de la  6ème.docGrammaire pour les élèves de la  6ème.doc
Grammaire pour les élèves de la 6ème.doc
 

web de données / bib

  • 1. Le web de données enssib :: 12 octobre 2012
  • 2. Plan • Partir de ce qu’on connaît : – Base de données + Web = web de données • Vertus de RDF • Champs de bataille – Syntaxes – Vocabulaires – Workflows – Agrégateurs
  • 3. Le web de données, c’est pas quoi ? Base Web Documents GED Le Web = Web de documents Données Base de données Web de données
  • 4. Le Web, web de documents Données Documents Base de données Hyperlien Base de données
  • 6. Un archipel d’icebergs • Les données sont cachées sous les pages HTML (deep web) • Seules les pages HTML sont liées entre elles • Les pages HTML sont faites pour les humains • Ce que veulent les machines, ce sont des données • et des données liées – car elles se complètent les unes les autres – car les liens permettent de naviguer et de découvrir • Et des liens qualifiés, signifiants – au-delà du « voir aussi » des hyperliens
  • 7. Le web de données liées Données Documents Base de données Liens entre les Hyperlien bases de données Base de données
  • 8. Le web de données liées Données Documents Base de données Liens entre les Hyperlien bases de données Base de données
  • 9. Persée Une base de données DOCUMENTS id auteur titre doi :10.3406/mefr.1959.7458 auteur_mefr_1904 Retractatio Lien interne à la base AUTEURS id nom auteur_mefr_1904 Paul Veyne
  • 10. Sudoc + IdRef Une autre base de données LIVRES id z7XX titrepropre editeur 068391307 027182800 Le Pain et le cirque Le Seuil Lien interne à la base PERSONNES id nom personnetype 027182800 Veyne, Paul (1930-…. 0
  • 11. DOCUMENTS #1 Comment lier la donnée d’une base id auteur titre à la donnée de l’autre base ? doi :10.3406/mefr. auteur_mefr_1904 Retractatio 1959.7458 #2 Comment lier deux bases AUTEURS qui n’ont pas le même schéma id nom #3 Comment qualifier auteur_mefr_1904 Paul Veyne la nature de ce lien ? #4 Comment faire tout ça sur le Web, en surface ? LIVRES id z7XX titrepropre editeur 068391307 027182800 Le Pain et le Le Seuil cirque PERSONNES est la même id nom personnetype entité que 027182800 Veyne, Paul (1930-…. 0
  • 13. Le nuage du web de données liées
  • 14. Le nuage du web de données liées
  • 15. Les données ABES sur le web de données, avec IdRef pour pivot
  • 16. RDF UN MODÈLE GÉNÉRAL POUR DÉCRIRE … N’IMPORTE QUOI
  • 17. RDF = Graphes « Paul Veyne » auteur_mefr_1904 doi:10.3406/ mefr.1959.7458 « Retractatio » En RDF, • une ressource (qch) est en relation avec a telle relation avec • soit une autre ressource qch qch • soit un mot qch a telle relation avec « mot »
  • 18. Nommer les relations « Paul Veyne » auteur_mefr_1904 doi:10.3406/ mefr.1959.7458 « Retractatio » Les relations (prédicats) ont un nom précis. Ce nom est une URL. ex : dc:title = http://purl.org/dc/elements/1.1/title rda:title | abes:title | isbd:title
  • 19. Nommer les ressources « Paul Veyne » http://www.per see.fr/auteur_m efr_1904/id http://dx.doi.org/ doi:10.3406/ mefr.1959.7458 « Retractatio » Les entités (ressources) ont un nom précis. Ce nom est une URL. ex : http://dx.doi.org/doi:10.3406/mefr.1959.7458 ex : http://www.sudoc.fr/092673007/id
  • 20. Des graphes aux triplets « Paul Veyne » http://www.per see.fr/auteur_m efr_1904/id http://dx.doi.org/ doi:10.3406/ mefr.1959.7458 « Retractatio » Ecrire ce graphe <http://dx.doi.org/doi:10.3406/mefr.1959.7458> dc:title « Retractatio ». <http://dx.doi.org/doi:10.3406/mefr.1959.7458> dcterms:creator <http://www.persee.fr/auteur_mefr_1904/id>. < http://www.persee.fr/auteur_mefr_1904/id > foaf:name « Paul Veyne ». Triplets RDF
  • 21. 2 bases séparées « Paul Veyne » http://www.per see.fr/auteur_m efr_1904/id http://dx.doi.org/ doi:10.3406/ mefr.1959.7458 « Retractatio » http://dx.doi.org/ truc:subject http://id.loc.gov/au skos:prefLabel doi:10.3406/ thorities/subjects/s « Credit » mefr.1959.7458 h85033856 Deux sites en RDF peuvent parler de la même chose – explicitement ici (même nom (URL)).
  • 22. On agrège les 2 bases « Paul Veyne » http://www.per see.fr/auteur_me fr_1904/id http://dx.doi.org/ « Retractatio » doi:10.3406/ mefr.1959.7458 http://id.loc.gov/au skos:prefLabel thorities/subjects/s « Credit » h85033856 L’agrégation des données est immédiate Deux sites en RDF peuvent parler de la même chose. Mais pas forcément de la même manière (pas de schéma ou de vocabulaire unique)
  • 23. 2 bases séparées « Paul Veyne » http://www.per see.fr/auteur_m efr_1904/id http://dx.doi.org/ doi:10.3406/ mefr.1959.7458 « Retractatio » truc:subject http://id.loc.gov/au skos:prefLabel http://www.truc. « Credit » thorities/subjects/s co.nz/wyz123 h85033856 Deux sites en RDF peuvent parler de la même chose – implicitement ici (deux noms différents !)  Problème pour les agréger
  • 24. 2 bases séparées « Paul Veyne » http://www.per see.fr/auteur_m efr_1904/id http://dx.doi.org/ doi:10.3406/ mefr.1959.7458 « Retractatio » truc:subject http://id.loc.gov/au skos:prefLabel http://www.truc. « Credit » thorities/subjects/s co.nz/wyz123 h85033856 http://dx.doi.org/ doi:10.3406/ mefr.1959.7458  Dire explicitement qu’il s’agit de la même entité avec owl:sameAs
  • 25. On agrège les 2 bases « Paul Veyne » owl:sameAs http://www.per see.fr/auteur_me fr_1904/id http://dx.doi.org/ doi:10.3406/ mefr.1959.7458 « Retractatio » http://id.loc.gov/au skos:prefLabel http://www.truc. « Credit » thorities/subjects/s co.nz/wyz123 truc:subject h85033856 owl:sameAs Grâce à owl:sameAS, la fusion est totale : tout ce qu’on dit de l’un est aussi vrai de l’autre
  • 26. Paul Veyne dans le RDF de VIAF http://viaf.org/viaf/108250528/rdf.xml http://viaf.org /viaf/108250528 Le Veyne owl:sameAs de VIAF et le Veyne d’IdRef ne font qu’un http://www.idref.fr /027182800/id
  • 27. On ajoute un peu de sémantique rda:subject http://id.loc.gov/au skos:prefLabel http://www.truc. « Credit » thorities/subjects/s co.nz/wyz123 h85033856 rdfs:subPropertyOf Schémas RDF rda:subject dcterms:subject Ontologies Le schéma RDF ajoute des informations sur le vocabulaire utilisé (propriétés des propriétés et des classes) Ce qui permet de faire du raisonnement 
  • 28. On en déduit que… rda:subject http://id.loc.gov/au skos:prefLabel http://www.truc. « Credit » thorities/subjects/s co.nz/wyz123 h85033856 rdfs:subPropertyOf Schémas RDF rda:subject dcterms:subject Ontologies http://www.truc. dcterms:subject http://id.loc.gov/au co.nz/wyz123 thorities/subjects/s Triplets déduits h85033856 Le raisonnement permet d’ajouter des informations (triplets). En l’occurrence, il permet d’exprimer automatiquement en Dublin Core un triplet qui utilisait un vocabulaire truc non standard
  • 29. Aujourd’hui Fonds Calames Livre Sudoc Auteur IdRef Thèse theses.fr owl:sameAs Auteur VIAF Auteur BnF owl:sameAs Auteur Auteur ISNI Wikipedia
  • 30. Demain Fonds Calames Livre Sudoc Auteur IdRef Thèse theses.fr owl:sameAs Auteur VIAF Auteur BnF Auteur Auteur ISNI Wikipedia
  • 31. + articles, éditions scientifiques, Après-demain peut-être ? Fonds numérisation, etc. Calames Livre Worldcat Livre Sudoc cite Auteur IdRef Données Thèse brutes theses.fr a pour owl:sameAs + brevets, projets ANR, dérivé etc. Auteur HAL CCSD Auteur VIAF Article HAL CCSD Auteur BnF owl:sameAs + CrossRef, revues, indicateurs d’usage, etc. Auteur Auteur ISNI Wikipedia
  • 33. Vertu Effet RDF offre un modèle universel Inutile de chercher le format qui permet d’exprimer toute miracle qui marchera pour donnée, quelle que soit la le MARC du Sudoc et norme de description. d’IdRef, le TEF de Cela rend bien plus facile STAR, l’EAD de l’agrégation de données Calames, l’ONIX de tel diverses éditeur, le A++ de Springer (Lic. Nat.), le Bloubiboulga de tel autre, etc. #abes #hubdedonnées
  • 34. Vertu Effet RDF n’impose pas de schéma Devons-nous utiliser RDA, unique. On peut mixer les Dublin Core ou un vocabulaires vocabulaire bibliographique à nous ? On peut faire les trois. On peut aussi utiliser un vocabulaire dont le schéma explicite ses relations avec un vocabulaire standard (cf. truc:subject et dcterms:subject) #ouverturedesdonnées #hubdedonnées
  • 35. Vertu Effet RDF rend les données La notice d’autorité n’a pas extensibles. besoin de tout stocker sur une personne. Il vaut mieux en dire le strict nécessaire et faire des liens vers d’autres sources (ex : dictionnaires biographiques … en RDF) Idem pour les données bibliographiques (prix, recensions, influences, etc.) #idref #ist #wikipedia #webofdata
  • 36. DOCUMENTS id auteur titre doi :10.3406/mefr. auteur_mefr_1904 Retractatio 1959.7458 AUTEURS id nom auteur_mefr_1904 Paul Veyne LIVRES id z7XX titrepropre editeur 068391307 027182800 Le Pain et le Le Seuil cirque PERSONNES est la même id nom personnetype entité que 027182800 Veyne, Paul (1930-…. 0
  • 37. id auteur type id titre type doi :10.3406/mefr. auteur_mefr_1904 Document doi :10.3406/mef Retractatio Document 1959.7458 r.1959.7458 2 2 id nom type id sameAs auteur_mefr_1904 Paul Veyne Personne 2 auteur_mefr_1904 027182800 1 On éclate nos bases ! Tel ID désigne la même entité que tel autre ID A la limite, 1 base = 1 triplet 068391307 titrepropre «Le Pain et le cirque» id S’applique à id titrepropre z7XX Personne 068391307 Le Pain et le cirque 1 1 La relation z7XX porte toujours id editeur id type sur des entités de type Personne. 068391307 Le Seuil 068391307 Livre 1 1 Donc, on peut en conclure que 027182800 est de type Personne. id z7XX id nom 068391307 027182800 027182800 Veyne, Paul (1930-…. [Pas la peine de le dire, 1 1 on le déduit (Raisonnement)]
  • 38. Vertu Effet RDF permet de raisonner sur Dans le projet SudocAD, on a les données, pour les essayé de déduire quelle enrichir ou contrôler leur est la bonne autorité à lier à cohérence une notice bibliographique. #hubdedonnées #sudocad #qualinca
  • 39. Vertu Effet RDF a son propre langage SPARQL permet d’interroger d’interrogation des les données telles qu’on les données : SPARQL a modélisées – et non l’inverse : modéliser de telle manière pour pouvoir interroger ceci ou cela #marché #niche #ouvrezlesfenêtres
  • 40. Les données <http://dx.doi.org/doi:10.3406/mefr.1959.7458> dc:title « Retractatio ». <http://dx.doi.org/doi:10.3406/mefr.1959.7458> dcterms:creator <http://www.persee.fr/auteur904/id>. < http://www.persee.fr/auteur904/id > foaf:name « Paul Veyne ». La requête SELECT ?truc { ?truc dc:title « Retractatio ». ?truc dcterms:creator ?bidule. ? bidule foaf:name « Paul Veyne ». } La réponse <http://dx.doi.org/doi:10.3406/mefr.1959.7458>
  • 41. Vertu Effet RDF, c’est pas réservé aux Les bibliothèques peuvent bibliothécaires accéder à un marché générique : – Logiciels – Services – Ressources humaines – Formations – Consultants #marché #niche #ouvrezlesfenêtres
  • 43. Quelle(s) syntaxe(s) RDF ? Différentes syntaxes possibles Ce qui compte • RDF en XML • C’est le modèle (spo) et le • RDF Ntriples contenu (tel vocabulaire…) • RDF N3 • RDF Turtle • RDF dans la page web ou • RDFa dans une autre page ? • Microdata • Ou dans les deux ? – Et alors, même contenu ou variantes ? • Excel-RDF ;) #rdf #syntaxe #rdf #rdfa #microdata
  • 44. Quel(s) vocabulaire(s) RDF ? Différentes manières de dire la même chose Questions ? • dc:title • Utiliser un vocabulaire pro • rda:title spécialisé (RDA, FRBRoo) ou un vocabulaire « grand – rda:titleProper public (schema.org, • schema:name Facebook Open Graph) ? • og:title • Les deux (redondance, un • Etc. peu, bcp…) • En principe, un outil de raisonnement peut passer d’un vocabulaire à l’autre, mais dans les faits… #rdf #vocabulaires
  • 45. Quel(s) vocabulaire(s) RDF dans quelle syntaxe ? Un compromis possible Côté cour Côté jardin • Utiliser un vocabulaire • Utiliser les vocabulaires pro grand public dans le RDF dans des pages dédiées aux des pages HTML (RDFa) métadonnées (RDF/XML, – Notamment pour les moteurs NTriples…) de recherche comme Google ou Yahoo #rdf #vocabulaires
  • 46. Workflows. Du RDF à tous les étages ? RDF pas partout Questions • Ouverture des données OK • RDF juste pour l’extérieur ? • Stockage des données ? • Technologies assez mures et • Manipulation des données ? performantes pour • Edition des données par un stockage, manipulation et utilisateur professionnel ? recherche à grande échelle ? • L’utilisateur professionnel doit-il comprendre RDF ? Jusqu’où ? #rdf #technologies #formation
  • 47.
  • 48. Les grossistes du RDF Acteurs • Moteurs de recherche généralistes • La publication des – Google (dont Freebase) métadonnées RDF peut et doit – Yahoo être décentralisée (sources de • Moteurs de recherche RDF référence) généralistes – Sindice • Mais il faut bien agréger pour – FactForge – Recherche intégrée • Moteur de recherche RDF – Enrichissement spécialisé • Garder les données ouvertes – Isidore – Quelles conditions juridiques ? • Hébergeur de données et de – Métadonnées de provenance services – Kasabi • Gérer les doublons de triplets – Sindice – Provenance, confiance… – Freebase – Et autre data marketplaces cf #rdf #opendata #centralisation #web
  • 49. En savoir plus • Infos : http://punktokomo.abes.fr/tag/semantique-web/ • Outil : inspector.sindice.com • Tutos : http://web-semantique.developpez.com/tutoriels/