SlideShare une entreprise Scribd logo
Vers le web de données




#tutoriel #30’ #jabes2012
Le web de données,
              c’est pas quoi ?

                      Base              Web


Documents             GED              Le Web =
                                   Web de documents



 Données         Base de données   Web de données
Le Web, web de documents

   Données      Documents




   Base de
   données


                       Hyperlien




   Base de
   données
http://fyeah-icebergs.tumblr.com/post/1063474140
Un archipel d’icebergs
• Les données sont cachées sous les pages HTML
  (deep web)
• Seules les pages HTML sont liées entre elles
• Les pages HTML sont faites pour les humains
• Ce que veulent les machines, ce sont des
  données
     • et des données liées
         – car elles se complètent les unes les autres
         – car les liens permettent de naviguer et de découvrir
     • Et des liens qualifiés, signifiants
         – au-delà du « voir aussi » des hyperliens
Le web de données liées

             Données   Documents




             Base de
             données


Liens entre les               Hyperlien
bases de données



             Base de
             données
Le web de données liées

               Données       Documents




               Base de
               données


Liens entre les                     Hyperlien
bases de données



                   Base de
                   données
Persée



                  Une base de données

                                          DOCUMENTS
     id                            auteur             titre
     doi :10.3406/mefr.1959.7458   auteur_mefr_1904   Retractatio




Lien interne à la base

                                            AUTEURS
     id                            nom
     auteur_mefr_1904              Paul Veyne
Sudoc + IdRef

                            Une autre
                         base de données

                                            LIVRES
          id             z7XX                     titrepropre                 editeur
          068391307      027182800                Le Pain et le cirque        Le Seuil




Lien interne à la base

                                        PERSONNES
          id                    nom                                      personnetype
          027182800             Veyne, Paul (1930-….                     0
DOCUMENTS                                        #1 Comment lier
                                                                      la donnée d’une base
id                   auteur             titre                         à la donnée de l’autre base ?
doi :10.3406/mefr.   auteur_mefr_1904   Retractatio
1959.7458
                                                                      #2 Comment lier deux bases
                       AUTEURS                                        qui n’ont pas le même schéma
id                   nom                                              #3 Comment qualifier
auteur_mefr_1904     Paul Veyne
                                                                      la nature de ce lien ?

                                                                      #4 Comment faire tout ça sur
                                                                      le Web, en surface ?



                                                                      LIVRES
                                              id          z7XX             titrepropre editeur
                                              068391307   027182800        Le Pain et le       Le Seuil
                                                                           cirque

                                                                 PERSONNES
             est la même
                                              id               nom                         personnetype
             entité que
                                              027182800        Veyne, Paul (1930-….        0
COMMENT ARRIVER À ÇA ?
Le nuage du web de données liées
Le nuage du web de données liées
Les données ABES sur le web de données,
         avec IdRef pour pivot
RDF

UN MODÈLE GÉNÉRAL POUR
DÉCRIRE … N’IMPORTE QUOI
RDF = Graphes                                                                                 « Paul Veyne »


                                                auteur_mefr_1904




           doi:10.3406/
          mefr.1959.7458



                                                 « Retractatio »




En RDF,
          • une ressource (qch) est en relation avec
                                                                   a telle relation avec
               • soit une autre ressource                  qch                              qch


               • soit un mot                               qch
                                                                   a telle relation avec
                                                                                           « mot »
Nommer les relations                                                              « Paul Veyne »


                                                 auteur_mefr_1904




            doi:10.3406/
           mefr.1959.7458



                                                  « Retractatio »




Les relations (prédicats) ont un nom précis.
Ce nom est une URL.                     ex : dc:title = http://purl.org/dc/elements/1.1/title
                                             rda:title | abes:title | isbd:title
Nommer les ressources                                                         « Paul Veyne   »

                                              http://www.per
                                              see.fr/auteur_m
                                              efr_1904/id


        http://dx.doi.org/
           doi:10.3406/
         mefr.1959.7458

                                               « Retractatio »




Les entités (ressources) ont un nom précis.
Ce nom est une URL.                    ex : http://dx.doi.org/doi:10.3406/mefr.1959.7458
                                       ex : http://www.sudoc.fr/092673007/id
Des graphes aux triplets                                                               « Paul Veyne   »

                                                    http://www.per
                                                    see.fr/auteur_m
                                                    efr_1904/id


         http://dx.doi.org/
            doi:10.3406/
          mefr.1959.7458

                                                     « Retractatio »




                                         Ecrire ce graphe


<http://dx.doi.org/doi:10.3406/mefr.1959.7458> dc:title « Retractatio ».
<http://dx.doi.org/doi:10.3406/mefr.1959.7458> dcterms:creator <http://www.persee.fr/auteur_mefr_1904/id>.

< http://www.persee.fr/auteur_mefr_1904/id > foaf:name « Paul Veyne »


                                            Triplets RDF
2 bases séparées                                                                    « Paul Veyne   »

                                             http://www.per
                                             see.fr/auteur_m
                                             efr_1904/id


        http://dx.doi.org/
           doi:10.3406/
         mefr.1959.7458

                                               « Retractatio »




         http://dx.doi.org/   truc:subject   http://id.loc.gov/au   skos:prefLabel
            doi:10.3406/                     thorities/subjects/s                        « Credit »
          mefr.1959.7458                     h85033856




Deux sites en RDF peuvent parler de la même chose – explicitement ici (même nom (URL)).
On agrège les 2 bases                                                             « Paul Veyne   »


                                              http://www.per
                                            see.fr/auteur_me
                                            fr_1904/id




     http://dx.doi.org/                      « Retractatio »
        doi:10.3406/
      mefr.1959.7458




                                           http://id.loc.gov/au   skos:prefLabel
                                           thorities/subjects/s                        « Credit »
                                           h85033856




L’agrégation des données est immédiate
Deux sites en RDF peuvent parler de la même chose.
Mais pas forcément de la même manière (pas de schéma ou de vocabulaire unique)
2 bases séparées                                                                     « Paul Veyne   »

                                              http://www.per
                                              see.fr/auteur_m
                                              efr_1904/id


        http://dx.doi.org/
           doi:10.3406/
         mefr.1959.7458

                                                « Retractatio »




                             truc:subject     http://id.loc.gov/au   skos:prefLabel
         http://www.truc.                                                                 « Credit »
                                              thorities/subjects/s
          co.nz/wyz123                        h85033856




Deux sites en RDF peuvent parler de la même chose – implicitement ici (deux noms différents !)
 Problème pour les agréger
2 bases séparées                                                                 « Paul Veyne   »

                                          http://www.per
                                          see.fr/auteur_m
                                          efr_1904/id


      http://dx.doi.org/
         doi:10.3406/
       mefr.1959.7458

                                            « Retractatio »




                           truc:subject   http://id.loc.gov/au   skos:prefLabel
       http://www.truc.                                                               « Credit »
                                          thorities/subjects/s
        co.nz/wyz123                      h85033856


                                          http://dx.doi.org/
                                          doi:10.3406/
                                          mefr.1959.7458




 Dire explicitement       qu’il s’agit de la même entité avec owl:sameAs
On agrège les 2 bases                                                                  « Paul Veyne   »


         owl:sameAs                                 http://www.per
                                                  see.fr/auteur_me
                                                  fr_1904/id

         http://dx.doi.org/
            doi:10.3406/
          mefr.1959.7458

                                                   « Retractatio »




                                                 http://id.loc.gov/au   skos:prefLabel
          http://www.truc.                                                                   « Credit »
                                                 thorities/subjects/s
           co.nz/wyz123       truc:subject       h85033856



        owl:sameAs


Grâce à owl:sameAS, la fusion est totale : tout ce qu’on dit de l’un est aussi vrai de l’autre
Paul Veyne dans le RDF de VIAF
                                     http://viaf.org/viaf/108250528/rdf.xml

  http://viaf.org
 /viaf/108250528
                                                                 Le Veyne
      owl:sameAs




                                                                 de VIAF
                                                                 et
                                                                 le Veyne
                                                                 d’IdRef
                                                                 ne font
                                                                 qu’un
http://www.idref.fr
  /027182800/id
On ajoute un peu de sémantique

                       truc:subject
                                          http://id.loc.gov/au    skos:prefLabel
    http://www.truc.                                                               « Credit »
                                          thorities/subjects/s
     co.nz/wyz123                         h85033856




                          rdfs:subPropertyOf                                        Schémas RDF
      truc:subject                                          dcterms:subject
                                                                                    Ontologies




Le schéma RDF ajoute des informations sur le vocabulaire utilisé (propriétés des propriétés et
des classes)
Ce qui permet de faire du raisonnement 
On en déduit que…

                        truc:subject
                                          http://id.loc.gov/au     skos:prefLabel
    http://www.truc.                                                                « Credit »
                                          thorities/subjects/s
     co.nz/wyz123                         h85033856




                           rdfs:subPropertyOf                                        Schémas RDF
       truc:subject                                         dcterms:subject
                                                                                     Ontologies




     http://www.truc.
                        dcterms:subject     http://id.loc.gov/au
      co.nz/wyz123
                                            thorities/subjects/s                     Triplets déduits
                                            h85033856




Le raisonnement permet d’ajouter des informations (triplets).
En l’occurrence, il permet d’exprimer automatiquement en Dublin Core un triplet qui utilisait
un vocabulaire truc non standard
Aujourd’hui                     Fonds
                               Calames



               Livre
              Sudoc

                                                          Auteur IdRef


                    Thèse
                   theses.fr
                                                                  owl:sameAs



                                                              Auteur
                                                               VIAF

                               Auteur
                                BnF                  owl:sameAs



                                                                  Auteur
                                          Auteur                   ISNI
                                         Wikipedia
Demain                     Fonds
                          Calames



          Livre
         Sudoc

                                                      Auteur IdRef


               Thèse
              theses.fr



                                                owl:sameAs

                                                          Auteur
                                                           VIAF

                          Auteur
                           BnF




                                                             Auteur
                                     Auteur                   ISNI
                                    Wikipedia
+ articles, éditions
                                                                          scientifiques,
  Après-demain peut-être ?                                  Fonds         numérisation, etc.
                                                           Calames

        Livre
       Worldcat
                                           Livre
                                          Sudoc

                                cite                                                       Auteur IdRef

         Données                                Thèse
          brutes                               theses.fr

                                     a pour                                      owl:sameAs
+ brevets,
projets ANR,
                                     dérivé
etc.                                                Auteur
                                                   HAL CCSD
                                                                                                 Auteur
                                                                                                  VIAF
                    Article
                   HAL CCSD
                                                           Auteur
                                                            BnF                  owl:sameAs
                   +
                   CrossRef, revue
                   s, indicateurs
                   d’usage, etc.
                                                                                                   Auteur
                                                                      Auteur                        ISNI
                                                                     Wikipedia
http://www.flickr.com/photos/danbri/6233467501/
http://www.circuitdomain.com/PCB%20Prototyping/PCB.htm
ABES, charte graphique (circa 2000)
Vertu                                   Effet
RDF offre un modèle universel   Inutile de chercher le format
  qui permet d’exprimer toute      miracle qui marchera pour
  donnée, quelle que soit la       le MARC du Sudoc et
  norme de description.            d’IdRef, le TEF de STAR,
Cela rend bien plus facile         l’EAD de Calames, l’ONIX de
  l’agrégation de données          tel éditeur, le A++ de
  diverses                         Springer (Lic. Nat.), le
                                   Bloubiboulga de tel autre,
                                   etc.



                                #abes #hubdedonnées #istex
Vertu                           Effet
RDF rend les données   La notice d’autorité n’a pas
  extensibles.             besoin de tout stocker sur
                           une personne.
                       Il vaut mieux en dire le strict
                           nécessaire et faire des liens
                           vers d’autres sources (ex :
                           dictionnaires biographiques
                           … en RDF)
                       Idem pour les données
                           bibliographiques (prix,
                           recensions, influences, etc.)

                       #idref #ist #wikipedia #webofdata
Vertu                                 Effet
RDF n’impose pas de schéma    Devons-nous utiliser
  unique. On peut mixer les     RDA, Dublin Core ou un
  vocabulaires                  vocabulaire bibliographique
                                à nous ?
                              On peut faire les trois.
                              On peut aussi utiliser un
                                vocabulaire dont le schéma
                                explicite ses relations avec
                                un vocabulaire standard
                              (cf. truc:subject et dcterms:subject)

                              #ouverturedesdonnées #hubdedonnées #istex
Vertu                                 Effet
RDF permet de raisonner sur    Dans le projet SudocAD, on a
  les données, pour les          essayé de déduire quelle
  enrichir ou contrôler leur     est la bonne autorité à lier à
  cohérence                      une notice bibliographique




                               #hubdedonnées #sudocad #qualinca
En savoir plus

• Infos : http://punktokomo.abes.fr/tag/semantique-web/

• Outil : inspector.sindice.com

• Tutos : http://web-semantique.developpez.com/tutoriels/

Contenu connexe

En vedette

Memoria actividades artediez 13-14
Memoria actividades artediez 13-14Memoria actividades artediez 13-14
Memoria actividades artediez 13-14
Belén López
 
2 y 3
2 y 32 y 3
2 y 3
L3Nhita
 
Nexity - indicateur du logement neuf - septembre 2015
Nexity - indicateur du logement neuf - septembre 2015Nexity - indicateur du logement neuf - septembre 2015
Nexity - indicateur du logement neuf - septembre 2015
Monimmeuble.com
 
8. casos de impunidad
8.  casos de impunidad8.  casos de impunidad
001
001001
001
lucalm
 
Valores Humanos
Valores HumanosValores Humanos
Valores Humanos
mariajosegarciagonzalez
 
Introduction au chiffrement
Introduction au chiffrementIntroduction au chiffrement
Introduction au chiffrement
Jérôme aka "Genma" Kun
 
Figaronron - Retour à Paradisio 07 (26-07-2008)
Figaronron - Retour à Paradisio 07 (26-07-2008)Figaronron - Retour à Paradisio 07 (26-07-2008)
Figaronron - Retour à Paradisio 07 (26-07-2008)Figaronron Figaronron
 
Proyecto sena[1][1][1][1]
Proyecto sena[1][1][1][1]Proyecto sena[1][1][1][1]
Proyecto sena[1][1][1][1]
valeria
 
Lagode galilea
Lagode galileaLagode galilea
Lagode galilea
bernal27
 
10 ideias contundentes do Papa Francisco
10 ideias contundentes do Papa Francisco10 ideias contundentes do Papa Francisco
10 ideias contundentes do Papa Francisco
João Carlos Nara Júnior
 
Copia de estudio mincetur para regiones
Copia de estudio mincetur  para regionesCopia de estudio mincetur  para regiones
Copia de estudio mincetur para regiones
camara ilo
 
Curiosidades del mundo jn
Curiosidades del mundo jnCuriosidades del mundo jn
Curiosidades del mundo jn
guest57782a
 
Dp Conf De Presse Presentation Kit Audi
Dp Conf De Presse Presentation Kit AudiDp Conf De Presse Presentation Kit Audi
Dp Conf De Presse Presentation Kit Audijmfer
 
Resultados económicos iii trimestre 2011
Resultados económicos iii trimestre 2011Resultados económicos iii trimestre 2011
Resultados económicos iii trimestre 2011
Presidencia de la República del Ecuador
 
Ran ans Objekt. Immobilienakquise im Social Media Zeitalter
Ran ans Objekt. Immobilienakquise im Social Media ZeitalterRan ans Objekt. Immobilienakquise im Social Media Zeitalter
Ran ans Objekt. Immobilienakquise im Social Media Zeitalter
Michael Ehlers
 
Aparato locomotor
Aparato locomotorAparato locomotor
Aparato locomotor
LolaMartinez
 

En vedette (20)

Memoria actividades artediez 13-14
Memoria actividades artediez 13-14Memoria actividades artediez 13-14
Memoria actividades artediez 13-14
 
2 y 3
2 y 32 y 3
2 y 3
 
Nexity - indicateur du logement neuf - septembre 2015
Nexity - indicateur du logement neuf - septembre 2015Nexity - indicateur du logement neuf - septembre 2015
Nexity - indicateur du logement neuf - septembre 2015
 
8. casos de impunidad
8.  casos de impunidad8.  casos de impunidad
8. casos de impunidad
 
001
001001
001
 
Elnet
ElnetElnet
Elnet
 
Valores Humanos
Valores HumanosValores Humanos
Valores Humanos
 
Introduction au chiffrement
Introduction au chiffrementIntroduction au chiffrement
Introduction au chiffrement
 
Figaronron - Retour à Paradisio 07 (26-07-2008)
Figaronron - Retour à Paradisio 07 (26-07-2008)Figaronron - Retour à Paradisio 07 (26-07-2008)
Figaronron - Retour à Paradisio 07 (26-07-2008)
 
Proyecto sena[1][1][1][1]
Proyecto sena[1][1][1][1]Proyecto sena[1][1][1][1]
Proyecto sena[1][1][1][1]
 
Feature satip4
Feature satip4Feature satip4
Feature satip4
 
Lagode galilea
Lagode galileaLagode galilea
Lagode galilea
 
Presentatie krefeld 27032012_duits
Presentatie krefeld 27032012_duitsPresentatie krefeld 27032012_duits
Presentatie krefeld 27032012_duits
 
10 ideias contundentes do Papa Francisco
10 ideias contundentes do Papa Francisco10 ideias contundentes do Papa Francisco
10 ideias contundentes do Papa Francisco
 
Copia de estudio mincetur para regiones
Copia de estudio mincetur  para regionesCopia de estudio mincetur  para regiones
Copia de estudio mincetur para regiones
 
Curiosidades del mundo jn
Curiosidades del mundo jnCuriosidades del mundo jn
Curiosidades del mundo jn
 
Dp Conf De Presse Presentation Kit Audi
Dp Conf De Presse Presentation Kit AudiDp Conf De Presse Presentation Kit Audi
Dp Conf De Presse Presentation Kit Audi
 
Resultados económicos iii trimestre 2011
Resultados económicos iii trimestre 2011Resultados económicos iii trimestre 2011
Resultados económicos iii trimestre 2011
 
Ran ans Objekt. Immobilienakquise im Social Media Zeitalter
Ran ans Objekt. Immobilienakquise im Social Media ZeitalterRan ans Objekt. Immobilienakquise im Social Media Zeitalter
Ran ans Objekt. Immobilienakquise im Social Media Zeitalter
 
Aparato locomotor
Aparato locomotorAparato locomotor
Aparato locomotor
 

Plus de Y. Nicolas

SOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicatorSOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicator
Y. Nicolas
 
From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.
Y. Nicolas
 
Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)
Y. Nicolas
 
Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014
Y. Nicolas
 
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
Y. Nicolas
 
Sudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de données
Y. Nicolas
 
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Y. Nicolas
 
IdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABESIdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABES
Y. Nicolas
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
Y. Nicolas
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
Y. Nicolas
 
Le Web sémantique : un web de métadonnées
Le Web sémantique : un web de métadonnéesLe Web sémantique : un web de métadonnées
Le Web sémantique : un web de métadonnées
Y. Nicolas
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)
Y. Nicolas
 
Vers un portail des Thèses
Vers un portail des ThèsesVers un portail des Thèses
Vers un portail des Thèses
Y. Nicolas
 
Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)
Y. Nicolas
 
Livres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseauLivres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseau
Y. Nicolas
 
Calames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EADCalames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EAD
Y. Nicolas
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartes
Y. Nicolas
 

Plus de Y. Nicolas (17)

SOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicatorSOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicator
 
From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.
 
Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)
 
Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014
 
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
 
Sudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de données
 
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
 
IdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABESIdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABES
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
Le Web sémantique : un web de métadonnées
Le Web sémantique : un web de métadonnéesLe Web sémantique : un web de métadonnées
Le Web sémantique : un web de métadonnées
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)
 
Vers un portail des Thèses
Vers un portail des ThèsesVers un portail des Thèses
Vers un portail des Thèses
 
Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)
 
Livres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseauLivres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseau
 
Calames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EADCalames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EAD
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartes
 

Dernier

BATIMENT 5.pptx. Fil français tourné en France
BATIMENT 5.pptx. Fil français tourné en FranceBATIMENT 5.pptx. Fil français tourné en France
BATIMENT 5.pptx. Fil français tourné en France
Txaruka
 
Textes de famille concernant les guerres V2.pdf
Textes de famille concernant les guerres V2.pdfTextes de famille concernant les guerres V2.pdf
Textes de famille concernant les guerres V2.pdf
Michel Bruley
 
Dimensionnement réseau de transmission pour un réseau GSM-R - AIT KADDOUR Ghi...
Dimensionnement réseau de transmission pour un réseau GSM-R - AIT KADDOUR Ghi...Dimensionnement réseau de transmission pour un réseau GSM-R - AIT KADDOUR Ghi...
Dimensionnement réseau de transmission pour un réseau GSM-R - AIT KADDOUR Ghi...
MustaphaZhiri
 
Veille Audocdi 90 - mois de juin 2024.pdf
Veille Audocdi 90 - mois de juin 2024.pdfVeille Audocdi 90 - mois de juin 2024.pdf
Veille Audocdi 90 - mois de juin 2024.pdf
frizzole
 
Proyecto Erasmus Jardineros y jardineras de paz
Proyecto Erasmus Jardineros y jardineras de pazProyecto Erasmus Jardineros y jardineras de paz
Proyecto Erasmus Jardineros y jardineras de paz
Morzadec Cécile
 
Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union - Bilan de l'année 2023Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union
 
Presentation powerpoint sur la filiere electrotechnique
Presentation powerpoint sur la filiere electrotechniquePresentation powerpoint sur la filiere electrotechnique
Presentation powerpoint sur la filiere electrotechnique
mohammadaminejouini
 

Dernier (7)

BATIMENT 5.pptx. Fil français tourné en France
BATIMENT 5.pptx. Fil français tourné en FranceBATIMENT 5.pptx. Fil français tourné en France
BATIMENT 5.pptx. Fil français tourné en France
 
Textes de famille concernant les guerres V2.pdf
Textes de famille concernant les guerres V2.pdfTextes de famille concernant les guerres V2.pdf
Textes de famille concernant les guerres V2.pdf
 
Dimensionnement réseau de transmission pour un réseau GSM-R - AIT KADDOUR Ghi...
Dimensionnement réseau de transmission pour un réseau GSM-R - AIT KADDOUR Ghi...Dimensionnement réseau de transmission pour un réseau GSM-R - AIT KADDOUR Ghi...
Dimensionnement réseau de transmission pour un réseau GSM-R - AIT KADDOUR Ghi...
 
Veille Audocdi 90 - mois de juin 2024.pdf
Veille Audocdi 90 - mois de juin 2024.pdfVeille Audocdi 90 - mois de juin 2024.pdf
Veille Audocdi 90 - mois de juin 2024.pdf
 
Proyecto Erasmus Jardineros y jardineras de paz
Proyecto Erasmus Jardineros y jardineras de pazProyecto Erasmus Jardineros y jardineras de paz
Proyecto Erasmus Jardineros y jardineras de paz
 
Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union - Bilan de l'année 2023Bibliothèque de L'Union - Bilan de l'année 2023
Bibliothèque de L'Union - Bilan de l'année 2023
 
Presentation powerpoint sur la filiere electrotechnique
Presentation powerpoint sur la filiere electrotechniquePresentation powerpoint sur la filiere electrotechnique
Presentation powerpoint sur la filiere electrotechnique
 

Jabes2012 : tutoriel web de données

  • 1. Vers le web de données #tutoriel #30’ #jabes2012
  • 2. Le web de données, c’est pas quoi ? Base Web Documents GED Le Web = Web de documents Données Base de données Web de données
  • 3. Le Web, web de documents Données Documents Base de données Hyperlien Base de données
  • 5. Un archipel d’icebergs • Les données sont cachées sous les pages HTML (deep web) • Seules les pages HTML sont liées entre elles • Les pages HTML sont faites pour les humains • Ce que veulent les machines, ce sont des données • et des données liées – car elles se complètent les unes les autres – car les liens permettent de naviguer et de découvrir • Et des liens qualifiés, signifiants – au-delà du « voir aussi » des hyperliens
  • 6. Le web de données liées Données Documents Base de données Liens entre les Hyperlien bases de données Base de données
  • 7. Le web de données liées Données Documents Base de données Liens entre les Hyperlien bases de données Base de données
  • 8. Persée Une base de données DOCUMENTS id auteur titre doi :10.3406/mefr.1959.7458 auteur_mefr_1904 Retractatio Lien interne à la base AUTEURS id nom auteur_mefr_1904 Paul Veyne
  • 9. Sudoc + IdRef Une autre base de données LIVRES id z7XX titrepropre editeur 068391307 027182800 Le Pain et le cirque Le Seuil Lien interne à la base PERSONNES id nom personnetype 027182800 Veyne, Paul (1930-…. 0
  • 10. DOCUMENTS #1 Comment lier la donnée d’une base id auteur titre à la donnée de l’autre base ? doi :10.3406/mefr. auteur_mefr_1904 Retractatio 1959.7458 #2 Comment lier deux bases AUTEURS qui n’ont pas le même schéma id nom #3 Comment qualifier auteur_mefr_1904 Paul Veyne la nature de ce lien ? #4 Comment faire tout ça sur le Web, en surface ? LIVRES id z7XX titrepropre editeur 068391307 027182800 Le Pain et le Le Seuil cirque PERSONNES est la même id nom personnetype entité que 027182800 Veyne, Paul (1930-…. 0
  • 12. Le nuage du web de données liées
  • 13. Le nuage du web de données liées
  • 14. Les données ABES sur le web de données, avec IdRef pour pivot
  • 15. RDF UN MODÈLE GÉNÉRAL POUR DÉCRIRE … N’IMPORTE QUOI
  • 16. RDF = Graphes « Paul Veyne » auteur_mefr_1904 doi:10.3406/ mefr.1959.7458 « Retractatio » En RDF, • une ressource (qch) est en relation avec a telle relation avec • soit une autre ressource qch qch • soit un mot qch a telle relation avec « mot »
  • 17. Nommer les relations « Paul Veyne » auteur_mefr_1904 doi:10.3406/ mefr.1959.7458 « Retractatio » Les relations (prédicats) ont un nom précis. Ce nom est une URL. ex : dc:title = http://purl.org/dc/elements/1.1/title rda:title | abes:title | isbd:title
  • 18. Nommer les ressources « Paul Veyne » http://www.per see.fr/auteur_m efr_1904/id http://dx.doi.org/ doi:10.3406/ mefr.1959.7458 « Retractatio » Les entités (ressources) ont un nom précis. Ce nom est une URL. ex : http://dx.doi.org/doi:10.3406/mefr.1959.7458 ex : http://www.sudoc.fr/092673007/id
  • 19. Des graphes aux triplets « Paul Veyne » http://www.per see.fr/auteur_m efr_1904/id http://dx.doi.org/ doi:10.3406/ mefr.1959.7458 « Retractatio » Ecrire ce graphe <http://dx.doi.org/doi:10.3406/mefr.1959.7458> dc:title « Retractatio ». <http://dx.doi.org/doi:10.3406/mefr.1959.7458> dcterms:creator <http://www.persee.fr/auteur_mefr_1904/id>. < http://www.persee.fr/auteur_mefr_1904/id > foaf:name « Paul Veyne » Triplets RDF
  • 20. 2 bases séparées « Paul Veyne » http://www.per see.fr/auteur_m efr_1904/id http://dx.doi.org/ doi:10.3406/ mefr.1959.7458 « Retractatio » http://dx.doi.org/ truc:subject http://id.loc.gov/au skos:prefLabel doi:10.3406/ thorities/subjects/s « Credit » mefr.1959.7458 h85033856 Deux sites en RDF peuvent parler de la même chose – explicitement ici (même nom (URL)).
  • 21. On agrège les 2 bases « Paul Veyne » http://www.per see.fr/auteur_me fr_1904/id http://dx.doi.org/ « Retractatio » doi:10.3406/ mefr.1959.7458 http://id.loc.gov/au skos:prefLabel thorities/subjects/s « Credit » h85033856 L’agrégation des données est immédiate Deux sites en RDF peuvent parler de la même chose. Mais pas forcément de la même manière (pas de schéma ou de vocabulaire unique)
  • 22. 2 bases séparées « Paul Veyne » http://www.per see.fr/auteur_m efr_1904/id http://dx.doi.org/ doi:10.3406/ mefr.1959.7458 « Retractatio » truc:subject http://id.loc.gov/au skos:prefLabel http://www.truc. « Credit » thorities/subjects/s co.nz/wyz123 h85033856 Deux sites en RDF peuvent parler de la même chose – implicitement ici (deux noms différents !)  Problème pour les agréger
  • 23. 2 bases séparées « Paul Veyne » http://www.per see.fr/auteur_m efr_1904/id http://dx.doi.org/ doi:10.3406/ mefr.1959.7458 « Retractatio » truc:subject http://id.loc.gov/au skos:prefLabel http://www.truc. « Credit » thorities/subjects/s co.nz/wyz123 h85033856 http://dx.doi.org/ doi:10.3406/ mefr.1959.7458  Dire explicitement qu’il s’agit de la même entité avec owl:sameAs
  • 24. On agrège les 2 bases « Paul Veyne » owl:sameAs http://www.per see.fr/auteur_me fr_1904/id http://dx.doi.org/ doi:10.3406/ mefr.1959.7458 « Retractatio » http://id.loc.gov/au skos:prefLabel http://www.truc. « Credit » thorities/subjects/s co.nz/wyz123 truc:subject h85033856 owl:sameAs Grâce à owl:sameAS, la fusion est totale : tout ce qu’on dit de l’un est aussi vrai de l’autre
  • 25. Paul Veyne dans le RDF de VIAF http://viaf.org/viaf/108250528/rdf.xml http://viaf.org /viaf/108250528 Le Veyne owl:sameAs de VIAF et le Veyne d’IdRef ne font qu’un http://www.idref.fr /027182800/id
  • 26. On ajoute un peu de sémantique truc:subject http://id.loc.gov/au skos:prefLabel http://www.truc. « Credit » thorities/subjects/s co.nz/wyz123 h85033856 rdfs:subPropertyOf Schémas RDF truc:subject dcterms:subject Ontologies Le schéma RDF ajoute des informations sur le vocabulaire utilisé (propriétés des propriétés et des classes) Ce qui permet de faire du raisonnement 
  • 27. On en déduit que… truc:subject http://id.loc.gov/au skos:prefLabel http://www.truc. « Credit » thorities/subjects/s co.nz/wyz123 h85033856 rdfs:subPropertyOf Schémas RDF truc:subject dcterms:subject Ontologies http://www.truc. dcterms:subject http://id.loc.gov/au co.nz/wyz123 thorities/subjects/s Triplets déduits h85033856 Le raisonnement permet d’ajouter des informations (triplets). En l’occurrence, il permet d’exprimer automatiquement en Dublin Core un triplet qui utilisait un vocabulaire truc non standard
  • 28. Aujourd’hui Fonds Calames Livre Sudoc Auteur IdRef Thèse theses.fr owl:sameAs Auteur VIAF Auteur BnF owl:sameAs Auteur Auteur ISNI Wikipedia
  • 29. Demain Fonds Calames Livre Sudoc Auteur IdRef Thèse theses.fr owl:sameAs Auteur VIAF Auteur BnF Auteur Auteur ISNI Wikipedia
  • 30. + articles, éditions scientifiques, Après-demain peut-être ? Fonds numérisation, etc. Calames Livre Worldcat Livre Sudoc cite Auteur IdRef Données Thèse brutes theses.fr a pour owl:sameAs + brevets, projets ANR, dérivé etc. Auteur HAL CCSD Auteur VIAF Article HAL CCSD Auteur BnF owl:sameAs + CrossRef, revue s, indicateurs d’usage, etc. Auteur Auteur ISNI Wikipedia
  • 33. ABES, charte graphique (circa 2000)
  • 34. Vertu Effet RDF offre un modèle universel Inutile de chercher le format qui permet d’exprimer toute miracle qui marchera pour donnée, quelle que soit la le MARC du Sudoc et norme de description. d’IdRef, le TEF de STAR, Cela rend bien plus facile l’EAD de Calames, l’ONIX de l’agrégation de données tel éditeur, le A++ de diverses Springer (Lic. Nat.), le Bloubiboulga de tel autre, etc. #abes #hubdedonnées #istex
  • 35. Vertu Effet RDF rend les données La notice d’autorité n’a pas extensibles. besoin de tout stocker sur une personne. Il vaut mieux en dire le strict nécessaire et faire des liens vers d’autres sources (ex : dictionnaires biographiques … en RDF) Idem pour les données bibliographiques (prix, recensions, influences, etc.) #idref #ist #wikipedia #webofdata
  • 36. Vertu Effet RDF n’impose pas de schéma Devons-nous utiliser unique. On peut mixer les RDA, Dublin Core ou un vocabulaires vocabulaire bibliographique à nous ? On peut faire les trois. On peut aussi utiliser un vocabulaire dont le schéma explicite ses relations avec un vocabulaire standard (cf. truc:subject et dcterms:subject) #ouverturedesdonnées #hubdedonnées #istex
  • 37. Vertu Effet RDF permet de raisonner sur Dans le projet SudocAD, on a les données, pour les essayé de déduire quelle enrichir ou contrôler leur est la bonne autorité à lier à cohérence une notice bibliographique #hubdedonnées #sudocad #qualinca
  • 38. En savoir plus • Infos : http://punktokomo.abes.fr/tag/semantique-web/ • Outil : inspector.sindice.com • Tutos : http://web-semantique.developpez.com/tutoriels/