SlideShare une entreprise Scribd logo
Mettre nos données en réseau

         Yann NICOLAS
          ADBU 2009
Les données. Un enjeu politique
“Searchability and data formats are a problem in
 a large number of member states.
 Search functions are hard to use in several
 countries. In some countries they are non-
 existent.”

 “Several countries do provide the whole data in
 a CSV or XLS or other format – and this is
 welcomed as good practice. Many countries do
 not and worse still, a few countries appear to
 have designed their websites with the deliberate
 aim of obstructing screen scrapers.”
farmsubsidy.org , Evaluation of the implementation of transparency in CAP beneficiaries. Mai 2009
Association pour la transparence des données publiques

Va chercher les données « publiques », les nettoie, les
agrège, les republie, les rend exploitables par des
programmes informatiques(API)

Courtier ? Activiste ? Pirate ?
VERS
    UNE POLITIQUE PUBLIQUE
         DES DONNÉES


En général
Des données de l’IST en particulier

Fondée sur quels principes ?
MÉTADONNÉES = DONNÉES

 DONNÉES = MÉTADONNÉES

Métadonnées = informations sur des documents ?
Nos métadonnées parlent de tout. Ex: portail des
thèses
Les métadonnées sont partout – et pas seulement
dans les métiers de la doc.
SC2D

Service Commun de la Documentation et des Données
WEB DE DOCUMENTS
                        VS
            WEB DE DONNÉES

Le Web est une collection de documents (HTML,
PDF…)

Le Web devient une collection de bases de données
(RDF, RDFa)
hier   aujourd’hui   demain
Données




                                                 Page HTML



 LE CONTENU DES DONNÉES EST
UTILISÉ DANS UN DOCUMENT HTML

Le Document HTML est fait pour être lu par des
humains ;
pas pour être exploité par des programmes
hier   aujourd’hui   demain
Page HTML


  Données




                                                     HTML + RDFa


   LES DONNÉES SONT PRÉSENTES
     DANS LE DOCUMENT HTML


Le Document HTML + RDFa peut être lu par des humains et
exploité par des programmes
La base de données est dans le Web, pas sous le Web (deep Web)
<div>
   <span>Date : </span>
   <span content="1601/1700" property="dc:date">XVII<sup>e</sup>
siècle</span>
</div>


<http://www.calames.abes.fr/pub/ms/res/MAZB10378> <dc:date> "1601/1700"
AVEC RDFa, LES DONNÉES DE
  CALAMES SONT DANS LA BASE DE
        YAHOO, SINDICE…

On parle bien des données dans toute leur richesse !

RDFa est désormais supporté par les « grossistes » du
Web : Google, Yahoo.
HTTP://BOSS.YAHOOAPIS.COM/YSEARCH/WEB/V1/"ALGRIN SIT
                E: CALAMES.ABES.FR…




On peut accéder aux données de Calames à
travers les services de Yahoo
 Un tiers peut refaire Calames à partir de Yahoo
LE WEB DES DONNÉES DOIT AUSSI
     CONCERNER L’INFORMATION
    SCIENTIFIQUE, TECHNIQUE ET
                PATRIMONIALE
Pas seulement les produits commerciaux, les congrès,
les vidéos…
Cibles : Sudoc, HAL, Star, Bases CNRS, Persée,
Revues.org,…
POUR UN SERVICES PUBLIC DES
              DONNÉES BRUTES

         LAISSER LES AUTRES LES
                   RÉUTILISER

Exposer les données « à la cantonade »
On ignore à qui, à quoi elles peuvent servir
Permettre à d’autres de les réutiliser
Usages nouveaux, variés, spécialisés. Visualisations.
Combinaisons de différents corpus (mashups)
Contre les monopoles privés et les monopoles publics
LIER LES DONNÉES ENTRE ELLES

                 LINKED DATA


Le Web comme collection de base de données ?
Ou le Web comme base de données ?
 Interconnecter les bases
2 BASES DE DONNÉES EN RDF
     DÉCRIVENT LA MÊME PERSONNE

Base RDF accessible en ligne   Identifiant de Tricky (URL)


Dbpedia (Wikipedia en RDF)     http://dbpedia.org/resource/Tricky


BBC Music                      http://www.bbc.co.uk/music/artists/5bf64d94-
                               efd9-4334-96fd-e6197b0b02b8#artist
CONNECTER LES DEUX BASES RDF
 http://www.bbc.co.uk/music/artists/5bf64d
 94-efd9-4334-96fd-e6197b0b02b8#artist

       owl:sameAs

 http://dbpedia.org/resource/Tricky




Les informations des deux bases peuvent fusionner
C’est le principe d’un Web de données liées
COMMENT INTERCONNECTER LES
       BASES DE L’ABES ?
      DE L’IST FRANÇAISE ?


Aligner les identifiants des uns et des autres (avec
owl:sameAs) ?
Mieux : si possible, partager à la source les mêmes
identifiants
LES AUTORITÉS SUDOC,
            AU-DELÀ DU SUDOC



Normaliser les noms de personne en les liant aux autorités Sudoc,
pour :
       . Star
       . Calames
       . Persée
       . ORI-OAI
       . Adonis
       .?
POURQUOI SE LIER AUX AUTORITÉS
           SUDOC ?



Qualité interne de chaque base *
Economies d’échelle *
Enrichir chaque base avec les informations des autres ***
A terme, permettre des requêtes et des explorations plus riches ***
2006 –

   STAR ET CALAMES INTERROGENT
  LES AUTORITÉS SUDOC EN Z 39.50

Solution provisoire
Limitations :
       . Performances
       . Index limités
       . Et quand la notice d’autorité n’existe pas ?
2010 T1

     LES AUTORITÉS SUDOC COMME
          SERVICE PUBLIC
   POUR LES APPLICATIONS TIERCES


Lire et écrire !
Comme le réseau électrique ? Contribuer (solaire) et recevoir
Production décentralisée
Consommation décentralisée
2010
T1
2010-2011

        LES AUTORITÉS SUDOC AU
        SERVICE DU MÉTA-PORTAIL
                ADONIS
                  (SI FINANCEMENT   CONFIRMÉ)

Méta-portail = risque de l’auberge espagnole
Les autorités Sudoc comme pivot
Harmoniser en masse les noms du méta-portail
Avec les technologies du Web sémantique (RDF, ontologies,
règles)
Avec le CNRS : équipe RCR du laboratoire LIRMM (Mtpellier)
DANS LE CADRE DU PROJET AVEC
          ADONIS,

    Corpus de                             Lien aux
   métadonnées à                          autorités
      enrichir


            Données enrichies du lien aux autorités


L’UTILISATION DES TECHNOLOGIES
    SÉMANTIQUE EST INTERNE
DEMAIN

  LINKED DATA DE L’IST FRANÇAIS ?


Linked data : données ouvertes et liées
OUVRIR n’est pas le plus compliqué (sauf contraintes juridiques)
Le plus dur est de LIER - d’où l’importance des autorités

Ne suppose pas un Plan quinquennal centralisé
« Coopération décentralisée » des données
ABES
Département Etudes & Projets

nicolas@abes.fr

Contenu connexe

Tendances

Introduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensIntroduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sens
FICEL Hemza
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Gautier Poupeau
 
2015 ed spi
2015 ed spi2015 ed spi
2015 ed spi
catherine roussey
 
Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)
BorderCloud
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked data
VincentBroute
 
Web Sémantique — Linked Data
Web Sémantique — Linked DataWeb Sémantique — Linked Data
Web Sémantique — Linked Data
Klee Group
 
Linked open data pour la consommation des informations
Linked open data pour la consommation des informationsLinked open data pour la consommation des informations
Linked open data pour la consommation des informations
Eric Toguem
 
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Gautier Poupeau
 
Le Web de données et les bibliothèques
Le Web de données et les bibliothèquesLe Web de données et les bibliothèques
Le Web de données et les bibliothèques
Gautier Poupeau
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec Wikidata
BorderCloud
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
Fabien Gandon
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
Fabien Gandon
 
CRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de donnéesCRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de données
nonue12
 
Jabes 2012 - Tutoriel, vers le Web de données
Jabes 2012 - Tutoriel, vers le Web de donnéesJabes 2012 - Tutoriel, vers le Web de données
Jabes 2012 - Tutoriel, vers le Web de données
ABES
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens.
Fabien Gandon
 
L'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de BiblissimaL'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de Biblissima
Equipex Biblissima
 
Découverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HALDécouverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HAL
Gautier Poupeau
 
Interopérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archivesInteropérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archives
Pauline Moirez
 

Tendances (20)

Introduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensIntroduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sens
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
 
2015 ed spi
2015 ed spi2015 ed spi
2015 ed spi
 
Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)
 
RDF en quelques slides
RDF en quelques slidesRDF en quelques slides
RDF en quelques slides
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked data
 
Web Sémantique — Linked Data
Web Sémantique — Linked DataWeb Sémantique — Linked Data
Web Sémantique — Linked Data
 
Linked open data pour la consommation des informations
Linked open data pour la consommation des informationsLinked open data pour la consommation des informations
Linked open data pour la consommation des informations
 
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
 
Le Web de données et les bibliothèques
Le Web de données et les bibliothèquesLe Web de données et les bibliothèques
Le Web de données et les bibliothèques
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec Wikidata
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
 
CRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de donnéesCRFCB AMU evolutions_catalogage_091213_web de données
CRFCB AMU evolutions_catalogage_091213_web de données
 
Jabes 2012 - Tutoriel, vers le Web de données
Jabes 2012 - Tutoriel, vers le Web de donnéesJabes 2012 - Tutoriel, vers le Web de données
Jabes 2012 - Tutoriel, vers le Web de données
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens.
 
L'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de BiblissimaL'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de Biblissima
 
Découverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HALDécouverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HAL
 
Interopérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archivesInteropérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archives
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 

En vedette

La educación parvularia en chile 2
La educación parvularia en chile 2La educación parvularia en chile 2
La educación parvularia en chile 2
estefany1233
 
Criptografía
CriptografíaCriptografía
Criptografía
Marlon Alberto Galvis
 
Las estaciones del año
Las estaciones del añoLas estaciones del año
Las estaciones del año
kony10
 
Minitutorial calc
Minitutorial calcMinitutorial calc
Minitutorial calc
antheso
 
Elplagio
ElplagioElplagio
Elplagio
vane676
 
6 issuu avila
6 issuu avila6 issuu avila
6 issuu avila
mariavictoriarcos
 
La révolution du Big data
La révolution du Big dataLa révolution du Big data
La révolution du Big dataAloïs Kirner
 
Simon esperanza contexto historico del positivismo
Simon esperanza   contexto historico del positivismoSimon esperanza   contexto historico del positivismo
Simon esperanza contexto historico del positivismo
esperanza1313
 
Conjunto s
Conjunto sConjunto s
Conjunto s
angelicapab
 
Trabajo reli
Trabajo reliTrabajo reli
Trabajo reli
javiluismi
 
Copia de presentación1
Copia de presentación1Copia de presentación1
Copia de presentación1
jose gilberto
 
Misa papa francisco en quito
Misa papa francisco en quitoMisa papa francisco en quito
Misa papa francisco en quito
Presidencia de la República del Ecuador
 
Taller de con filminas de liderazgo
Taller de con filminas de liderazgoTaller de con filminas de liderazgo
Taller de con filminas de liderazgo
guest71be39c
 
Presentación. La sociedad de la comunicación.
Presentación. La sociedad de la comunicación.Presentación. La sociedad de la comunicación.
Presentación. La sociedad de la comunicación.
martaroca2
 
Carnegie tuesday 19 april
Carnegie tuesday 19 aprilCarnegie tuesday 19 april
Carnegie tuesday 19 aprilguest1607f9
 
Conocetu higado
Conocetu higadoConocetu higado
Conocetu higado
bernal27
 
Cuadros y poemas
Cuadros y poemasCuadros y poemas
Cuadros y poemas
chaburron
 
Copia de presentación1
Copia de presentación1Copia de presentación1
Copia de presentación1
jose gilberto
 

En vedette (20)

Kit thesaurus
Kit thesaurusKit thesaurus
Kit thesaurus
 
La educación parvularia en chile 2
La educación parvularia en chile 2La educación parvularia en chile 2
La educación parvularia en chile 2
 
Criptografía
CriptografíaCriptografía
Criptografía
 
Las estaciones del año
Las estaciones del añoLas estaciones del año
Las estaciones del año
 
Minitutorial calc
Minitutorial calcMinitutorial calc
Minitutorial calc
 
Elplagio
ElplagioElplagio
Elplagio
 
6 issuu avila
6 issuu avila6 issuu avila
6 issuu avila
 
La révolution du Big data
La révolution du Big dataLa révolution du Big data
La révolution du Big data
 
P D F
P D FP D F
P D F
 
Simon esperanza contexto historico del positivismo
Simon esperanza   contexto historico del positivismoSimon esperanza   contexto historico del positivismo
Simon esperanza contexto historico del positivismo
 
Conjunto s
Conjunto sConjunto s
Conjunto s
 
Trabajo reli
Trabajo reliTrabajo reli
Trabajo reli
 
Copia de presentación1
Copia de presentación1Copia de presentación1
Copia de presentación1
 
Misa papa francisco en quito
Misa papa francisco en quitoMisa papa francisco en quito
Misa papa francisco en quito
 
Taller de con filminas de liderazgo
Taller de con filminas de liderazgoTaller de con filminas de liderazgo
Taller de con filminas de liderazgo
 
Presentación. La sociedad de la comunicación.
Presentación. La sociedad de la comunicación.Presentación. La sociedad de la comunicación.
Presentación. La sociedad de la comunicación.
 
Carnegie tuesday 19 april
Carnegie tuesday 19 aprilCarnegie tuesday 19 april
Carnegie tuesday 19 april
 
Conocetu higado
Conocetu higadoConocetu higado
Conocetu higado
 
Cuadros y poemas
Cuadros y poemasCuadros y poemas
Cuadros y poemas
 
Copia de presentación1
Copia de presentación1Copia de presentación1
Copia de presentación1
 

Similaire à Mettre nos données en réseau (données de l'IST en France)

Les bases pour utiliser SPARQL
Les bases pour utiliser SPARQLLes bases pour utiliser SPARQL
Les bases pour utiliser SPARQL
BorderCloud
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
Gautier Poupeau
 
Isidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de donnéesIsidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de données
Antidot
 
Methodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecMethodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecBibliolab
 
Du Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusDu Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processus
CHAKER ALLAOUI
 
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
ABES
 
Medialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesMedialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donnees
nonue12
 
Asterid: Linked Data Asterisms
Asterid: Linked Data AsterismsAsterid: Linked Data Asterisms
Asterid: Linked Data Asterisms
Gregoire Burel
 
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
Paris Open Source Summit
 
ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)
ABES
 
Du web sémantique à tous les étages
Du web sémantique à tous les étagesDu web sémantique à tous les étages
Du web sémantique à tous les étages
SemWebPro
 
Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011Sylvain Machefert
 
Introduction aux RDF & SPARQL
Introduction aux RDF & SPARQLIntroduction aux RDF & SPARQL
Introduction aux RDF & SPARQLOpen Data Support
 
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
ABES
 
Sudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de données
Y. Nicolas
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
Philippe METAYER
 
Web 2.0 : Blogs, RSS & Wikis
Web 2.0 : Blogs, RSS & WikisWeb 2.0 : Blogs, RSS & Wikis
Web 2.0 : Blogs, RSS & Wikis
Bruno Bernard SIMON
 
Introduction à Linked Data
Introduction à Linked DataIntroduction à Linked Data
Introduction à Linked Data
Genève Lab
 
États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantiqueIvan Herman
 

Similaire à Mettre nos données en réseau (données de l'IST en France) (20)

Les bases pour utiliser SPARQL
Les bases pour utiliser SPARQLLes bases pour utiliser SPARQL
Les bases pour utiliser SPARQL
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
 
Isidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de donnéesIsidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de données
 
Methodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 DecMethodologie Recherche Je 15 Dec
Methodologie Recherche Je 15 Dec
 
Du Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processusDu Big Data vers le SMART Data : Scénario d'un processus
Du Big Data vers le SMART Data : Scénario d'un processus
 
Armadillo - Web sémantique, les outils d’un open data culturel
Armadillo  - Web sémantique, les outils d’un open data culturelArmadillo  - Web sémantique, les outils d’un open data culturel
Armadillo - Web sémantique, les outils d’un open data culturel
 
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
Jabes 2011 - Ateliers "Sudoc, Calames, thèses.fr et le web de données"
 
Medialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesMedialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donnees
 
Asterid: Linked Data Asterisms
Asterid: Linked Data AsterismsAsterid: Linked Data Asterisms
Asterid: Linked Data Asterisms
 
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
#OSSPARIS19 - Gouvernance des données dans le contexte Big Data - REX datalak...
 
ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)
 
Du web sémantique à tous les étages
Du web sémantique à tous les étagesDu web sémantique à tous les étages
Du web sémantique à tous les étages
 
Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011
 
Introduction aux RDF & SPARQL
Introduction aux RDF & SPARQLIntroduction aux RDF & SPARQL
Introduction aux RDF & SPARQL
 
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
 
Sudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de données
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
Web 2.0 : Blogs, RSS & Wikis
Web 2.0 : Blogs, RSS & WikisWeb 2.0 : Blogs, RSS & Wikis
Web 2.0 : Blogs, RSS & Wikis
 
Introduction à Linked Data
Introduction à Linked DataIntroduction à Linked Data
Introduction à Linked Data
 
États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantique
 

Plus de Y. Nicolas

SOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicatorSOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicator
Y. Nicolas
 
From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.
Y. Nicolas
 
Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)
Y. Nicolas
 
Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014
Y. Nicolas
 
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
Y. Nicolas
 
web de données / bib
web de données / bibweb de données / bib
web de données / bib
Y. Nicolas
 
Jabes2012 : tutoriel web de données
Jabes2012 : tutoriel web de donnéesJabes2012 : tutoriel web de données
Jabes2012 : tutoriel web de données
Y. Nicolas
 
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Y. Nicolas
 
IdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABESIdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABES
Y. Nicolas
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
Y. Nicolas
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
Y. Nicolas
 
Le Web sémantique : un web de métadonnées
Le Web sémantique : un web de métadonnéesLe Web sémantique : un web de métadonnées
Le Web sémantique : un web de métadonnées
Y. Nicolas
 
Vers un portail des Thèses
Vers un portail des ThèsesVers un portail des Thèses
Vers un portail des Thèses
Y. Nicolas
 
Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)
Y. Nicolas
 
Livres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseauLivres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseau
Y. Nicolas
 
Calames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EADCalames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EAD
Y. Nicolas
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartes
Y. Nicolas
 

Plus de Y. Nicolas (17)

SOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicatorSOLR TOTAL. A search engine for each MARC field, subfield, indicator
SOLR TOTAL. A search engine for each MARC field, subfield, indicator
 
From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.From XML to MARC. RDF behind the scenes.
From XML to MARC. RDF behind the scenes.
 
Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)Abes and semweb (#ELAG14 conference lightning talk)
Abes and semweb (#ELAG14 conference lightning talk)
 
Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014Hub de métadonnées - jabes2014
Hub de métadonnées - jabes2014
 
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
theses.fr : un exemple d'ouverture de l'information scientifique sur le web d...
 
web de données / bib
web de données / bibweb de données / bib
web de données / bib
 
Jabes2012 : tutoriel web de données
Jabes2012 : tutoriel web de donnéesJabes2012 : tutoriel web de données
Jabes2012 : tutoriel web de données
 
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...Intégrer IdRef dans les applications documentaires de votre université. Pourq...
Intégrer IdRef dans les applications documentaires de votre université. Pourq...
 
IdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABESIdRef. Les référentiels comme services. Une politique de l'ABES
IdRef. Les référentiels comme services. Une politique de l'ABES
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
Le Web sémantique : un web de métadonnées
Le Web sémantique : un web de métadonnéesLe Web sémantique : un web de métadonnées
Le Web sémantique : un web de métadonnées
 
Vers un portail des Thèses
Vers un portail des ThèsesVers un portail des Thèses
Vers un portail des Thèses
 
Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)Calames :: CERL seminar (Paris, 2008)
Calames :: CERL seminar (Paris, 2008)
 
Livres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseauLivres, périodiques, thèses et manuscrits en réseau
Livres, périodiques, thèses et manuscrits en réseau
 
Calames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EADCalames. Editer, rechercher, exposer des métadonnées EAD
Calames. Editer, rechercher, exposer des métadonnées EAD
 
Calames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartesCalames - presentation à l'ecole des chartes
Calames - presentation à l'ecole des chartes
 

Dernier

Edito-B1-francais Manuel to learning.pdf
Edito-B1-francais Manuel to learning.pdfEdito-B1-francais Manuel to learning.pdf
Edito-B1-francais Manuel to learning.pdf
WarlockeTamagafk
 
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
M2i Formation
 
Cycle de Formation Théâtrale 2024 / 2025
Cycle de Formation Théâtrale 2024 / 2025Cycle de Formation Théâtrale 2024 / 2025
Cycle de Formation Théâtrale 2024 / 2025
Billy DEYLORD
 
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
cristionobedi
 
Procédure consignation Lock Out Tag Out.pptx
Procédure consignation  Lock Out Tag Out.pptxProcédure consignation  Lock Out Tag Out.pptx
Procédure consignation Lock Out Tag Out.pptx
caggoune66
 
Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024
Friends of African Village Libraries
 
Iris van Herpen. pptx
Iris         van        Herpen.      pptxIris         van        Herpen.      pptx
Iris van Herpen. pptx
Txaruka
 
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
BenotGeorges3
 
Iris van Herpen. pptx
Iris         van         Herpen.      pptxIris         van         Herpen.      pptx
Iris van Herpen. pptx
Txaruka
 
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La JeunesseConseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Oscar Smith
 
Iris van Herpen. pptx
Iris            van        Herpen.     pptxIris            van        Herpen.     pptx
Iris van Herpen. pptx
Txaruka
 

Dernier (11)

Edito-B1-francais Manuel to learning.pdf
Edito-B1-francais Manuel to learning.pdfEdito-B1-francais Manuel to learning.pdf
Edito-B1-francais Manuel to learning.pdf
 
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
Formation M2i - Onboarding réussi - les clés pour intégrer efficacement vos n...
 
Cycle de Formation Théâtrale 2024 / 2025
Cycle de Formation Théâtrale 2024 / 2025Cycle de Formation Théâtrale 2024 / 2025
Cycle de Formation Théâtrale 2024 / 2025
 
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
Formation Intelligence Artificielle pour dirigeants- IT6-DIGITALIX 24_opt OK_...
 
Procédure consignation Lock Out Tag Out.pptx
Procédure consignation  Lock Out Tag Out.pptxProcédure consignation  Lock Out Tag Out.pptx
Procédure consignation Lock Out Tag Out.pptx
 
Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024Burkina Faso library newsletter May 2024
Burkina Faso library newsletter May 2024
 
Iris van Herpen. pptx
Iris         van        Herpen.      pptxIris         van        Herpen.      pptx
Iris van Herpen. pptx
 
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
Newsletter SPW Agriculture en province du Luxembourg du 12-06-24
 
Iris van Herpen. pptx
Iris         van         Herpen.      pptxIris         van         Herpen.      pptx
Iris van Herpen. pptx
 
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La JeunesseConseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
Conseils pour Les Jeunes | Conseils de La Vie| Conseil de La Jeunesse
 
Iris van Herpen. pptx
Iris            van        Herpen.     pptxIris            van        Herpen.     pptx
Iris van Herpen. pptx
 

Mettre nos données en réseau (données de l'IST en France)

  • 1. Mettre nos données en réseau Yann NICOLAS ADBU 2009
  • 2. Les données. Un enjeu politique
  • 3.
  • 4. “Searchability and data formats are a problem in a large number of member states. Search functions are hard to use in several countries. In some countries they are non- existent.” “Several countries do provide the whole data in a CSV or XLS or other format – and this is welcomed as good practice. Many countries do not and worse still, a few countries appear to have designed their websites with the deliberate aim of obstructing screen scrapers.” farmsubsidy.org , Evaluation of the implementation of transparency in CAP beneficiaries. Mai 2009
  • 5. Association pour la transparence des données publiques Va chercher les données « publiques », les nettoie, les agrège, les republie, les rend exploitables par des programmes informatiques(API) Courtier ? Activiste ? Pirate ?
  • 6. VERS UNE POLITIQUE PUBLIQUE DES DONNÉES En général Des données de l’IST en particulier Fondée sur quels principes ?
  • 7. MÉTADONNÉES = DONNÉES DONNÉES = MÉTADONNÉES Métadonnées = informations sur des documents ? Nos métadonnées parlent de tout. Ex: portail des thèses Les métadonnées sont partout – et pas seulement dans les métiers de la doc.
  • 8. SC2D Service Commun de la Documentation et des Données
  • 9. WEB DE DOCUMENTS VS WEB DE DONNÉES Le Web est une collection de documents (HTML, PDF…) Le Web devient une collection de bases de données (RDF, RDFa)
  • 10. hier aujourd’hui demain
  • 11. Données Page HTML LE CONTENU DES DONNÉES EST UTILISÉ DANS UN DOCUMENT HTML Le Document HTML est fait pour être lu par des humains ; pas pour être exploité par des programmes
  • 12. hier aujourd’hui demain
  • 13. Page HTML Données HTML + RDFa LES DONNÉES SONT PRÉSENTES DANS LE DOCUMENT HTML Le Document HTML + RDFa peut être lu par des humains et exploité par des programmes La base de données est dans le Web, pas sous le Web (deep Web)
  • 14.
  • 15. <div> <span>Date : </span> <span content="1601/1700" property="dc:date">XVII<sup>e</sup> siècle</span> </div> <http://www.calames.abes.fr/pub/ms/res/MAZB10378> <dc:date> "1601/1700"
  • 16. AVEC RDFa, LES DONNÉES DE CALAMES SONT DANS LA BASE DE YAHOO, SINDICE… On parle bien des données dans toute leur richesse ! RDFa est désormais supporté par les « grossistes » du Web : Google, Yahoo.
  • 17. HTTP://BOSS.YAHOOAPIS.COM/YSEARCH/WEB/V1/"ALGRIN SIT E: CALAMES.ABES.FR… On peut accéder aux données de Calames à travers les services de Yahoo  Un tiers peut refaire Calames à partir de Yahoo
  • 18. LE WEB DES DONNÉES DOIT AUSSI CONCERNER L’INFORMATION SCIENTIFIQUE, TECHNIQUE ET PATRIMONIALE Pas seulement les produits commerciaux, les congrès, les vidéos… Cibles : Sudoc, HAL, Star, Bases CNRS, Persée, Revues.org,…
  • 19. POUR UN SERVICES PUBLIC DES DONNÉES BRUTES LAISSER LES AUTRES LES RÉUTILISER Exposer les données « à la cantonade » On ignore à qui, à quoi elles peuvent servir Permettre à d’autres de les réutiliser Usages nouveaux, variés, spécialisés. Visualisations. Combinaisons de différents corpus (mashups) Contre les monopoles privés et les monopoles publics
  • 20. LIER LES DONNÉES ENTRE ELLES LINKED DATA Le Web comme collection de base de données ? Ou le Web comme base de données ?  Interconnecter les bases
  • 21.
  • 22.
  • 23.
  • 24. 2 BASES DE DONNÉES EN RDF DÉCRIVENT LA MÊME PERSONNE Base RDF accessible en ligne Identifiant de Tricky (URL) Dbpedia (Wikipedia en RDF) http://dbpedia.org/resource/Tricky BBC Music http://www.bbc.co.uk/music/artists/5bf64d94- efd9-4334-96fd-e6197b0b02b8#artist
  • 25. CONNECTER LES DEUX BASES RDF http://www.bbc.co.uk/music/artists/5bf64d 94-efd9-4334-96fd-e6197b0b02b8#artist owl:sameAs http://dbpedia.org/resource/Tricky Les informations des deux bases peuvent fusionner C’est le principe d’un Web de données liées
  • 26. COMMENT INTERCONNECTER LES BASES DE L’ABES ? DE L’IST FRANÇAISE ? Aligner les identifiants des uns et des autres (avec owl:sameAs) ? Mieux : si possible, partager à la source les mêmes identifiants
  • 27. LES AUTORITÉS SUDOC, AU-DELÀ DU SUDOC Normaliser les noms de personne en les liant aux autorités Sudoc, pour : . Star . Calames . Persée . ORI-OAI . Adonis .?
  • 28. POURQUOI SE LIER AUX AUTORITÉS SUDOC ? Qualité interne de chaque base * Economies d’échelle * Enrichir chaque base avec les informations des autres *** A terme, permettre des requêtes et des explorations plus riches ***
  • 29.
  • 30. 2006 – STAR ET CALAMES INTERROGENT LES AUTORITÉS SUDOC EN Z 39.50 Solution provisoire Limitations : . Performances . Index limités . Et quand la notice d’autorité n’existe pas ?
  • 31. 2010 T1 LES AUTORITÉS SUDOC COMME SERVICE PUBLIC POUR LES APPLICATIONS TIERCES Lire et écrire ! Comme le réseau électrique ? Contribuer (solaire) et recevoir Production décentralisée Consommation décentralisée
  • 33. 2010-2011 LES AUTORITÉS SUDOC AU SERVICE DU MÉTA-PORTAIL ADONIS (SI FINANCEMENT CONFIRMÉ) Méta-portail = risque de l’auberge espagnole Les autorités Sudoc comme pivot Harmoniser en masse les noms du méta-portail Avec les technologies du Web sémantique (RDF, ontologies, règles) Avec le CNRS : équipe RCR du laboratoire LIRMM (Mtpellier)
  • 34. DANS LE CADRE DU PROJET AVEC ADONIS, Corpus de Lien aux métadonnées à autorités enrichir Données enrichies du lien aux autorités L’UTILISATION DES TECHNOLOGIES SÉMANTIQUE EST INTERNE
  • 35. DEMAIN LINKED DATA DE L’IST FRANÇAIS ? Linked data : données ouvertes et liées OUVRIR n’est pas le plus compliqué (sauf contraintes juridiques) Le plus dur est de LIER - d’où l’importance des autorités Ne suppose pas un Plan quinquennal centralisé « Coopération décentralisée » des données
  • 36.
  • 37. ABES Département Etudes & Projets nicolas@abes.fr