SlideShare une entreprise Scribd logo
Information scientifique et
technique :
« Pour des moteurs efficaces,
libérez les données !!! »
Christine Fleury – ABES
23ème Entretiens Jacques Cartier
22 novembre 2010
Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!
Trois générations de moteurs de recherche
Pour la petite histoire …
« Je vous parle d’un temps »
Merci à la WayBack Machine
De la « sainte trinité » ….
Visualisations …
Visualisations …
Recherche universelle ???
Moteurs / métamoteurs spécialisés IST
Moteur de recherche
Sources et moteurs Open Access …
Résolveur de lien - DOI
Données bibliographiques médicales
Analyse des citations
Sources et moteurs de France …
Des moteurs ---
Des moteurs ---
Encore des moteurs …
LeWeb, un univers en expansion
Et cependant
---- -----------
« RAW DATA NOW !!! »
(TIM BERNERS LEE - 2009)
Vers un Web « de données liées»
Comment ?
 S’imprégner de la
philosophie du web de
données et de la culture
des standards duWeb
 Sortir les données de
leurs entrepôts (bases de
données… ) pour les
rendre disponibles sur le
WEB
 = conditions pour entrer
dans l’écosystème du
linked data web
Pourquoi ?
 Valoriser « nos » données
 tirer bénéfice des données
créées par les autres
 exploiter la richesse des
données (scientifiques,
gouvernementales,
statistiques, encyclopédiques,
d’autorité, bibliographiques)
Voir vidéoTim Berners LEETED 2009
Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!
Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!
Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!
RDF ??? Recommandation du W3C
 RDF (Resource Description Framework) = le
langage de base duWeb sémantique
 un langage très ouvert conçu pour la description
utilisé (notamment) pour décrire les ressources du
web et leur métadonnées et permettre leur
traitement automatique (machine readable).
 une structure qui peut s’écrire dans différentes
syntaxes (=langages informatiques)
 RDF/XML + RDFA,Turtle …
 Un langage de requête spécifique : SPARQL
Voir la recommandation duW3C (en français)
 Une structure « élastique » qui intègre
différents vocabulaires :
 SKOS (Simple Knowledge Organization
System) = représentation dans un contexte
multilingue de tout vocabulaire contrôlé
(thésaurus, classifications, taxonomies, etc )
 FOAF (Friend of a Friend ) = description de
personnes et des relations entre elles
 mais aussi : OWL,Yago,Wordnet, DCterm
(DublinCore), Geoname ….
Une langue,des vocabulaires
RDF : un monde d’URI…
 chaque ressource (= objet, lieu, livre, auteur …..)
est identifiée par une -ou plusieurs - URI
-(= identifiant uniforme de ressource)
 ex : un oiseau =
http://stitch.cs.vu.nl/vocabularies/rameau/ark:/12148/cb1
1932889r
 ex : Les Boulassiers =
http://sws.geonames.org/3031189/
 ex : Aristote =
http://viaf.org/viaf/7524651/#Aristotle
« same as »
http://www.idref.fr/026690276/id
Sujet ( = ce qu’on décrit )
http://www.w3.org/Home/Lassila
Prédicat ( = une Propriété applicable à ce
qu’on décrit )
A pour Créateur
Objet (= une valeur ) "Ora Lassila"
RDF : le principe des triplets
Les données sont décomposées / recomposées en
« triplets RDF »
…. et modélisées en « graphes RDF »
Sujet/prédicat/objet
 Quatre-vingt-treize est un
roman deVictor Hugo paru
en 1874 et dont le thème
est la révolution française
 Quatre-vingt-treize est un
roman
 Quatre-vingt-treize a pour
auteur Victor Hugo
 Quatre-vingt-treize est
paru en 1874
 Quatre-vingt-treize a pour
thème la Révolution
française
 (Quatre-vingt-treize,
type, roman)
 (Quatre-vingt-treize,
auteur,Victor Hugo)
 (Quatre-vingt-treize,
année de parution, 1874)
 (Quatre-vingt-treize,
thème, La Révolution
Française)
Exemple emprunté à Bernard Vatant –
in Métadonnées, perspectives et Mutations
Séminaire INRIA – 2008)
Sujet / prédicat / objet
Ressource = 1 URI = http://dbpedia.org/resource/Ninety-Three
dbpedia : Ninety-Three rdf:type yago:Novel106367879
dbpedia : Ninety-Three dcterms : creator dbpedia :Victor Hugo
dbpedia : Ninety-Three dcterms : created « 1874 »
dbpedia : Ninety-Three skos:subject dbpedia : Category :
French revolution
Diapo : Emmanuelle Bermès
En d’autres termes ….
FOAF Whos’ who ?
Bases de connaissances en accès libre
 Data.gov : 305. 692
Datasets (nov.2010)
 http://data.gov.uk/
 DBPedia : 3,4 millions
d'entités
 Geoname : 8 millions de
noms géographiques
 Musicbrainz
C’est où ???
http://sws.geonames.org/3031189 ????
<rdf:RDF>
<gn:Feature rdf:about="http://sws.geonames.org/3031189/">
<rdfs:isDefinedBy>http://sws.geonames.org/3031189/about.rdf</rdfs:isDefinedBy>
<gn:name>Pointe des Boulassiers</gn:name>
<gn:featureClass rdf:resource="http://www.geonames.org/ontology#T"/>
<gn:featureCode rdf:resource="http://www.geonames.org/ontology#T.PT"/>
<gn:countryCode>FR</gn:countryCode>
<wgs84_pos:lat>46.01667</wgs84_pos:lat>
<wgs84_pos:long>-1.33333</wgs84_pos:long>
<gn:parentFeature rdf:resource="http://sws.geonames.org/2986492/"/>
<gn:parentCountry rdf:resource="http://sws.geonames.org/3017382/"/>
<gn:parentADM1 rdf:resource="http://sws.geonames.org/2986492/"/>
<gn:nearbyFeatures rdf:resource="http://sws.geonames.org/3031189/nearby.rdf"/>
<gn:locationMap rdf:resource="http://www.geonames.org/3031189/pointe-des-boulassiers.html"/>
</gn:Feature>
<foaf:Document rdf:about="http://sws.geonames.org/3031189/about.rdf">
<foaf:primaryTopic rdf:resource="http://sws.geonames.org/3031189/"/>
<cc:license rdf:resource="http://creativecommons.org/licenses/by/3.0/"/>
<cc:attributionURL rdf:resource="http://sws.geonames.org/3031189/"/>
<cc:attributionName rdf:datatype="http://www.w3.org/2001/XMLSchema#string">GeoNames</cc:attributionName>
<dcterms:created rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2006-01-15</dcterms:created>
<dcterms:modified rdf:datatype="http://www.w3.org/2001/XMLSchema#date">1994-01-06</dcterms:modified>
</foaf:Document>
</rdf:RDF>
Pointe des Boulassiers
France » Poitou-Charentes
point
N 46° 1' 0''W 1° 20' 0''
46.01667 / -1.33333
GeoNameId : 3031189
Des silos de «données brutes»
Visualisation
Mashup de données
… et les bibliothèques ???
… et les bibliothèques ???
Réalisations
 Rameau en SKOS (TEL
Plus Project)
 VIAF :Virtual
International Authority
File (OCLC)
 Dewey en RDF
(expérimentationOCLC)
 IdREF : autorités Sudoc
en RDF (ABES)
Vocabulaires RDF
 Dublin Core (DCMI) en
RDF = DublinCoreTerms
 FRBR / FRAD (modèles
conceptuels)
 RDA en RDF : nouvelles
(futures ?) règles de
catalogage
La DEWEY en RDF (OCLC)
RAMEAU en SKOS (TelPlus)
VIAF (OCLC)
Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!
Données Marc transposées en RDF
Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!
+ utilisation des données externes
Données libérées =
Moteurs sémantiques ???
Questions en langage naturel ?
Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!
Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!
Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!
Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!
Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!
Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!
Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!
Pour en savoir plus ….
Tim Berners-Lee :The Next Web of Open, Linked Data (TED 2009)
http://dai.ly/cvIl6P (sous-titré en français)
LinkingOpenData
http://esw.w3.org/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
SKOS http://www.w3.org/2004/02/skos/
Projet Open Library http://openlibrary.org/about/lib
LIBRIS : un catalogue dans le linked data
http://dc2008.de/wp-content/uploads/2008/09/malmsten.pdf
Les catalogues de bibliothèques sur leWeb – Emmanuelle Bermès (2009)
http://www.slideshare.net/Figoblog/les-catalogues-sur-le-web
Le web sémantique : un web de métadonnées –Yann Nicolas
http://www.slideshare.net/yannn/le-web-smantique-un
Métadonnées : mutations et perspectives – Séminaire INRIA - 29 sept./ 3 oct. 2008 – Dijon –
ADBS Editions
Merci à ….
… porte d’entrée (toujours) indispensable …. pour collecter les
informations et données ayant servi à cette présentation
…. àYann Nicolas (ABES) et
Emmanuelle Bermes (BNF),
initiateurs en RDF
Cette présentation est placée sous licence Creative Commons

Contenu connexe

Similaire à Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!

quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
Fabien Gandon
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
Fabien Gandon
 
Les catalogues sur le Web
Les catalogues sur le WebLes catalogues sur le Web
Les catalogues sur le Web
Figoblog
 
Geo web standards for biodiversity
Geo web standards for biodiversityGeo web standards for biodiversity
Geo web standards for biodiversity
Olivier Rovellotti
 
Modélisation, environnements sémantiques et Web de données
Modélisation, environnements sémantiques et Web de donnéesModélisation, environnements sémantiques et Web de données
Modélisation, environnements sémantiques et Web de données
chessmu
 
Skos transformation
Skos transformationSkos transformation
Skos transformation
catherine roussey
 
Les standards en biodiversité
Les standards en biodiversitéLes standards en biodiversité
Les standards en biodiversité
jchabalier
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens.
Fabien Gandon
 
Ontologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationOntologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformation
catherine roussey
 
DBpedia - Un hub de liens dans le web des données
DBpedia - Un hub de liens dans le web des donnéesDBpedia - Un hub de liens dans le web des données
DBpedia - Un hub de liens dans le web des données
christianhbecker
 
Nouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèquesNouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèques
Fleury Christine
 
Quelles alternatives à Google dans le domaine scientifique
Quelles alternatives à Google dans le domaine scientifiqueQuelles alternatives à Google dans le domaine scientifique
Quelles alternatives à Google dans le domaine scientifique
Béatrice Foenix-Riou
 
Module 2 Formation des doctorants
Module 2 Formation des doctorantsModule 2 Formation des doctorants
Module 2 Formation des doctorants
Magalie Le Gall
 
Formation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIMFormation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIM
Magalie Le Gall
 
Module 3/6 - Formation doctorants
Module 3/6 - Formation doctorantsModule 3/6 - Formation doctorants
Module 3/6 - Formation doctorants
Magalie Le Gall
 
Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02
ABES
 
Sensibilisation à la veille documentaire (Doctorants SHS, juin 2021)
Sensibilisation à la veille documentaire  (Doctorants SHS, juin 2021)Sensibilisation à la veille documentaire  (Doctorants SHS, juin 2021)
Sensibilisation à la veille documentaire (Doctorants SHS, juin 2021)
Alain Marois
 
Web of Science - Fiche technique
Web of Science - Fiche techniqueWeb of Science - Fiche technique
Web of Science - Fiche technique
lhostis
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked data
VincentBroute
 

Similaire à Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!! (20)

quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
 
Les catalogues sur le Web
Les catalogues sur le WebLes catalogues sur le Web
Les catalogues sur le Web
 
Geo web standards for biodiversity
Geo web standards for biodiversityGeo web standards for biodiversity
Geo web standards for biodiversity
 
Modélisation, environnements sémantiques et Web de données
Modélisation, environnements sémantiques et Web de donnéesModélisation, environnements sémantiques et Web de données
Modélisation, environnements sémantiques et Web de données
 
Skos transformation
Skos transformationSkos transformation
Skos transformation
 
Les standards en biodiversité
Les standards en biodiversitéLes standards en biodiversité
Les standards en biodiversité
 
Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens. Données liées et Web sémantique : quand le lien fait sens.
Données liées et Web sémantique : quand le lien fait sens.
 
Ontologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationOntologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformation
 
DBpedia - Un hub de liens dans le web des données
DBpedia - Un hub de liens dans le web des donnéesDBpedia - Un hub de liens dans le web des données
DBpedia - Un hub de liens dans le web des données
 
Nouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèquesNouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèques
 
Quelles alternatives à Google dans le domaine scientifique
Quelles alternatives à Google dans le domaine scientifiqueQuelles alternatives à Google dans le domaine scientifique
Quelles alternatives à Google dans le domaine scientifique
 
Module 2 Formation des doctorants
Module 2 Formation des doctorantsModule 2 Formation des doctorants
Module 2 Formation des doctorants
 
Formation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIMFormation à la recherche documentaire Master SACIM
Formation à la recherche documentaire Master SACIM
 
Module 3/6 - Formation doctorants
Module 3/6 - Formation doctorantsModule 3/6 - Formation doctorants
Module 3/6 - Formation doctorants
 
Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02
 
Sensibilisation à la veille documentaire (Doctorants SHS, juin 2021)
Sensibilisation à la veille documentaire  (Doctorants SHS, juin 2021)Sensibilisation à la veille documentaire  (Doctorants SHS, juin 2021)
Sensibilisation à la veille documentaire (Doctorants SHS, juin 2021)
 
Web of Science - Fiche technique
Web of Science - Fiche techniqueWeb of Science - Fiche technique
Web of Science - Fiche technique
 
Semantic web introduction
Semantic web introductionSemantic web introduction
Semantic web introduction
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked data
 

Plus de Fleury Christine

Adbs2012 presentation
Adbs2012 presentationAdbs2012 presentation
Adbs2012 presentation
Fleury Christine
 
Statut et role des bibliotheques sous tutelle de l'état
Statut et role des bibliotheques sous tutelle de l'étatStatut et role des bibliotheques sous tutelle de l'état
Statut et role des bibliotheques sous tutelle de l'état
Fleury Christine
 
Adbs formation numerique_ce_ratp
Adbs formation numerique_ce_ratpAdbs formation numerique_ce_ratp
Adbs formation numerique_ce_ratp
Fleury Christine
 
Atelier bibliotheques et numerique
Atelier bibliotheques et numeriqueAtelier bibliotheques et numerique
Atelier bibliotheques et numerique
Fleury Christine
 
mediation numerique_salledereference_cnfpt2011
mediation numerique_salledereference_cnfpt2011mediation numerique_salledereference_cnfpt2011
mediation numerique_salledereference_cnfpt2011
Fleury Christine
 
4 mediation numerique_nouveauxcatalogues_cnfpt2011
4 mediation numerique_nouveauxcatalogues_cnfpt20114 mediation numerique_nouveauxcatalogues_cnfpt2011
4 mediation numerique_nouveauxcatalogues_cnfpt2011
Fleury Christine
 
3 culture dunumerique-livrenumerique_cnfpt2011
3 culture dunumerique-livrenumerique_cnfpt20113 culture dunumerique-livrenumerique_cnfpt2011
3 culture dunumerique-livrenumerique_cnfpt2011
Fleury Christine
 
1 impacts dunumeriqueenbibliothèque-cnfpt2011
1  impacts dunumeriqueenbibliothèque-cnfpt20111  impacts dunumeriqueenbibliothèque-cnfpt2011
1 impacts dunumeriqueenbibliothèque-cnfpt2011
Fleury Christine
 
Introduction dematerialisation supportsculturels_cnfpt2011
Introduction dematerialisation supportsculturels_cnfpt2011Introduction dematerialisation supportsculturels_cnfpt2011
Introduction dematerialisation supportsculturels_cnfpt2011
Fleury Christine
 
2 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt20112 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt2011
Fleury Christine
 
MédiationNumérique CNFPT
MédiationNumérique CNFPTMédiationNumérique CNFPT
MédiationNumérique CNFPT
Fleury Christine
 
infrastructure numerique_focusweb_cnfpt2011
 infrastructure numerique_focusweb_cnfpt2011 infrastructure numerique_focusweb_cnfpt2011
infrastructure numerique_focusweb_cnfpt2011
Fleury Christine
 
Visites accompagnees en_numerik_formation_cnfpt2011
Visites accompagnees en_numerik_formation_cnfpt2011Visites accompagnees en_numerik_formation_cnfpt2011
Visites accompagnees en_numerik_formation_cnfpt2011
Fleury Christine
 
Atelier opac nouvelle generation
Atelier opac nouvelle generationAtelier opac nouvelle generation
Atelier opac nouvelle generation
Fleury Christine
 
Formation CNFPT
Formation CNFPT Formation CNFPT
Formation CNFPT
Fleury Christine
 
Bibliotheques numeriques : contenus et mediation
Bibliotheques numeriques : contenus et mediationBibliotheques numeriques : contenus et mediation
Bibliotheques numeriques : contenus et mediation
Fleury Christine
 
Abes Adbs2411
Abes Adbs2411Abes Adbs2411
Abes Adbs2411
Fleury Christine
 
Bibliotheques sous tutelle de l'Etat
Bibliotheques sous tutelle de l'Etat Bibliotheques sous tutelle de l'Etat
Bibliotheques sous tutelle de l'Etat
Fleury Christine
 
A la découverte des bibliothèques numériques
A la découverte des bibliothèques numériquesA la découverte des bibliothèques numériques
A la découverte des bibliothèques numériques
Fleury Christine
 
Pistes pour construire une offre numérique en bibliothèque publique
Pistes pour construire une offre numérique en bibliothèque publiquePistes pour construire une offre numérique en bibliothèque publique
Pistes pour construire une offre numérique en bibliothèque publique
Fleury Christine
 

Plus de Fleury Christine (20)

Adbs2012 presentation
Adbs2012 presentationAdbs2012 presentation
Adbs2012 presentation
 
Statut et role des bibliotheques sous tutelle de l'état
Statut et role des bibliotheques sous tutelle de l'étatStatut et role des bibliotheques sous tutelle de l'état
Statut et role des bibliotheques sous tutelle de l'état
 
Adbs formation numerique_ce_ratp
Adbs formation numerique_ce_ratpAdbs formation numerique_ce_ratp
Adbs formation numerique_ce_ratp
 
Atelier bibliotheques et numerique
Atelier bibliotheques et numeriqueAtelier bibliotheques et numerique
Atelier bibliotheques et numerique
 
mediation numerique_salledereference_cnfpt2011
mediation numerique_salledereference_cnfpt2011mediation numerique_salledereference_cnfpt2011
mediation numerique_salledereference_cnfpt2011
 
4 mediation numerique_nouveauxcatalogues_cnfpt2011
4 mediation numerique_nouveauxcatalogues_cnfpt20114 mediation numerique_nouveauxcatalogues_cnfpt2011
4 mediation numerique_nouveauxcatalogues_cnfpt2011
 
3 culture dunumerique-livrenumerique_cnfpt2011
3 culture dunumerique-livrenumerique_cnfpt20113 culture dunumerique-livrenumerique_cnfpt2011
3 culture dunumerique-livrenumerique_cnfpt2011
 
1 impacts dunumeriqueenbibliothèque-cnfpt2011
1  impacts dunumeriqueenbibliothèque-cnfpt20111  impacts dunumeriqueenbibliothèque-cnfpt2011
1 impacts dunumeriqueenbibliothèque-cnfpt2011
 
Introduction dematerialisation supportsculturels_cnfpt2011
Introduction dematerialisation supportsculturels_cnfpt2011Introduction dematerialisation supportsculturels_cnfpt2011
Introduction dematerialisation supportsculturels_cnfpt2011
 
2 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt20112 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt2011
 
MédiationNumérique CNFPT
MédiationNumérique CNFPTMédiationNumérique CNFPT
MédiationNumérique CNFPT
 
infrastructure numerique_focusweb_cnfpt2011
 infrastructure numerique_focusweb_cnfpt2011 infrastructure numerique_focusweb_cnfpt2011
infrastructure numerique_focusweb_cnfpt2011
 
Visites accompagnees en_numerik_formation_cnfpt2011
Visites accompagnees en_numerik_formation_cnfpt2011Visites accompagnees en_numerik_formation_cnfpt2011
Visites accompagnees en_numerik_formation_cnfpt2011
 
Atelier opac nouvelle generation
Atelier opac nouvelle generationAtelier opac nouvelle generation
Atelier opac nouvelle generation
 
Formation CNFPT
Formation CNFPT Formation CNFPT
Formation CNFPT
 
Bibliotheques numeriques : contenus et mediation
Bibliotheques numeriques : contenus et mediationBibliotheques numeriques : contenus et mediation
Bibliotheques numeriques : contenus et mediation
 
Abes Adbs2411
Abes Adbs2411Abes Adbs2411
Abes Adbs2411
 
Bibliotheques sous tutelle de l'Etat
Bibliotheques sous tutelle de l'Etat Bibliotheques sous tutelle de l'Etat
Bibliotheques sous tutelle de l'Etat
 
A la découverte des bibliothèques numériques
A la découverte des bibliothèques numériquesA la découverte des bibliothèques numériques
A la découverte des bibliothèques numériques
 
Pistes pour construire une offre numérique en bibliothèque publique
Pistes pour construire une offre numérique en bibliothèque publiquePistes pour construire une offre numérique en bibliothèque publique
Pistes pour construire une offre numérique en bibliothèque publique
 

Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!

  • 1. Information scientifique et technique : « Pour des moteurs efficaces, libérez les données !!! » Christine Fleury – ABES 23ème Entretiens Jacques Cartier 22 novembre 2010
  • 3. Trois générations de moteurs de recherche Pour la petite histoire …
  • 4. « Je vous parle d’un temps » Merci à la WayBack Machine
  • 5. De la « sainte trinité » ….
  • 9. Moteurs / métamoteurs spécialisés IST
  • 10. Moteur de recherche Sources et moteurs Open Access … Résolveur de lien - DOI Données bibliographiques médicales Analyse des citations
  • 11. Sources et moteurs de France …
  • 15. LeWeb, un univers en expansion
  • 17. « RAW DATA NOW !!! » (TIM BERNERS LEE - 2009)
  • 18. Vers un Web « de données liées» Comment ?  S’imprégner de la philosophie du web de données et de la culture des standards duWeb  Sortir les données de leurs entrepôts (bases de données… ) pour les rendre disponibles sur le WEB  = conditions pour entrer dans l’écosystème du linked data web Pourquoi ?  Valoriser « nos » données  tirer bénéfice des données créées par les autres  exploiter la richesse des données (scientifiques, gouvernementales, statistiques, encyclopédiques, d’autorité, bibliographiques) Voir vidéoTim Berners LEETED 2009
  • 22. RDF ??? Recommandation du W3C  RDF (Resource Description Framework) = le langage de base duWeb sémantique  un langage très ouvert conçu pour la description utilisé (notamment) pour décrire les ressources du web et leur métadonnées et permettre leur traitement automatique (machine readable).  une structure qui peut s’écrire dans différentes syntaxes (=langages informatiques)  RDF/XML + RDFA,Turtle …  Un langage de requête spécifique : SPARQL Voir la recommandation duW3C (en français)
  • 23.  Une structure « élastique » qui intègre différents vocabulaires :  SKOS (Simple Knowledge Organization System) = représentation dans un contexte multilingue de tout vocabulaire contrôlé (thésaurus, classifications, taxonomies, etc )  FOAF (Friend of a Friend ) = description de personnes et des relations entre elles  mais aussi : OWL,Yago,Wordnet, DCterm (DublinCore), Geoname …. Une langue,des vocabulaires
  • 24. RDF : un monde d’URI…  chaque ressource (= objet, lieu, livre, auteur …..) est identifiée par une -ou plusieurs - URI -(= identifiant uniforme de ressource)  ex : un oiseau = http://stitch.cs.vu.nl/vocabularies/rameau/ark:/12148/cb1 1932889r  ex : Les Boulassiers = http://sws.geonames.org/3031189/  ex : Aristote = http://viaf.org/viaf/7524651/#Aristotle « same as » http://www.idref.fr/026690276/id
  • 25. Sujet ( = ce qu’on décrit ) http://www.w3.org/Home/Lassila Prédicat ( = une Propriété applicable à ce qu’on décrit ) A pour Créateur Objet (= une valeur ) "Ora Lassila" RDF : le principe des triplets Les données sont décomposées / recomposées en « triplets RDF » …. et modélisées en « graphes RDF »
  • 26. Sujet/prédicat/objet  Quatre-vingt-treize est un roman deVictor Hugo paru en 1874 et dont le thème est la révolution française  Quatre-vingt-treize est un roman  Quatre-vingt-treize a pour auteur Victor Hugo  Quatre-vingt-treize est paru en 1874  Quatre-vingt-treize a pour thème la Révolution française  (Quatre-vingt-treize, type, roman)  (Quatre-vingt-treize, auteur,Victor Hugo)  (Quatre-vingt-treize, année de parution, 1874)  (Quatre-vingt-treize, thème, La Révolution Française) Exemple emprunté à Bernard Vatant – in Métadonnées, perspectives et Mutations Séminaire INRIA – 2008)
  • 27. Sujet / prédicat / objet Ressource = 1 URI = http://dbpedia.org/resource/Ninety-Three dbpedia : Ninety-Three rdf:type yago:Novel106367879 dbpedia : Ninety-Three dcterms : creator dbpedia :Victor Hugo dbpedia : Ninety-Three dcterms : created « 1874 » dbpedia : Ninety-Three skos:subject dbpedia : Category : French revolution
  • 28. Diapo : Emmanuelle Bermès En d’autres termes ….
  • 30. Bases de connaissances en accès libre  Data.gov : 305. 692 Datasets (nov.2010)  http://data.gov.uk/  DBPedia : 3,4 millions d'entités  Geoname : 8 millions de noms géographiques  Musicbrainz
  • 32. http://sws.geonames.org/3031189 ???? <rdf:RDF> <gn:Feature rdf:about="http://sws.geonames.org/3031189/"> <rdfs:isDefinedBy>http://sws.geonames.org/3031189/about.rdf</rdfs:isDefinedBy> <gn:name>Pointe des Boulassiers</gn:name> <gn:featureClass rdf:resource="http://www.geonames.org/ontology#T"/> <gn:featureCode rdf:resource="http://www.geonames.org/ontology#T.PT"/> <gn:countryCode>FR</gn:countryCode> <wgs84_pos:lat>46.01667</wgs84_pos:lat> <wgs84_pos:long>-1.33333</wgs84_pos:long> <gn:parentFeature rdf:resource="http://sws.geonames.org/2986492/"/> <gn:parentCountry rdf:resource="http://sws.geonames.org/3017382/"/> <gn:parentADM1 rdf:resource="http://sws.geonames.org/2986492/"/> <gn:nearbyFeatures rdf:resource="http://sws.geonames.org/3031189/nearby.rdf"/> <gn:locationMap rdf:resource="http://www.geonames.org/3031189/pointe-des-boulassiers.html"/> </gn:Feature> <foaf:Document rdf:about="http://sws.geonames.org/3031189/about.rdf"> <foaf:primaryTopic rdf:resource="http://sws.geonames.org/3031189/"/> <cc:license rdf:resource="http://creativecommons.org/licenses/by/3.0/"/> <cc:attributionURL rdf:resource="http://sws.geonames.org/3031189/"/> <cc:attributionName rdf:datatype="http://www.w3.org/2001/XMLSchema#string">GeoNames</cc:attributionName> <dcterms:created rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2006-01-15</dcterms:created> <dcterms:modified rdf:datatype="http://www.w3.org/2001/XMLSchema#date">1994-01-06</dcterms:modified> </foaf:Document> </rdf:RDF>
  • 33. Pointe des Boulassiers France » Poitou-Charentes point N 46° 1' 0''W 1° 20' 0'' 46.01667 / -1.33333 GeoNameId : 3031189
  • 34. Des silos de «données brutes»
  • 37. … et les bibliothèques ???
  • 38. … et les bibliothèques ??? Réalisations  Rameau en SKOS (TEL Plus Project)  VIAF :Virtual International Authority File (OCLC)  Dewey en RDF (expérimentationOCLC)  IdREF : autorités Sudoc en RDF (ABES) Vocabulaires RDF  Dublin Core (DCMI) en RDF = DublinCoreTerms  FRBR / FRAD (modèles conceptuels)  RDA en RDF : nouvelles (futures ?) règles de catalogage
  • 39. La DEWEY en RDF (OCLC)
  • 40. RAMEAU en SKOS (TelPlus)
  • 45. + utilisation des données externes
  • 46. Données libérées = Moteurs sémantiques ???
  • 47. Questions en langage naturel ?
  • 55. Pour en savoir plus …. Tim Berners-Lee :The Next Web of Open, Linked Data (TED 2009) http://dai.ly/cvIl6P (sous-titré en français) LinkingOpenData http://esw.w3.org/SweoIG/TaskForces/CommunityProjects/LinkingOpenData SKOS http://www.w3.org/2004/02/skos/ Projet Open Library http://openlibrary.org/about/lib LIBRIS : un catalogue dans le linked data http://dc2008.de/wp-content/uploads/2008/09/malmsten.pdf Les catalogues de bibliothèques sur leWeb – Emmanuelle Bermès (2009) http://www.slideshare.net/Figoblog/les-catalogues-sur-le-web Le web sémantique : un web de métadonnées –Yann Nicolas http://www.slideshare.net/yannn/le-web-smantique-un Métadonnées : mutations et perspectives – Séminaire INRIA - 29 sept./ 3 oct. 2008 – Dijon – ADBS Editions
  • 56. Merci à …. … porte d’entrée (toujours) indispensable …. pour collecter les informations et données ayant servi à cette présentation …. àYann Nicolas (ABES) et Emmanuelle Bermes (BNF), initiateurs en RDF Cette présentation est placée sous licence Creative Commons