SlideShare une entreprise Scribd logo
1  sur  16
Télécharger pour lire hors ligne
Du web sémantique 
à tous les étages ? 
Yann Nicolas – Michael Jeulin 
ABES 
SemWeb.Pro 2014 
Paris, 5/11/2014
Le Linked Data de l’ABES 
Trois bases de données autour d’un 
référentiel 
Système Universitaire de 
Documentation : 
Catalogue collectif de l’ 
enseignement supérieur 
Theses.fr : portail des thèses 
de doctorat soutenues et en 
préparation en France 
(applications STAR et STEP) 
IdRef : référentiel d’ 
autorités pour le Sudoc, 
Theses.fr et Calames 
Calames : catalogue des 
archives et manuscrits de 
l’enseignement supérieur
Exposer
L’ABES sur le web de données : 
pourquoi ? 
• Des données liées et structurées 
• pour les moteurs de recherche... 
• pour faciliter leur export et leur réutilisation 
• Ouverture et mutualisation des données : une 
tradition dans les bibliothèques 
ISBD, MARC, catalogage partagé, Z39-50… 
• Nouvelle étape : on ouvre plus, et à tout le 
monde 
OAI, webservices... et RDF
Méthode et principes 
• Une entreprise au long cours 
• Approche progressive, pragmatique et 
empirique 
• Choix de standards du web 
XML 
EAD, MARC/XML, TEF 
XSLT 
RDFa 
RDF/XML 
Pas de 
triplestore 
URL + sitemaps 
schema.org 
Conversion à la volée = pas de base RDF
Les chantiers RDF 
Application Format Année RDF Dump SPARQL ? Qualité LOD 
Calames XML (EAD) 2008 RDFa Non Non 
★ ★ ★ ★ ★ 
IdRef MARC 2010 RDF/XML Oui 
(mais pas 
public) 
Non 
★ ★ ★ ★ ★ 
Sudoc MARC 2011 RDF/XML + 
schema.org 
Oui 
(mais pas 
public) 
Non 
(en cours) ★ ★ ★ ★ ★ 
www.theses. 
fr 
XML (TEF) 2011 RDFa+RDF/XML Non Non 
★ ★ ★ ★ ★ 
Linked open data : 
★ non filtrées (presque) 
★ ★ Structurées 
★ ★ ★ Librement exploitables 
★ ★ ★ ★ Identifiées (URL) 
★ ★ ★ ★ ★ Données liées
Quels modèles de données ? 
vocabulaires « métiers » 
quand nécessaire : ISBD, 
RDA (Sudoc) 
Proches des formats 
natifs, mais mal adaptés 
au web de données… 
Vocabulaires déjà publiés 
et répandus : Dublin 
Core, Bibo, FOAF, bio, etc 
= 
Diffusion plus large, mais 
mal adapté aux données 
natives 
Vocabulaire ad 
hoc ? 
Et jusqu’où 
raffiner ?
Interroger les données 
Un Sparql endpoint pour le Sudoc et les 
autorités : on y travaille… 
– Usages : interopérabilité Sudoc/Hub, BnF… 
– Exigences : fraîcheur et exhaustivité 
– L’écueil : la volumétrie 
Sudoc + IdRef = près d’un milliard de triplets 
– Des alternatives au triplestore ? 
Exemple: D2RQ (en test) 
Oracle (SQL) XSLT Mapping 
SQL-RDF 
SPARQL 
D2RQ ?
Quel retour sur investissement ? 
• Des exemples encore limités de réutilisations 
(connues) 
– Limités par l’absence d’un requêteur 
– Et de dumps vraiment exploitables 
• Mais une montée en compétence réinvestie pour 
des usages internes
Gérer 
en interne 
des données hétérogènes 
Le “hub de métadonnées” ABES
un hub de métadonnées 
• Une application 
• Une seule base de données 
• Une approche 
• Terrains d’application : 
• Aujourd’hui : les métadonnées fournies par 
les éditeurs internationaux dans le cadre du 
programme ISTEX (achat en masse de 
littérature scientifique online)
méta-données 
éditeur 
catalogues 
catalogues 
+ 
discovery 
tools 
+ 
… 
+ 
LOD
Principes de conception 
• Modélisation et conversion zéro déchet 
– ne rien perdre des données de départ 
– si nécessaire, forger classes et propriétés sans complexe 
• Corriger/Modifier dans la base RDF 
– pas dans le format natif 
• Ré-exposer dans le LOD, sans le spammer #demain 
– Si l’éditeur (ou un tiers) a déjà exposé les données, n’ 
exposer que nos enrichissements 
– Mais quid des corrections/contradictions ?
Conclusions avec des ? 
• Résister à la tentation de mettre du semweb partout 
#fétichisme 
• Cas d’usage les plus pertinents : 
• Ouverture des données 
• Gestion de données hétérogènes #hub 
• Conséquences sur les priorités pratiques : 
• Sparql OK, mais web services simples et efficaces avant 
• Produire les données en RDF ? 
• compliqué si données hétérogènes ? 
• inutile si données homogènes ?
Pour aller plus loin… 
Calames 
• http://calames.wordpress.com/2008/07/22/calames-yahoo-rdf/ 
IdRef 
• http://punktokomo.abes.fr/2012/05/11/idref-dans-viaf-identifiants/ 
• http://punktokomo.abes.fr/2011/07/05/idref-des-pages-html-et-rdf-plus-riches/ 
• http://documentation.abes.fr/aideidref/developpeur/ch03s02.html 
Thèses 
• http://documentation.abes.fr/aidethesesfr/accueil/ch03.html 
• http://punktokomo.abes.fr/2011/07/12/theses-fr-lapi-xml-des-theses/ 
• http://punktokomo.abes.fr/2011/07/12/theses-fr-lapi-xml-des-personnes/ 
Sudoc 
• http://punktokomo.abes.fr/2011/07/04/le-sudoc-sur-le-web-de-donnees/ 
• http://documentation.abes.fr/sudoc/manuels/administration/sudoc_rdf/ 
Hub de métadonnées 
• http://fil.abes.fr/2013/07/15/le-hub-de-metadonnees-rapport-final-et-plan-daction/ 
• http://fr.slideshare.net/abesweb/jabes14-yann-nicolasfocushub 
SudocAD/Qualinca 
• http://punktokomo.abes.fr/2012/02/02/sudocad-resume-du-projet/ 
• http://www.lirmm.fr/qualinca 
Exemples de réutilisations externes (présentations Jabes 2014): 
Julien Sicot, SCD Rennes 2 
• http://fr.slideshare.net/abesweb/jabes14-julien-sicotutiliserwebservicesabes-35302040 
Yves Tomic, SCD Université Paris Sud 
• http://fr.slideshare.net/abesweb/jabes14-yves-tomicapipourquoifaire 
• http://punktokomo.abes.fr/2014/02/18/domybiblio/

Contenu connexe

Tendances

L'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de BiblissimaL'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de BiblissimaEquipex Biblissima
 
Innover par et pour la donnée - Logilab ADBU Bibcamp 2015
Innover par et pour la donnée - Logilab ADBU Bibcamp 2015Innover par et pour la donnée - Logilab ADBU Bibcamp 2015
Innover par et pour la donnée - Logilab ADBU Bibcamp 2015Logilab
 
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...ABES
 
Les fichiers d’autorite et leur fonction dans les bases de données
Les fichiers d’autorite et leur fonction dans les bases de donnéesLes fichiers d’autorite et leur fonction dans les bases de données
Les fichiers d’autorite et leur fonction dans les bases de donnéesEquipex Biblissima
 
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...ABES
 
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIFMieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIFEquipex Biblissima
 
2016 alod troyes.ppt
2016 alod troyes.ppt2016 alod troyes.ppt
2016 alod troyes.pptAssociationAF
 
Modèles de données et langages de description ouverts 5 - 2021-2022
Modèles de données et langages de description ouverts   5 - 2021-2022Modèles de données et langages de description ouverts   5 - 2021-2022
Modèles de données et langages de description ouverts 5 - 2021-2022François-Xavier Boffy
 
Archives ouvertes - Perspectives Europeennes
Archives ouvertes - Perspectives EuropeennesArchives ouvertes - Perspectives Europeennes
Archives ouvertes - Perspectives Europeenneschessmu
 
Gérer et diffuser ses données: principes et bonnes pratiques
Gérer et diffuser ses données: principes et bonnes pratiquesGérer et diffuser ses données: principes et bonnes pratiques
Gérer et diffuser ses données: principes et bonnes pratiquesMathieu Saby
 
Data sprint des archives
Data sprint  des archives   Data sprint  des archives
Data sprint des archives AssociationAF
 
Le projet du SCD de Nice: une approche globale des données de la recherche
Le projet du SCD de Nice: une approche globale des données de la rechercheLe projet du SCD de Nice: une approche globale des données de la recherche
Le projet du SCD de Nice: une approche globale des données de la rechercheMathieu Saby
 
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'informationMasterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'informationAntidot
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Y. Nicolas
 
Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web SémantiqueYves Otis
 
L’indexation des éditions de sources et la conception de base(s) prosopograph...
L’indexation des éditions de sources et la conception de base(s) prosopograph...L’indexation des éditions de sources et la conception de base(s) prosopograph...
L’indexation des éditions de sources et la conception de base(s) prosopograph...Equipex Biblissima
 
Jabes 2009 - Atelier 5 "Portail des thèses"
Jabes 2009  - Atelier 5 "Portail des thèses"Jabes 2009  - Atelier 5 "Portail des thèses"
Jabes 2009 - Atelier 5 "Portail des thèses"ABES
 
Documation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifiéDocumation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifiéAntidot
 

Tendances (20)

L'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de BiblissimaL'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de Biblissima
 
Innover par et pour la donnée - Logilab ADBU Bibcamp 2015
Innover par et pour la donnée - Logilab ADBU Bibcamp 2015Innover par et pour la donnée - Logilab ADBU Bibcamp 2015
Innover par et pour la donnée - Logilab ADBU Bibcamp 2015
 
Le projet NEEO
Le projet NEEOLe projet NEEO
Le projet NEEO
 
Cemagref
CemagrefCemagref
Cemagref
 
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
 
Les fichiers d’autorite et leur fonction dans les bases de données
Les fichiers d’autorite et leur fonction dans les bases de donnéesLes fichiers d’autorite et leur fonction dans les bases de données
Les fichiers d’autorite et leur fonction dans les bases de données
 
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
 
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIFMieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
Mieux diffuser et valoriser ses images sur le Web grâce aux standards IIIF
 
2016 alod troyes.ppt
2016 alod troyes.ppt2016 alod troyes.ppt
2016 alod troyes.ppt
 
Modèles de données et langages de description ouverts 5 - 2021-2022
Modèles de données et langages de description ouverts   5 - 2021-2022Modèles de données et langages de description ouverts   5 - 2021-2022
Modèles de données et langages de description ouverts 5 - 2021-2022
 
Archives ouvertes - Perspectives Europeennes
Archives ouvertes - Perspectives EuropeennesArchives ouvertes - Perspectives Europeennes
Archives ouvertes - Perspectives Europeennes
 
Gérer et diffuser ses données: principes et bonnes pratiques
Gérer et diffuser ses données: principes et bonnes pratiquesGérer et diffuser ses données: principes et bonnes pratiques
Gérer et diffuser ses données: principes et bonnes pratiques
 
Data sprint des archives
Data sprint  des archives   Data sprint  des archives
Data sprint des archives
 
Le projet du SCD de Nice: une approche globale des données de la recherche
Le projet du SCD de Nice: une approche globale des données de la rechercheLe projet du SCD de Nice: une approche globale des données de la recherche
Le projet du SCD de Nice: une approche globale des données de la recherche
 
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'informationMasterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)
 
Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web Sémantique
 
L’indexation des éditions de sources et la conception de base(s) prosopograph...
L’indexation des éditions de sources et la conception de base(s) prosopograph...L’indexation des éditions de sources et la conception de base(s) prosopograph...
L’indexation des éditions de sources et la conception de base(s) prosopograph...
 
Jabes 2009 - Atelier 5 "Portail des thèses"
Jabes 2009  - Atelier 5 "Portail des thèses"Jabes 2009  - Atelier 5 "Portail des thèses"
Jabes 2009 - Atelier 5 "Portail des thèses"
 
Documation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifiéDocumation 2011 : de la recherche fédérée à l'accès unifié
Documation 2011 : de la recherche fédérée à l'accès unifié
 

En vedette

Presentacion java
Presentacion javaPresentacion java
Presentacion javahapuken
 
Memoria abantia 2012 francés
Memoria abantia 2012 francésMemoria abantia 2012 francés
Memoria abantia 2012 francésauxaba
 
Las tecnologías de la información y la comunicación
Las tecnologías de la información y la comunicaciónLas tecnologías de la información y la comunicación
Las tecnologías de la información y la comunicaciónNIDIA ALVARADO ALVARADO
 
Tema 7 polimorfismo en java
Tema 7 polimorfismo en javaTema 7 polimorfismo en java
Tema 7 polimorfismo en javaFaby Páez
 
Costes asociados a la gestión de residuos en Francia
Costes asociados a la gestión de residuos en FranciaCostes asociados a la gestión de residuos en Francia
Costes asociados a la gestión de residuos en FranciaANEPMA
 
Taller de tics.1parte(solucion)
Taller de tics.1parte(solucion)Taller de tics.1parte(solucion)
Taller de tics.1parte(solucion)francy
 
Prova 3ESO B
Prova 3ESO BProva 3ESO B
Prova 3ESO Bxescori
 
Touch, gestures y acelerómetro con JavaScript en ipad
Touch, gestures y acelerómetro con JavaScript en ipadTouch, gestures y acelerómetro con JavaScript en ipad
Touch, gestures y acelerómetro con JavaScript en ipadWeb Studios
 
Talleres faltan el 1 y el de generar empresa[1]
Talleres faltan el 1 y el de generar empresa[1]Talleres faltan el 1 y el de generar empresa[1]
Talleres faltan el 1 y el de generar empresa[1]francy
 
20ideas contra la discriminacion primera parte
20ideas contra la discriminacion primera parte20ideas contra la discriminacion primera parte
20ideas contra la discriminacion primera parteMediadores Interculturales
 
Taller cedi
Taller   cediTaller   cedi
Taller cedifrancy
 
Le Lead nurturing dans l'Océan Bleu
Le Lead nurturing dans l'Océan BleuLe Lead nurturing dans l'Océan Bleu
Le Lead nurturing dans l'Océan BleuLa Team Web
 
Argum tipos
Argum tiposArgum tipos
Argum tiposcaustica
 

En vedette (20)

Presentacion java
Presentacion javaPresentacion java
Presentacion java
 
Capitulo1
Capitulo1Capitulo1
Capitulo1
 
Memoria abantia 2012 francés
Memoria abantia 2012 francésMemoria abantia 2012 francés
Memoria abantia 2012 francés
 
Las tecnologías de la información y la comunicación
Las tecnologías de la información y la comunicaciónLas tecnologías de la información y la comunicación
Las tecnologías de la información y la comunicación
 
Questionnaire analysis
Questionnaire analysisQuestionnaire analysis
Questionnaire analysis
 
Tema 7 polimorfismo en java
Tema 7 polimorfismo en javaTema 7 polimorfismo en java
Tema 7 polimorfismo en java
 
Congreso univ 2011
Congreso univ 2011Congreso univ 2011
Congreso univ 2011
 
Costes asociados a la gestión de residuos en Francia
Costes asociados a la gestión de residuos en FranciaCostes asociados a la gestión de residuos en Francia
Costes asociados a la gestión de residuos en Francia
 
Taller de tics.1parte(solucion)
Taller de tics.1parte(solucion)Taller de tics.1parte(solucion)
Taller de tics.1parte(solucion)
 
Prova 3ESO B
Prova 3ESO BProva 3ESO B
Prova 3ESO B
 
Touch, gestures y acelerómetro con JavaScript en ipad
Touch, gestures y acelerómetro con JavaScript en ipadTouch, gestures y acelerómetro con JavaScript en ipad
Touch, gestures y acelerómetro con JavaScript en ipad
 
Talleres faltan el 1 y el de generar empresa[1]
Talleres faltan el 1 y el de generar empresa[1]Talleres faltan el 1 y el de generar empresa[1]
Talleres faltan el 1 y el de generar empresa[1]
 
Portafolio de servicios
Portafolio de serviciosPortafolio de servicios
Portafolio de servicios
 
20ideas contra la discriminacion primera parte
20ideas contra la discriminacion primera parte20ideas contra la discriminacion primera parte
20ideas contra la discriminacion primera parte
 
Pres1 v2
Pres1 v2Pres1 v2
Pres1 v2
 
Taller cedi
Taller   cediTaller   cedi
Taller cedi
 
Le Lead nurturing dans l'Océan Bleu
Le Lead nurturing dans l'Océan BleuLe Lead nurturing dans l'Océan Bleu
Le Lead nurturing dans l'Océan Bleu
 
..
....
..
 
Argum tipos
Argum tiposArgum tipos
Argum tipos
 
Proy cetes
Proy cetesProy cetes
Proy cetes
 

Similaire à Du web sémantique à tous les étages

metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011Y. Nicolas
 
Serveur web / Base de donnees Langages de développement
Serveur web / Base de donnees Langages de développementServeur web / Base de donnees Langages de développement
Serveur web / Base de donnees Langages de développementLudovic REUS
 
20121009 10-datalift-camp-paris
20121009 10-datalift-camp-paris20121009 10-datalift-camp-paris
20121009 10-datalift-camp-parisDatalift
 
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...ABES
 
Sudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesY. Nicolas
 
Jabes 2012 - Tutoriel theses.fr
Jabes 2012 - Tutoriel theses.frJabes 2012 - Tutoriel theses.fr
Jabes 2012 - Tutoriel theses.frABES
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesSemWebPro
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataBorderCloud
 
Jabes 2012 - Projet de Système de Gestion de Bibliothèque mutualisé
Jabes 2012 - Projet de Système de Gestion de Bibliothèque mutualiséJabes 2012 - Projet de Système de Gestion de Bibliothèque mutualisé
Jabes 2012 - Projet de Système de Gestion de Bibliothèque mutualiséABES
 
États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantiqueIvan Herman
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprisesAymen ZAAFOURI
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèseY. Nicolas
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceBorderCloud
 
MDweb: un composant pour le catalogage et la localisation de l'information en...
MDweb: un composant pour le catalogage et la localisation de l'information en...MDweb: un composant pour le catalogage et la localisation de l'information en...
MDweb: un composant pour le catalogage et la localisation de l'information en...Desconnets Jean-Christophe
 
Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...Alexandre Monnin
 
Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)BorderCloud
 

Similaire à Du web sémantique à tous les étages (20)

metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 
Serveur web / Base de donnees Langages de développement
Serveur web / Base de donnees Langages de développementServeur web / Base de donnees Langages de développement
Serveur web / Base de donnees Langages de développement
 
20121009 10-datalift-camp-paris
20121009 10-datalift-camp-paris20121009 10-datalift-camp-paris
20121009 10-datalift-camp-paris
 
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
Jabes 2011 - Actualités et projets de l'Abes "Ouverture des données du Sudoc,...
 
Web sémantique
Web sémantique Web sémantique
Web sémantique
 
Sudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de donnéesSudoc, Calames, theses.fr et le Web de données
Sudoc, Calames, theses.fr et le Web de données
 
Jabes 2012 - Tutoriel theses.fr
Jabes 2012 - Tutoriel theses.frJabes 2012 - Tutoriel theses.fr
Jabes 2012 - Tutoriel theses.fr
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériences
 
Le Matterhorn RDF Data Model
Le Matterhorn RDF Data ModelLe Matterhorn RDF Data Model
Le Matterhorn RDF Data Model
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec Wikidata
 
Jabes 2012 - Projet de Système de Gestion de Bibliothèque mutualisé
Jabes 2012 - Projet de Système de Gestion de Bibliothèque mutualiséJabes 2012 - Projet de Système de Gestion de Bibliothèque mutualisé
Jabes 2012 - Projet de Système de Gestion de Bibliothèque mutualisé
 
États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantique
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprises
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
Adbs2012 presentation
Adbs2012 presentationAdbs2012 presentation
Adbs2012 presentation
 
IODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data ScienceIODS : Retour d’expériences au sein du Center for Data Science
IODS : Retour d’expériences au sein du Center for Data Science
 
MDweb: un composant pour le catalogage et la localisation de l'information en...
MDweb: un composant pour le catalogage et la localisation de l'information en...MDweb: un composant pour le catalogage et la localisation de l'information en...
MDweb: un composant pour le catalogage et la localisation de l'information en...
 
Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...
 
Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)
 

Plus de SemWebPro

Sparklis exploration et interrogation de points d'accès sparql par interactio...
Sparklis exploration et interrogation de points d'accès sparql par interactio...Sparklis exploration et interrogation de points d'accès sparql par interactio...
Sparklis exploration et interrogation de points d'accès sparql par interactio...SemWebPro
 
Interroger efficacement des bases de données relationnelles avec sparql et ontop
Interroger efficacement des bases de données relationnelles avec sparql et ontopInterroger efficacement des bases de données relationnelles avec sparql et ontop
Interroger efficacement des bases de données relationnelles avec sparql et ontopSemWebPro
 
Plugin smilk : données liées et traitement de la langue pour améliorer la nav...
Plugin smilk : données liées et traitement de la langue pour améliorer la nav...Plugin smilk : données liées et traitement de la langue pour améliorer la nav...
Plugin smilk : données liées et traitement de la langue pour améliorer la nav...SemWebPro
 
ÉVolution d'un système de publication de données techniques automobiles, modé...
ÉVolution d'un système de publication de données techniques automobiles, modé...ÉVolution d'un système de publication de données techniques automobiles, modé...
ÉVolution d'un système de publication de données techniques automobiles, modé...SemWebPro
 
Eli des identifiants pour le croisement des sources ouvertes du droit
Eli des identifiants pour le croisement des sources ouvertes du droit Eli des identifiants pour le croisement des sources ouvertes du droit
Eli des identifiants pour le croisement des sources ouvertes du droit SemWebPro
 
Doremus extension de l'ontologie frb roo pour la description des œuvres et ...
Doremus   extension de l'ontologie frb roo pour la description des œuvres et ...Doremus   extension de l'ontologie frb roo pour la description des œuvres et ...
Doremus extension de l'ontologie frb roo pour la description des œuvres et ...SemWebPro
 
Gestion de serveurs avec une plateforme sémantique
Gestion de serveurs avec une plateforme sémantiqueGestion de serveurs avec une plateforme sémantique
Gestion de serveurs avec une plateforme sémantiqueSemWebPro
 
Biblissima : une nouvelle bibliothèque des bibliothèques du moyen âge et de l...
Biblissima : une nouvelle bibliothèque des bibliothèques du moyen âge et de l...Biblissima : une nouvelle bibliothèque des bibliothèques du moyen âge et de l...
Biblissima : une nouvelle bibliothèque des bibliothèques du moyen âge et de l...SemWebPro
 
Utilisation de data.bnf.fr pour alimenter wiki data
Utilisation de data.bnf.fr pour alimenter wiki dataUtilisation de data.bnf.fr pour alimenter wiki data
Utilisation de data.bnf.fr pour alimenter wiki dataSemWebPro
 
Libre théâtre, plateforme facilitant l'accès gratuit aux textes de théâtre fr...
Libre théâtre, plateforme facilitant l'accès gratuit aux textes de théâtre fr...Libre théâtre, plateforme facilitant l'accès gratuit aux textes de théâtre fr...
Libre théâtre, plateforme facilitant l'accès gratuit aux textes de théâtre fr...SemWebPro
 
Feuille de route 3.0 du ministère de la culture
 Feuille de route 3.0 du ministère de la culture Feuille de route 3.0 du ministère de la culture
Feuille de route 3.0 du ministère de la cultureSemWebPro
 
Retour mooc web sémantique
Retour mooc web sémantiqueRetour mooc web sémantique
Retour mooc web sémantiqueSemWebPro
 
Spécialisation du moteur sémantique Cognit’Ive dans différents contextes util...
Spécialisation du moteur sémantique Cognit’Ive dans différents contextes util...Spécialisation du moteur sémantique Cognit’Ive dans différents contextes util...
Spécialisation du moteur sémantique Cognit’Ive dans différents contextes util...SemWebPro
 
Web Sémantique et Linked Open Data : des usages aux données, comment tirer p...
Web Sémantique et Linked Open Data  : des usages aux données, comment tirer p...Web Sémantique et Linked Open Data  : des usages aux données, comment tirer p...
Web Sémantique et Linked Open Data : des usages aux données, comment tirer p...SemWebPro
 
The Read-Write Secure Linked Data Web
The Read-Write Secure Linked Data WebThe Read-Write Secure Linked Data Web
The Read-Write Secure Linked Data WebSemWebPro
 
Présentation du portail sémantique de la FEVIS
Présentation du portail sémantique de la FEVISPrésentation du portail sémantique de la FEVIS
Présentation du portail sémantique de la FEVISSemWebPro
 
Présentation de Bano
Présentation de BanoPrésentation de Bano
Présentation de BanoSemWebPro
 
Naturopédia : Publication multi-supports et animation communautaire augmenté...
Naturopédia  : Publication multi-supports et animation communautaire augmenté...Naturopédia  : Publication multi-supports et animation communautaire augmenté...
Naturopédia : Publication multi-supports et animation communautaire augmenté...SemWebPro
 
Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique ...
Réaliser une application Web sémantique grâce à l’outil VIVO  - Cas pratique ...Réaliser une application Web sémantique grâce à l’outil VIVO  - Cas pratique ...
Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique ...SemWebPro
 
Présentation du navigateur datao
Présentation du navigateur dataoPrésentation du navigateur datao
Présentation du navigateur dataoSemWebPro
 

Plus de SemWebPro (20)

Sparklis exploration et interrogation de points d'accès sparql par interactio...
Sparklis exploration et interrogation de points d'accès sparql par interactio...Sparklis exploration et interrogation de points d'accès sparql par interactio...
Sparklis exploration et interrogation de points d'accès sparql par interactio...
 
Interroger efficacement des bases de données relationnelles avec sparql et ontop
Interroger efficacement des bases de données relationnelles avec sparql et ontopInterroger efficacement des bases de données relationnelles avec sparql et ontop
Interroger efficacement des bases de données relationnelles avec sparql et ontop
 
Plugin smilk : données liées et traitement de la langue pour améliorer la nav...
Plugin smilk : données liées et traitement de la langue pour améliorer la nav...Plugin smilk : données liées et traitement de la langue pour améliorer la nav...
Plugin smilk : données liées et traitement de la langue pour améliorer la nav...
 
ÉVolution d'un système de publication de données techniques automobiles, modé...
ÉVolution d'un système de publication de données techniques automobiles, modé...ÉVolution d'un système de publication de données techniques automobiles, modé...
ÉVolution d'un système de publication de données techniques automobiles, modé...
 
Eli des identifiants pour le croisement des sources ouvertes du droit
Eli des identifiants pour le croisement des sources ouvertes du droit Eli des identifiants pour le croisement des sources ouvertes du droit
Eli des identifiants pour le croisement des sources ouvertes du droit
 
Doremus extension de l'ontologie frb roo pour la description des œuvres et ...
Doremus   extension de l'ontologie frb roo pour la description des œuvres et ...Doremus   extension de l'ontologie frb roo pour la description des œuvres et ...
Doremus extension de l'ontologie frb roo pour la description des œuvres et ...
 
Gestion de serveurs avec une plateforme sémantique
Gestion de serveurs avec une plateforme sémantiqueGestion de serveurs avec une plateforme sémantique
Gestion de serveurs avec une plateforme sémantique
 
Biblissima : une nouvelle bibliothèque des bibliothèques du moyen âge et de l...
Biblissima : une nouvelle bibliothèque des bibliothèques du moyen âge et de l...Biblissima : une nouvelle bibliothèque des bibliothèques du moyen âge et de l...
Biblissima : une nouvelle bibliothèque des bibliothèques du moyen âge et de l...
 
Utilisation de data.bnf.fr pour alimenter wiki data
Utilisation de data.bnf.fr pour alimenter wiki dataUtilisation de data.bnf.fr pour alimenter wiki data
Utilisation de data.bnf.fr pour alimenter wiki data
 
Libre théâtre, plateforme facilitant l'accès gratuit aux textes de théâtre fr...
Libre théâtre, plateforme facilitant l'accès gratuit aux textes de théâtre fr...Libre théâtre, plateforme facilitant l'accès gratuit aux textes de théâtre fr...
Libre théâtre, plateforme facilitant l'accès gratuit aux textes de théâtre fr...
 
Feuille de route 3.0 du ministère de la culture
 Feuille de route 3.0 du ministère de la culture Feuille de route 3.0 du ministère de la culture
Feuille de route 3.0 du ministère de la culture
 
Retour mooc web sémantique
Retour mooc web sémantiqueRetour mooc web sémantique
Retour mooc web sémantique
 
Spécialisation du moteur sémantique Cognit’Ive dans différents contextes util...
Spécialisation du moteur sémantique Cognit’Ive dans différents contextes util...Spécialisation du moteur sémantique Cognit’Ive dans différents contextes util...
Spécialisation du moteur sémantique Cognit’Ive dans différents contextes util...
 
Web Sémantique et Linked Open Data : des usages aux données, comment tirer p...
Web Sémantique et Linked Open Data  : des usages aux données, comment tirer p...Web Sémantique et Linked Open Data  : des usages aux données, comment tirer p...
Web Sémantique et Linked Open Data : des usages aux données, comment tirer p...
 
The Read-Write Secure Linked Data Web
The Read-Write Secure Linked Data WebThe Read-Write Secure Linked Data Web
The Read-Write Secure Linked Data Web
 
Présentation du portail sémantique de la FEVIS
Présentation du portail sémantique de la FEVISPrésentation du portail sémantique de la FEVIS
Présentation du portail sémantique de la FEVIS
 
Présentation de Bano
Présentation de BanoPrésentation de Bano
Présentation de Bano
 
Naturopédia : Publication multi-supports et animation communautaire augmenté...
Naturopédia  : Publication multi-supports et animation communautaire augmenté...Naturopédia  : Publication multi-supports et animation communautaire augmenté...
Naturopédia : Publication multi-supports et animation communautaire augmenté...
 
Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique ...
Réaliser une application Web sémantique grâce à l’outil VIVO  - Cas pratique ...Réaliser une application Web sémantique grâce à l’outil VIVO  - Cas pratique ...
Réaliser une application Web sémantique grâce à l’outil VIVO - Cas pratique ...
 
Présentation du navigateur datao
Présentation du navigateur dataoPrésentation du navigateur datao
Présentation du navigateur datao
 

Du web sémantique à tous les étages

  • 1. Du web sémantique à tous les étages ? Yann Nicolas – Michael Jeulin ABES SemWeb.Pro 2014 Paris, 5/11/2014
  • 2. Le Linked Data de l’ABES Trois bases de données autour d’un référentiel Système Universitaire de Documentation : Catalogue collectif de l’ enseignement supérieur Theses.fr : portail des thèses de doctorat soutenues et en préparation en France (applications STAR et STEP) IdRef : référentiel d’ autorités pour le Sudoc, Theses.fr et Calames Calames : catalogue des archives et manuscrits de l’enseignement supérieur
  • 4. L’ABES sur le web de données : pourquoi ? • Des données liées et structurées • pour les moteurs de recherche... • pour faciliter leur export et leur réutilisation • Ouverture et mutualisation des données : une tradition dans les bibliothèques ISBD, MARC, catalogage partagé, Z39-50… • Nouvelle étape : on ouvre plus, et à tout le monde OAI, webservices... et RDF
  • 5. Méthode et principes • Une entreprise au long cours • Approche progressive, pragmatique et empirique • Choix de standards du web XML EAD, MARC/XML, TEF XSLT RDFa RDF/XML Pas de triplestore URL + sitemaps schema.org Conversion à la volée = pas de base RDF
  • 6. Les chantiers RDF Application Format Année RDF Dump SPARQL ? Qualité LOD Calames XML (EAD) 2008 RDFa Non Non ★ ★ ★ ★ ★ IdRef MARC 2010 RDF/XML Oui (mais pas public) Non ★ ★ ★ ★ ★ Sudoc MARC 2011 RDF/XML + schema.org Oui (mais pas public) Non (en cours) ★ ★ ★ ★ ★ www.theses. fr XML (TEF) 2011 RDFa+RDF/XML Non Non ★ ★ ★ ★ ★ Linked open data : ★ non filtrées (presque) ★ ★ Structurées ★ ★ ★ Librement exploitables ★ ★ ★ ★ Identifiées (URL) ★ ★ ★ ★ ★ Données liées
  • 7. Quels modèles de données ? vocabulaires « métiers » quand nécessaire : ISBD, RDA (Sudoc) Proches des formats natifs, mais mal adaptés au web de données… Vocabulaires déjà publiés et répandus : Dublin Core, Bibo, FOAF, bio, etc = Diffusion plus large, mais mal adapté aux données natives Vocabulaire ad hoc ? Et jusqu’où raffiner ?
  • 8. Interroger les données Un Sparql endpoint pour le Sudoc et les autorités : on y travaille… – Usages : interopérabilité Sudoc/Hub, BnF… – Exigences : fraîcheur et exhaustivité – L’écueil : la volumétrie Sudoc + IdRef = près d’un milliard de triplets – Des alternatives au triplestore ? Exemple: D2RQ (en test) Oracle (SQL) XSLT Mapping SQL-RDF SPARQL D2RQ ?
  • 9. Quel retour sur investissement ? • Des exemples encore limités de réutilisations (connues) – Limités par l’absence d’un requêteur – Et de dumps vraiment exploitables • Mais une montée en compétence réinvestie pour des usages internes
  • 10. Gérer en interne des données hétérogènes Le “hub de métadonnées” ABES
  • 11. un hub de métadonnées • Une application • Une seule base de données • Une approche • Terrains d’application : • Aujourd’hui : les métadonnées fournies par les éditeurs internationaux dans le cadre du programme ISTEX (achat en masse de littérature scientifique online)
  • 12. méta-données éditeur catalogues catalogues + discovery tools + … + LOD
  • 13.
  • 14. Principes de conception • Modélisation et conversion zéro déchet – ne rien perdre des données de départ – si nécessaire, forger classes et propriétés sans complexe • Corriger/Modifier dans la base RDF – pas dans le format natif • Ré-exposer dans le LOD, sans le spammer #demain – Si l’éditeur (ou un tiers) a déjà exposé les données, n’ exposer que nos enrichissements – Mais quid des corrections/contradictions ?
  • 15. Conclusions avec des ? • Résister à la tentation de mettre du semweb partout #fétichisme • Cas d’usage les plus pertinents : • Ouverture des données • Gestion de données hétérogènes #hub • Conséquences sur les priorités pratiques : • Sparql OK, mais web services simples et efficaces avant • Produire les données en RDF ? • compliqué si données hétérogènes ? • inutile si données homogènes ?
  • 16. Pour aller plus loin… Calames • http://calames.wordpress.com/2008/07/22/calames-yahoo-rdf/ IdRef • http://punktokomo.abes.fr/2012/05/11/idref-dans-viaf-identifiants/ • http://punktokomo.abes.fr/2011/07/05/idref-des-pages-html-et-rdf-plus-riches/ • http://documentation.abes.fr/aideidref/developpeur/ch03s02.html Thèses • http://documentation.abes.fr/aidethesesfr/accueil/ch03.html • http://punktokomo.abes.fr/2011/07/12/theses-fr-lapi-xml-des-theses/ • http://punktokomo.abes.fr/2011/07/12/theses-fr-lapi-xml-des-personnes/ Sudoc • http://punktokomo.abes.fr/2011/07/04/le-sudoc-sur-le-web-de-donnees/ • http://documentation.abes.fr/sudoc/manuels/administration/sudoc_rdf/ Hub de métadonnées • http://fil.abes.fr/2013/07/15/le-hub-de-metadonnees-rapport-final-et-plan-daction/ • http://fr.slideshare.net/abesweb/jabes14-yann-nicolasfocushub SudocAD/Qualinca • http://punktokomo.abes.fr/2012/02/02/sudocad-resume-du-projet/ • http://www.lirmm.fr/qualinca Exemples de réutilisations externes (présentations Jabes 2014): Julien Sicot, SCD Rennes 2 • http://fr.slideshare.net/abesweb/jabes14-julien-sicotutiliserwebservicesabes-35302040 Yves Tomic, SCD Université Paris Sud • http://fr.slideshare.net/abesweb/jabes14-yves-tomicapipourquoifaire • http://punktokomo.abes.fr/2014/02/18/domybiblio/