SlideShare une entreprise Scribd logo
1  sur  85
Pierre Col Julien Homo
@PierreCol @Julien_Homo
2
Pierre Col @PierreCol
Julien Homo @Julien_Homo
1978
1963
1983
1986
1996
2007
2010
2006
2009
2011
1987
3
4
Le web sémantique, concrètement
Certains en parlent…
d’autres le font !
5
Le web sémantique, concrètement
6
Le web sémantique, concrètement
Knowledge
Graph
7
Knowledge
Graph
Le web sémantique, concrètement
8
Knowledge
Graph
Le web sémantique, concrètement
9
Le web sémantique, concrètement
Knowledge
Graph
10
Le web sémantique, concrètement
Knowledge
Graph
11
Knowledge
Graph
Le web sémantique, concrètement
12
Le web sémantique, concrètement
Knowledge
Graph
13
Le web sémantique, concrètement
Knowledge
Graph
14
Tim Berners-Lee verbatim
« The Semantic Web is a web of data,
in some ways like a global database »
« The Semantic Web is not a separate Web
but an extension of the current one,
in which information is given well-defined
meaning,
better enabling computers and people
to work in cooperation »
15
« Raw data now ! » février 2009
http://www.ted.com/talks/tim_berners_lee_on_the_next_web?language=fr
16
http://www.flickr.com/photos/jimgris/281139738/
L’idée : casser la vieille logique des silos
de données cloisonnées…
Siège social d’Oracle, l’éditeur du SGBDR le
plus utilisé dans le monde, dans la Silicon
Valley
17
…pour partager la donnée structurée sur
un espace décentralisé : le web
Un Web de documents
● Documents reliés par des liens
● Pas de structuration sémantique
● Pas de requêtes structurées
18
…pour partager la donnée structurée sur
un espace décentralisé: le web
Puis un Web d’applications
● Données exposées à travers des API
● API valables uniquement pour un silo
● Pas d’interopérabilité entre les silos
19
…pour partager la donnée structurée sur
un espace décentralisé : le web
Et maintenant un Web de données
● Web de données = espace unifié
● Liens entre les données elles-mêmes
● APIs remplacées par des standards ouverts
20
21
Une condition nécessaire : assurer
l’interopérabilité des données structurées
● Transport
22
Une condition nécessaire : assurer
l’interopérabilité des données structurées
● Syntaxe
23
Une condition nécessaire : assurer
l’interopérabilité des données structurées
● Sémantique
24
Un langage pour les machines
Une grammaire Le vocabulaire
Des règles
d’écriture
Des moyens
de communication
RDF
RDFS / OWL
Ontologie
RDF/XML
N3, Turtle
RDFa
HTTP
SPARQL
25
Standards : le layer cake aujourd’hui
Déjà normalisé ou
en cours de normalisation
au W3C
26
Le Linked Open Data Cloud - 2014
27
28
Contexte
● Site portail
29
Contexte
● Site portail
30
Contexte
● Site portail
31
Problématique
● Mesurer « la faisabilité technique de réaliser un
site portail basé sur les règles du web de
données et du web sémantique »
32
Mais pourquoi recourir au Web
Sémantique ?
● Agréger les données
● Enrichir les données par des données externes
libre d’accès
● Faciliter leur échange
● Faciliter leur publication
33
Objectifs
● Offrir aux visiteurs une vision plus globale des
ressources disponibles
34
Objectifs
● Favoriser leur découverte par un effet de
sérendipité
35
Objectifs
● Enrichir l’expérience de navigation
36
Objectifs
● Mettre les données à la disposition de tous
37
Par où commencer ?
● Définir le périmètre de l’étude
● Analyser les données
● Réaliser un prototype
38
Quelles sont les sources disponibles ?
39
Comment accéder aux données ?
● API intégrée au système de gestion de
bibliothèque
Requête SIGB Base de données Export XML
● Export au format XML
40
Quelles sont les données disponibles ?
41
Quelles sont les données disponibles ?
20 000 films
250 000 textes imprimés
2 500 ouvrages numériques
20 000
enregistrements musicaux
42
Comment sont structurées les données ?
43
Comment sont structurées les données ?
Propriétés
ID
Dénomination
Auteur
Lieu de création
Date de création
Dimensions
Catégorie matière
Catégorie technique
Mots-clés
Référence commerciale
44
Comment sont structurées les données ?
Propriétés
ID
Dénomination
Auteur
Lieu de création
Date de création
Dimensions
Catégorie matière
Catégorie technique
Mots-clés
Référence commerciale
Propriétés génériques d’une œuvre ?
45
Comment sont structurées les données ?
Propriétés
ID
Dénomination
Auteur
Lieu de création
Date de création
Dimensions
Catégorie matière
Catégorie technique
Mots-clés
Référence commerciale
Lien vers le Linked Open Data ?
46
Laisse Béton (Renaud)
● Prenons un exemple !
47
Laisse Béton (Renaud)
● Vu du catalogue Web (OPAC) …
48
Laisse Béton (Renaud)
● … et du XML
49
Laisse Béton (Renaud)
● Il y a sûrement des choses à faire…
Propriétés Valeurs
ID b18895888
Dénomination Laisse Béton
Auteur Renaud
Lieu de création -
Date de création -
Dimensions 1 disque compact (36 min)
Catégorie matière -
Catégorie technique -
Mots-clés -
Référence commerciale 0042282534828
50
…Et bien faisons les !
● Réalisation d’un prototype
● Mesurer la faisabilité technique du projet sur un
échantillon
● Montrer l’apport de l’Open Data
● Evaluer les difficultés
51
Mettre les données en commun
film01.avi “Livre A”
http://exemple.org/film/01 http://exemple.org/livre/A
52
Identifier les objets
● Schéma arbitraire
● http://data.leschampslibres.org/
● Origine : numérotation arbitraire
Source Numéro Propriété ID
Bibliothèque de Rennes 1 Controlfield 001
http://data.leschampslibres.org/1/b18895888
53
Modéliser les objets
Modèle HADOC
Modèles “évènements” (LODE,
CIDOC CRM, The Event Ontology…)
54
Laisse Béton (Renaud)
55
Relier les données à l’extérieur
● Oui mais dans quel but ?
56
Données VS Usages
57
Usages…
● « Apporter à l’utilisateur des compléments
d’informations sur les objets culturels qu’il
consulte sur le portail des Champs Libres »
58
… VS Données
Propriétés
ISBN
Référence commerciale
Nom et date de naissance de l’auteur
Noms de lieux
59
Sélectionner les sources externes
60
Graphe
Référence commerciale
Nom de l’auteur
+
Date de naissanceNom de lieu
ISBN
ID
IDID
ID
61
Laisse Béton (Renaud)
62
Automatisons-le !
Aligner Annoter
Préparer les données
Localement
A distance
Récupérer les données externes
Interroger Interroger
63
Préparer les données : aligner
Nom Prénom Date de
naissance
Hugo victor 26 février 1802
sartre jean paul 21/06/1905
…
http://catalogue.bnf.fr/ark:/
12148/cb11907966z
Nom Prénom Date de
naissance
Hugo Victor 1802-02-26
Victor 1802-02-26
64
Préparer les données : annoter
http://sws.geonames.org/2911298
65
Préparer les données
● Idéalement
● Dumps RDF
● SPARQL Endpoint
● APIs Web RDF …
● Triplestore intermédiaire
66
Préparer les données
● En réalité
● Dumps divers
● Pas de SPARQL Endpoint
● APIs Web diverses
● Conversion RDF
Triplestore
…
67
Récupérer les données externes
● Requêtes SPARQL
● Triplestore intermédiaire
● SPARQL Endpoint
Enrichissements
Enrichissements
68
Récupérer les données externes
● Requêtes SPARQL : exemples
http://catalogue.bnf.fr/ark:/12148/cb11907966z
Victor Hugo
1802-02-26
foaf:givenName foaf:name
db:birthDate
http://catalogue.bnf.fr/ark:/12148/cb11907966z
69
Récupérer les données externes
● Requêtes SPARQL : exemples
http://data.leschampslibres.org/1/b18895888
“0042282534828”
hadoc:isbn
“4.25 / 5” http://www.discogs.com/master/11710
http://www.wikidata.org/wiki/Q3216384
http://musicbrainz.org/release-group/
374fd86d-838c-3d40-a2c8-680b800290e7
“0042282534828”
mb:barcod
e
owl:sameA
s
owl:sameA
s
dcogs:rating
“4.25 / 5”
70
Récupérer les données externes
● Autres : pas de RDF
● APIs Web
● Dumps (XML, CSV…)
● HTML
● …
…
Enrichissements
71
Récupérer les données externes
● En réalité
● Architecture complexe
● A adapter selon les besoins
… …
72
Laisse béton (Renaud)
Normalisation Triplestore intermédiaire Enrichissements RDF Enrichissements APIs
barcode ?
IDs Discogs Allmusic ?
73
74
Résultats
75
Outils
76
Outils
● Convertir les données
Actions Outils
Aligner, annoter Antidot Information Factory, Gate,
Python…
Créer des données RDF avec un
éditeur
Morla, Top Braid composer, Editeur
XML (Oxygen), Protégé
Transformer des données de XML vers
RDF/XML
XSL, Python…
Transformer des entrées clés/valeurs
en RDF
Google Refine
Transformer une base de données
relationnelle en RDF
Db2triples, D2R server, …
77
Outils
● Stocker les données dans un triplestore
Optimisation Outils
Mémoire Corese, Redstore
Triplestore natif Mulgara, AllegroGraph, BigOWLIM,
4store, Neo4j
BDR paramétrée Virtuoso, ARC, Oracle 11g, Sesame,
3store
Column store Cstore, Heart, BigData, Cloudera
78
Outils
● Exploiter les données en RDF
Langages Outils
Java (triples) Jena, Sesame, Trialox SCB, RDF2Go
Java (ORM) Topaz, RDFReactor, So(m)mer, Elmo,
jenabean
PHP RAP, ARC (généraliste)
C Redland
Python RDFlib
Ruby ActiveRDF
Scala Scardf
79
Laisse béton (Renaud)
● Publication des données en RDF
80
81
Le web sémantique, ça marche !
● Les géants mondiaux de l’Internet
avancent rapidement
● De plus en plus d’organisations l’adoptent
pour des usages ciblés
● « Que puis-je faire pour le web sémantique ? »
● « Qu’est ce que le web sémantique
peut faire pour moi ? »
82
Le Web Sémantique, des atouts uniques
● Disposer d’une quantité colossale de
jeux de données
● Accéder aux données de façon standardisée
donc automatisable
● Les agréger pour servir tous types d’usages
nouveaux
83
Le Web Sémantique, aller plus loin ?
Un livre dirigé par
Fabien Gandon,
INRIA / W3C
EAN13 : 9782100572946
84
Le web sémantique : à vous de jouer !
85
pcol@antidot.net @PierreCol
jhomo@antidot.net
@Julien_Hom
o
@AntidotNet
www.antidot.net

Contenu connexe

Tendances

Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked dataVincentBroute
 
Les bases pour utiliser SPARQL
Les bases pour utiliser SPARQLLes bases pour utiliser SPARQL
Les bases pour utiliser SPARQLBorderCloud
 
Introduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensIntroduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensFICEL Hemza
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantiqueGreenIvory
 
Introduction au Web sémantique
Introduction au Web sémantiqueIntroduction au Web sémantique
Introduction au Web sémantiqueSpyderwoman
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataBorderCloud
 
Le Web de données et les bibliothèques
Le Web de données et les bibliothèquesLe Web de données et les bibliothèques
Le Web de données et les bibliothèquesGautier Poupeau
 
Exposé sur le web sémantique de Laurent Salvadori (20-1-12)
Exposé sur le web sémantique de Laurent Salvadori (20-1-12)Exposé sur le web sémantique de Laurent Salvadori (20-1-12)
Exposé sur le web sémantique de Laurent Salvadori (20-1-12)Eth BestSniper
 
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Gautier Poupeau
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesGautier Poupeau
 
Enrichissement de Données RDF Integrées à la Volée - EGC2019 - AWD Workshop
Enrichissement de Données RDF Integrées à la Volée - EGC2019 - AWD WorkshopEnrichissement de Données RDF Integrées à la Volée - EGC2019 - AWD Workshop
Enrichissement de Données RDF Integrées à la Volée - EGC2019 - AWD WorkshopBenjamin MOREAU
 
Échange et interopérabilité des données structurées sur le Web
Échange et interopérabilité des données structurées sur le WebÉchange et interopérabilité des données structurées sur le Web
Échange et interopérabilité des données structurées sur le WebAntidot
 
Web sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le WebWeb sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le WebAntidot
 
Les ontologies et les graphes RDF
Les ontologies et les graphes RDFLes ontologies et les graphes RDF
Les ontologies et les graphes RDFRadhouani Mejdi
 
Données de la culture et culture des données
Données de la culture et culture des donnéesDonnées de la culture et culture des données
Données de la culture et culture des donnéesFabien Gandon
 
Information numérique : défintions et enjeux
Information numérique : défintions et enjeuxInformation numérique : défintions et enjeux
Information numérique : défintions et enjeuxGautier Poupeau
 
Modèles de données et langages de description ouverts 2021-2022 - 1
Modèles de données et langages de description ouverts   2021-2022 - 1Modèles de données et langages de description ouverts   2021-2022 - 1
Modèles de données et langages de description ouverts 2021-2022 - 1François-Xavier Boffy
 
Web Sémantique — Linked Data
Web Sémantique — Linked DataWeb Sémantique — Linked Data
Web Sémantique — Linked DataKlee Group
 

Tendances (20)

Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked data
 
Les bases pour utiliser SPARQL
Les bases pour utiliser SPARQLLes bases pour utiliser SPARQL
Les bases pour utiliser SPARQL
 
Introduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensIntroduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sens
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 
Introduction au Web sémantique
Introduction au Web sémantiqueIntroduction au Web sémantique
Introduction au Web sémantique
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec Wikidata
 
RDF en quelques slides
RDF en quelques slidesRDF en quelques slides
RDF en quelques slides
 
Web sémantique
Web sémantique Web sémantique
Web sémantique
 
Le Web de données et les bibliothèques
Le Web de données et les bibliothèquesLe Web de données et les bibliothèques
Le Web de données et les bibliothèques
 
Exposé sur le web sémantique de Laurent Salvadori (20-1-12)
Exposé sur le web sémantique de Laurent Salvadori (20-1-12)Exposé sur le web sémantique de Laurent Salvadori (20-1-12)
Exposé sur le web sémantique de Laurent Salvadori (20-1-12)
 
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
 
Enrichissement de Données RDF Integrées à la Volée - EGC2019 - AWD Workshop
Enrichissement de Données RDF Integrées à la Volée - EGC2019 - AWD WorkshopEnrichissement de Données RDF Integrées à la Volée - EGC2019 - AWD Workshop
Enrichissement de Données RDF Integrées à la Volée - EGC2019 - AWD Workshop
 
Échange et interopérabilité des données structurées sur le Web
Échange et interopérabilité des données structurées sur le WebÉchange et interopérabilité des données structurées sur le Web
Échange et interopérabilité des données structurées sur le Web
 
Web sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le WebWeb sémantique et référentiels : l'avenir de l'image sur le Web
Web sémantique et référentiels : l'avenir de l'image sur le Web
 
Les ontologies et les graphes RDF
Les ontologies et les graphes RDFLes ontologies et les graphes RDF
Les ontologies et les graphes RDF
 
Données de la culture et culture des données
Données de la culture et culture des donnéesDonnées de la culture et culture des données
Données de la culture et culture des données
 
Information numérique : défintions et enjeux
Information numérique : défintions et enjeuxInformation numérique : défintions et enjeux
Information numérique : défintions et enjeux
 
Modèles de données et langages de description ouverts 2021-2022 - 1
Modèles de données et langages de description ouverts   2021-2022 - 1Modèles de données et langages de description ouverts   2021-2022 - 1
Modèles de données et langages de description ouverts 2021-2022 - 1
 
Web Sémantique — Linked Data
Web Sémantique — Linked DataWeb Sémantique — Linked Data
Web Sémantique — Linked Data
 

En vedette

Cours Tectonique des plaques (2013-2014)
Cours Tectonique des plaques (2013-2014)Cours Tectonique des plaques (2013-2014)
Cours Tectonique des plaques (2013-2014)Nicolas Coltice
 
03 00 l'internet des objets - introduction
03 00 l'internet des objets - introduction03 00 l'internet des objets - introduction
03 00 l'internet des objets - introductionAlexandre Rivaux
 
Les Ontologies dans les Systèmes d’Information
Les Ontologies dans les Systèmes d’InformationLes Ontologies dans les Systèmes d’Information
Les Ontologies dans les Systèmes d’Informationcatherine roussey
 
interopérabilité en informatique
interopérabilité en informatiqueinteropérabilité en informatique
interopérabilité en informatiquecatherine roussey
 
Internet des Objets
Internet des ObjetsInternet des Objets
Internet des ObjetsIEEE 802
 
Coopération des Systèmes d'Informations basée sur les Ontologies
Coopération des Systèmes d'Informations basée sur les OntologiesCoopération des Systèmes d'Informations basée sur les Ontologies
Coopération des Systèmes d'Informations basée sur les OntologiesRaji Ghawi
 
L'internet des objets (The Internet of Things)
L'internet des objets (The Internet of Things)L'internet des objets (The Internet of Things)
L'internet des objets (The Internet of Things)Raphaël Duperret
 
Internet des objets
Internet des objetsInternet des objets
Internet des objetsFree Lance
 
Internet des objets (IoT)
Internet des objets (IoT)Internet des objets (IoT)
Internet des objets (IoT)bruno-dambrun
 
Cours #9 L'Internet des objets
Cours #9 L'Internet des objetsCours #9 L'Internet des objets
Cours #9 L'Internet des objetsAlexandre Moussier
 
11774267 cours-de-strategie-2009-chapitre-1-diagnostic-externe
11774267 cours-de-strategie-2009-chapitre-1-diagnostic-externe11774267 cours-de-strategie-2009-chapitre-1-diagnostic-externe
11774267 cours-de-strategie-2009-chapitre-1-diagnostic-externeYehiya Toure
 

En vedette (17)

Cours Tectonique des plaques (2013-2014)
Cours Tectonique des plaques (2013-2014)Cours Tectonique des plaques (2013-2014)
Cours Tectonique des plaques (2013-2014)
 
Chapitre 2 strat
Chapitre 2 stratChapitre 2 strat
Chapitre 2 strat
 
Modèle wilson
Modèle wilsonModèle wilson
Modèle wilson
 
Les couches
Les couchesLes couches
Les couches
 
Macroeco
MacroecoMacroeco
Macroeco
 
L'internet des objets
L'internet des objetsL'internet des objets
L'internet des objets
 
03 00 l'internet des objets - introduction
03 00 l'internet des objets - introduction03 00 l'internet des objets - introduction
03 00 l'internet des objets - introduction
 
Les Ontologies dans les Systèmes d’Information
Les Ontologies dans les Systèmes d’InformationLes Ontologies dans les Systèmes d’Information
Les Ontologies dans les Systèmes d’Information
 
interopérabilité en informatique
interopérabilité en informatiqueinteropérabilité en informatique
interopérabilité en informatique
 
Internet des Objets
Internet des ObjetsInternet des Objets
Internet des Objets
 
Coopération des Systèmes d'Informations basée sur les Ontologies
Coopération des Systèmes d'Informations basée sur les OntologiesCoopération des Systèmes d'Informations basée sur les Ontologies
Coopération des Systèmes d'Informations basée sur les Ontologies
 
L'internet des objets (The Internet of Things)
L'internet des objets (The Internet of Things)L'internet des objets (The Internet of Things)
L'internet des objets (The Internet of Things)
 
Internet des Objets
Internet des ObjetsInternet des Objets
Internet des Objets
 
Internet des objets
Internet des objetsInternet des objets
Internet des objets
 
Internet des objets (IoT)
Internet des objets (IoT)Internet des objets (IoT)
Internet des objets (IoT)
 
Cours #9 L'Internet des objets
Cours #9 L'Internet des objetsCours #9 L'Internet des objets
Cours #9 L'Internet des objets
 
11774267 cours-de-strategie-2009-chapitre-1-diagnostic-externe
11774267 cours-de-strategie-2009-chapitre-1-diagnostic-externe11774267 cours-de-strategie-2009-chapitre-1-diagnostic-externe
11774267 cours-de-strategie-2009-chapitre-1-diagnostic-externe
 

Similaire à Web sémantique et Web de données, et si on passait à la pratique ?

Du Big Data à la Smart Information : comment valoriser les actifs information...
Du Big Data à la Smart Information : comment valoriser les actifs information...Du Big Data à la Smart Information : comment valoriser les actifs information...
Du Big Data à la Smart Information : comment valoriser les actifs information...Antidot
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
Système d'archivage électronique mutualisé
Système d'archivage électronique mutualiséSystème d'archivage électronique mutualisé
Système d'archivage électronique mutualiséLogilab
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesSemWebPro
 
Devoxx: Tribulation d'un développeur sur le Cloud
Devoxx: Tribulation d'un développeur sur le CloudDevoxx: Tribulation d'un développeur sur le Cloud
Devoxx: Tribulation d'un développeur sur le CloudTugdual Grall
 
Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02ABES
 
États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantiqueIvan Herman
 
MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...
MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...
MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...Frederic Descamps
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprisesAymen ZAAFOURI
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
Arte utilise Acquia Cloud pour héberger ses plateformes web
Arte utilise Acquia Cloud pour héberger ses plateformes webArte utilise Acquia Cloud pour héberger ses plateformes web
Arte utilise Acquia Cloud pour héberger ses plateformes webAcquia
 
Introduction aux web components
Introduction aux web componentsIntroduction aux web components
Introduction aux web componentsFrancois ANDRE
 
Méthodologie de mise en place d'observatoires virtuels via les métadonnées
Méthodologie de mise en place d'observatoires virtuels via les métadonnéesMéthodologie de mise en place d'observatoires virtuels via les métadonnées
Méthodologie de mise en place d'observatoires virtuels via les métadonnéesDesconnets Jean-Christophe
 
L avenir du web au prisme de la resource
L avenir du web au prisme de la resourceL avenir du web au prisme de la resource
L avenir du web au prisme de la resourceFabien Gandon
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataLudovic Piot
 
Mise en place d’un moteur de recherche et de recommandation de documents text...
Mise en place d’un moteur de recherche et de recommandation de documents text...Mise en place d’un moteur de recherche et de recommandation de documents text...
Mise en place d’un moteur de recherche et de recommandation de documents text...AbdeslamAMRANE3
 

Similaire à Web sémantique et Web de données, et si on passait à la pratique ? (20)

Du Big Data à la Smart Information : comment valoriser les actifs information...
Du Big Data à la Smart Information : comment valoriser les actifs information...Du Big Data à la Smart Information : comment valoriser les actifs information...
Du Big Data à la Smart Information : comment valoriser les actifs information...
 
Sem info system_2012
Sem info system_2012Sem info system_2012
Sem info system_2012
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Système d'archivage électronique mutualisé
Système d'archivage électronique mutualiséSystème d'archivage électronique mutualisé
Système d'archivage électronique mutualisé
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériences
 
Devoxx: Tribulation d'un développeur sur le Cloud
Devoxx: Tribulation d'un développeur sur le CloudDevoxx: Tribulation d'un développeur sur le Cloud
Devoxx: Tribulation d'un développeur sur le Cloud
 
Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02
 
États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantique
 
MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...
MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...
MySQL Innovation & Cloud Day - Document Store avec MySQL HeatWave Database Se...
 
La "Data science" au service des entreprises
La "Data science" au service des entreprisesLa "Data science" au service des entreprises
La "Data science" au service des entreprises
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Base de données
Base de donnéesBase de données
Base de données
 
Arte utilise Acquia Cloud pour héberger ses plateformes web
Arte utilise Acquia Cloud pour héberger ses plateformes webArte utilise Acquia Cloud pour héberger ses plateformes web
Arte utilise Acquia Cloud pour héberger ses plateformes web
 
Introduction aux web components
Introduction aux web componentsIntroduction aux web components
Introduction aux web components
 
Méthodologie de mise en place d'observatoires virtuels via les métadonnées
Méthodologie de mise en place d'observatoires virtuels via les métadonnéesMéthodologie de mise en place d'observatoires virtuels via les métadonnées
Méthodologie de mise en place d'observatoires virtuels via les métadonnées
 
L avenir du web au prisme de la resource
L avenir du web au prisme de la resourceL avenir du web au prisme de la resource
L avenir du web au prisme de la resource
 
Oxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigDataOxalide MorningTech #1 - BigData
Oxalide MorningTech #1 - BigData
 
Mise en place d’un moteur de recherche et de recommandation de documents text...
Mise en place d’un moteur de recherche et de recommandation de documents text...Mise en place d’un moteur de recherche et de recommandation de documents text...
Mise en place d’un moteur de recherche et de recommandation de documents text...
 

Plus de Antidot

Comment l'intelligence artificielle améliore la recherche documentaire
Comment l'intelligence artificielle améliore la recherche documentaireComment l'intelligence artificielle améliore la recherche documentaire
Comment l'intelligence artificielle améliore la recherche documentaireAntidot
 
Antidot Content Classifier - Valorisez vos contenus
Antidot Content Classifier - Valorisez vos contenusAntidot Content Classifier - Valorisez vos contenus
Antidot Content Classifier - Valorisez vos contenusAntidot
 
Comment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteComment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteAntidot
 
Antidot Content Classifier
Antidot Content ClassifierAntidot Content Classifier
Antidot Content ClassifierAntidot
 
Cas client CAIJ
Cas client CAIJCas client CAIJ
Cas client CAIJAntidot
 
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"Antidot
 
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Antidot
 
Flyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FRFlyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FRAntidot
 
WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper Antidot
 
Do’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerceDo’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerceAntidot
 
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...Antidot
 
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...Antidot
 
En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?Antidot
 
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...Antidot
 
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...Antidot
 
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...Antidot
 
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...Antidot
 
Comment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertesComment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertesAntidot
 
Wikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux donnéesWikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux donnéesAntidot
 
Comment mettre en relation 
données et documents pour produire 
une informati...
Comment mettre en relation 
données et documents pour produire 
une informati...Comment mettre en relation 
données et documents pour produire 
une informati...
Comment mettre en relation 
données et documents pour produire 
une informati...Antidot
 

Plus de Antidot (20)

Comment l'intelligence artificielle améliore la recherche documentaire
Comment l'intelligence artificielle améliore la recherche documentaireComment l'intelligence artificielle améliore la recherche documentaire
Comment l'intelligence artificielle améliore la recherche documentaire
 
Antidot Content Classifier - Valorisez vos contenus
Antidot Content Classifier - Valorisez vos contenusAntidot Content Classifier - Valorisez vos contenus
Antidot Content Classifier - Valorisez vos contenus
 
Comment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texteComment l’intelligence artificielle réinvente la fouille de texte
Comment l’intelligence artificielle réinvente la fouille de texte
 
Antidot Content Classifier
Antidot Content ClassifierAntidot Content Classifier
Antidot Content Classifier
 
Cas client CAIJ
Cas client CAIJCas client CAIJ
Cas client CAIJ
 
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
Compte rendu de la matinée "E-commerce B2B : les leviers de croissance"
 
Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...Machine learning, deep learning et search : à quand ces innovations dans nos ...
Machine learning, deep learning et search : à quand ces innovations dans nos ...
 
Flyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FRFlyer AFS@Store 2015 FR
Flyer AFS@Store 2015 FR
 
WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper WISS 2015 - Machine Learning lecture by Ludovic Samper
WISS 2015 - Machine Learning lecture by Ludovic Samper
 
Do’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerceDo’s and don'ts : la recherche interne aux sites de ecommerce
Do’s and don'ts : la recherche interne aux sites de ecommerce
 
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
Boostez votre taux de conversion et augmentez vos ventes grâce au searchandis...
 
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
Synergie entre intranet collaboratif et recherche sémantique : le cas des hôp...
 
En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?En 2015, quelles sont les bonnes pratiques du searchandising ?
En 2015, quelles sont les bonnes pratiques du searchandising ?
 
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
Comment tirer profit des données publiques ouvertes dans un mashup web grâce ...
 
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
Vous utilisez Prestashop ? Changez votre moteur de recherche interne pour boo...
 
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
Boostez votre taux de conversion en tirant profit des bonnes pratiques du sea...
 
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
Améliorer le searchandising d’un site spécialisé : retour d'expérience de Cui...
 
Comment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertesComment sélectionner, qualifier puis exploiter les données ouvertes
Comment sélectionner, qualifier puis exploiter les données ouvertes
 
Wikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux donnéesWikidata : quand Wikipédia s'intéresse aux données
Wikidata : quand Wikipédia s'intéresse aux données
 
Comment mettre en relation 
données et documents pour produire 
une informati...
Comment mettre en relation 
données et documents pour produire 
une informati...Comment mettre en relation 
données et documents pour produire 
une informati...
Comment mettre en relation 
données et documents pour produire 
une informati...
 

Web sémantique et Web de données, et si on passait à la pratique ?

Notes de l'éditeur

  1. Avant de nous présenter, une petite question : qui était né en 1978 ? Peu de monde, pas même mon collègue Julien… et cela confirme ce que laisse penser ma barbe blanche : je suis devenu « un vieux con de l’informatique » :-) En 1978 à 15 ans je codais mon premier programme en assembleur Z80 ensuite après une école d’ingénieurs en informatique et intelligence artificielle j’ai vu passer plusieurs vagues technologiques et pas des moindres : j’ai d’abord co-écrit un logiciel serveur pour le web 0.0, celui qu’on consultait sur un petit cube marron avec un écran N&B de 24 lignes par 40 caractères  Puis j’ai vu les débuts du web il y a un peu plus de 20 ans et travaillé pour un des principaux hébergeurs français, Jet Multimédia, depuis vendu à SFR. J’ai ensuite accompagné le lancement de quelques startup lyonnaises avant de rejoindre l’éditeur de logiciels lyonnais Antidot. Je tiens aussi un blog chez ZDNet France où je parle d’in frastructures Internet. Si j’ai tenu à parler devant vous du web sémantique, c’est parce qu’à mes yeux ce n’est pas juste une technologie de plus, mais quelque chose de vraiment important non seulement pour l’informatique mais pour toute l’humanité. Avec moi Julien Homo, qui lui est justement l’inverse d’un vieux con et va résumer son parcours  (Présentation de Julien)
  2. Nous allons commencer par voir concrètement ce que peut faire le web sémantique.
  3. Car le web sémantique est l’objet de nombreuses conférences et travaux de recherche depuis des années, mais c’est aussi déjà une réalité industrielle, notamment pour Google… avec le Knowledge Graph
  4. Pour construire son "graphe de connnaissances", Google agrège des contenus structurés, issus notamment de Freebase (rachetée en 2010) du World Fact Book de la CIA et de plus en plus de Wikidata, la « base de données structurée » de Wikipedia.
  5. Le Knowledge Graph, ce sont ces informations factuelles situées dans une boîte à droite des résultats de recherche… ici pour Antidot où nous travaillons…
  6. Ici pour l’Ecole Normale Supérieure, voisine de nos bureaux et qui nous a fourni quelques stagiaires de très bon niveau…
  7. … remarquez que Google y partage une information qu’il détient sur les « recherches associées », ici avec d’autres institutions universitaires et grandes écoles.
  8. Le Knowledge Graph permet à Google de répondre directement à des questions, ici sur la population de la France, avec une synthèse d’informations fiables et pertinentes.
  9. Le Knowledge Graph propose également de l’information culturelle, ici avec une frise donnant accès à une info synthétique sur les peintres impressionnistes…
  10. … et là sur le chanteur Renaud…
  11. … pour lequel sont donnés des éléments biographiques et aussi un accès direct à ses principales œuvres, même si à mes yeux il manque la chanson « Hexagone », victime de la censure giscardienne quand j’étais lycéen et codeur débutant, et que je vous invite à écouter ;-)
  12. En cliquant sur l’album « Laisse béton », on a une information très complète sur son contenu et une frise de tous les autres albums, toujours sans quitter Google ! Je n’ai pas choisi Renaud au hasard, vous le verrez plus tard avec la présentation de Julien…
  13. Ce que commence à faire Google avec le Knowledge Graph répond exactement à la vision de Tim Berners-Lee, qui a théorisé le web de données il y a près de 15 ans (une base de données globale pour faboriser la coopération hommes-machines)...
  14. … avant de lancer le mouvement du Linked Open Data en 2009, dans une conférence TED demeurée célèbre et que je vous invite à revoir, en version sous-titrée.
  15. Quand on voit le siège social d’Oracle, principal éditeur de logiciels de bases de données, on comprend pourquoi la vieille logique des silos de données est si prégnante, encore aujourd’hui…
  16. Ca c’est le web des années 90, avec des hyperliens reliant des documents texte, sans vraie structure
  17. Ca c’est le web des années 2000, avec des API permettant d’accéder aux données, chaque fournissseur de données apportant son API spécifique
  18. Et ça c’est le web sémantique, qui a pris son essor dans les années 2010 : les liens se font au niveau le plus granulaire, entre les données elles-mêmes ! Comment est-ce possible ?
  19. Grâce à des standards définis par le W3C, le World Wide Web Consortium.
  20. Le web fonctionne selon un modèle en couches : HTTP standardise le transport des données…
  21. XML simplifie l’échange direct des données, sans transcodage ou conversion de format…
  22. Reste à mettre derrière les données une sémantique, indépendante de la langue que parlent les internautes… c’est le rôle des ontologies
  23. Voici les standard du web sémantique, tels qu’ils sont validés par le W3C…
  24. Ils forment un socle éprouvé pour des applications industrielles et pérennes… même s’il reste encore un peu de travail, notamment dans les couches supérieures, et particulièrement en ce qui concerne la « confiance » que l’on peut accorder aux données disponibles sur le web.
  25. Voici le « Linked Open Data Cloud », le « nuage des données ouvertes liées » accessibles directement et librement sur le web. Je laisse maintenant la parole à Julien, jeune Jedi du web sémantique, qui va vous montrer en quoi c’est un sabre laser aussi puissant que précis !
  26. Les Champs libres sont un équipement de la communauté d'agglomération Rennes Métropole, regroupant deux entités de Rennes Métropole, Bibliothèque de Rennes Métropole et le musée de Bretagne, ainsi que deux associations, l'Espace des sciences et son planétarium
  27. Le site portail Les Champs Libres, www.leschampslibres.fr, a pour rôle de présenter au visiteur les activités et les ressources proposées par les différents établissements qui constituent l’équipement culturel (Bibliothèque de Rennes Métropole, musée de Bretagne, l’Espace des sciences) et de l’orienter vers leurs sites respectifs.
  28. Pourtant, selon ses animateurs, il « ne remplit que très imparfaitement son rôle de portail » à ce jour. Aussi, dans la perspective du renouvellement du marché de maintenance des sites des Champs Libres, de la Bibliothèque de Rennes Métropole et du musée de Bretagne en juillet 2015, ceux-ci « souhaitent repenser les usages et les rôles souhaités pour ces différents sites ».
  29. Moteurs de recherche cloisonnées, agenda commun mais visuellement distinct selon les services, silos de données clairement indépendants les uns des autres
  30. Périmètre très générique et finalement assez vague : basé sur l’idée que le Web Sémantique et le Web de Données va apporter la solution. Mais quand est-il en réalité ? Pourquoi utiliser ces technologies ? Qu’est ce que signifie « les règles du web de données et du web sémantique »? Dans ce type d’étude, les clients ont peu ou pas de connaissances avancées sur le sujet. Notre rôle dans ce type d’étude est d’accompagner le client pour identifier ses besoins et ses usages pour lever rapidement les ambiguïtés et pour éviter les désillusions.
  31. Les Champs Libres nous ont contacté dans le cadre d’une étude pour mettre à la disposition de ses utilisateurs un « centre de ressources digitales », produites par les sites web et les services de chacun des établissements sous forme de « fenêtres », de timeline, de cartes (géolocalisation) et d’un moteur de recherche fédéré.
  32. Mettre à la disposition de ses utilisateurs un « centre de ressources digitales », produites par les sites web et les services de chacun des établissements sous forme de « fenêtres », de timeline, de cartes (géolocalisation) et d’un moteur de recherche fédéré.
  33. Avant de démarrer : la méthodologie est indispensable.
  34. Définissons le périmètre d’étude… Dans un premier temps : identifier les données disponibles et de leurs modes de production actuels Les services rentrant dans le cadre de l’étude sont les suivants : L’agenda culturel collectif des établissements des Champs Libres. Le catalogue de la bibliothèque de Rennes Métropole. Les Tablettes rennaises : la Bibliothèque a lancé un programme de numérisation de ses collections anciennes les plus précieuses, et dès à présent, plus de 4 500 textes et images vous attendent sur ce portail dédié. Les collections du musée de Bretagne. Les ressources de l’Espace des sciences. Les fiches pédagogiques. Les vidéos postées sur Vimeo et les podcasts postés sur Soundcloud.
  35. Analyse des données : analyse des sources Captation des données de la source Format des données XML = un langage informatique de balisage générique et extensible
  36. Analyse des données : types de données disponibles
  37. Analyse des données : Types de données disponibles 250 000 textes imprimés 2 500 ouvrages numériques 20 000 films et 2000 vidéos à la demande 20 000 enregistrements musicaux et 10 000 partitions Zoom sur … les enregistrements musicaux !
  38. Analyse des données : structure es enregistrements musicaux
  39. Analyse des données : structure es enregistrements musicaux
  40. Analyse des données : structure des enregistrements musicaux Première approche de la notion de format pivot Etude du modèle On voit le modèle HADOC émerger
  41. Analyse des données : structure des enregistrements musicaux Première approche de la notion d’enrichissement
  42. Analyse des données Pour se rendre compte plus en détails prenons un exemple du catalogue ! Source de données : Bibliothèque de Rennes Types de données : Enregistrements musicaux Exemple du catalogue : Laisse béton (Renaud)
  43. Analyse des données Interface pauvre…
  44. Analyse des données …et des données que l’on retrouve directement en XML UNIMARC = format d’échange de données bibliographiques officiel
  45. Fin de l’analyse et conclusion : on peut peut-être réussir à agréger les données et à les enrichir. Pour s’en rendre compte, il faut mettre les mains dedans. Ne pas perdre de vue qu’il s’agit ici d’un exemple. Ce travail d’analyse doit être effectuée sur chaque source et sur chaque type.
  46. On va donc essayer de le faire concrètement. Il y a 3 étapes : normaliser les données enrichir les données exposer les données
  47. Normalisation des données : - Construction des URIs - Définition des formats pivots
  48. Constuire les URIs
  49. Définition du format pivot 2 types génériques, 2 modèles HADOC = Harmonisation de la production des Données Culturelles
  50. HADOC = Harmonisation de la production des Données Culturelles
  51. Maintenant que les données sont décloisonnées, comment les relier au LOD ? Et surtout, pourquoi ?
  52. Il faut d’abord regarder les données avec une vague idée de l’usage. Nous voulions travailler sur les musées, mais sans idées préconçues car on SUBIT les données. Ce qui conduit forcément à une déconvenues car on peut facilement fantasmer sur les usages si on fait une totale abstraction des données. Rencontre entre les deux, pas de réflexions plus poussées. Bien sûr, le Linked Data est plein de promesses, mais la réalité des données impose d’éviter tout aveuglement ou idéalisme
  53. Dans un premier temps : identifier un macro usage Le chjoix de scope fonctionnel est tès large, mais on a un élément important : se focaliser sur qqch, ne pas se disperser. Le jeu de données principal ne peut pas être de la stat par exemple, il nous faut un jeu décrivant des objets informationnels. On se concentre – en général - sur un ou deux jeux de données qui amèneront, de par les liens qu’ils renferment, vers d’autres sources de données : on parle alors des qualités agrégeantes des jeux en question.
  54. Données disponibles dans Les Champs Libres
  55. Quels jeux de données complémentaires ? Etape très importante. Ils viennent enrichir le jeu principal. Critères de sélection : interrogations sur l’état des données Autorité de la source ? Qualité intrinsèque ? (format, structuration, complétude/cohérence, ex : dbpedia n’a pas de complétude/cohérence) Fraîcheur / fréquence de mise à jour ? (Dbpedia = tous les ans, alors que Wikidata est en temps réel) « Connectabilité » à d’autres données ? Et en particulier au jeu de données principal En fonction de prod ou proto cela peut influer En fonction du contexte client (médias ? Institution culturelle ? ) : les critères vont être pondérés différemment. Freebase (racheté par Google, CQFD) et l’écosystème Wikipedia représentent peut-être les meilleures exemples de qualités agrégeantes.
  56. Wikidata = Hub de données du LOD
  57. HADOC = Harmonisation de la production des Données Culturelles
  58. HADOC = Harmonisation de la production des Données Culturelles
  59. HADOC = Harmonisation de la production des Données Culturelles
  60. HADOC = Harmonisation de la production des Données Culturelles
  61. HADOC = Harmonisation de la production des Données Culturelles
  62. HADOC = Harmonisation de la production des Données Culturelles
  63. HADOC = Harmonisation de la production des Données Culturelles
  64. HADOC = Harmonisation de la production des Données Culturelles
  65. HADOC = Harmonisation de la production des Données Culturelles
  66. HADOC = Harmonisation de la production des Données Culturelles
  67. HADOC = Harmonisation de la production des Données Culturelles
  68. HADOC = Harmonisation de la production des Données Culturelles
  69. HADOC = Harmonisation de la production des Données Culturelles
  70. HADOC = Harmonisation de la production des Données Culturelles
  71. HADOC = Harmonisation de la production des Données Culturelles
  72. HADOC = Harmonisation de la production des Données Culturelles
  73. Publication en RDF = Interopérabilité Structure générique Identification des ressources Mise en relation Mise à disposition : SPARQL Endpoint Dump RDF Négociation de contenu Autres (intégrations web…)
  74. La question n’est pas tant « Que puis-je faire pour le web sémantique ? » mais bien « Qu’est ce que le web sémantique peut faire pour moi ? » , et il peut faire beaucoup !
  75. Le Web Sémantique est le seul moyen d’utiliser des quantités incroyables de données, dans tous les domaines, pour les agréger automatiquement au gré des besoins et des nouveaux usages du web !
  76. Pour aller plus loin nous vous recommandons cet excellent bouquin en français
  77. Mettez en œuvre le web sémantique, ça marche et ça améliore le web pour tout le monde !