1. Référen'els
et
interoperabilité
(1)
Antoine
Isaac
Europeana
&
Vrije
Universiteit
Amsterdam
Séminaire
INRIA
IST
Carnac,
2
Octobre
2012
2. Aver'ssement
!
• Le
web
de
données
ne
matérialise
pas
la
no'on
de
“référen'el”
Tout
comme
le
web
“tradi'onel”:
techniquement
rien
ne
dis'ngue
un
“site
de
référence”
d’un
autre
• Mais
il
y
a
quand
même
des
ressources
qui
peuvent
prétendre
au
statut
de
référence
pour
une
ou
plusieurs
communautés
3. Catégories
de
référen'els
possibles
Inspira'on:
rapports
du
groupe
d’incuba'on
du
W3C
“Bibliothèques
et
web
de
données”
• Élements
de
métadonnées
• Vocabulaires
de
valeurs
• Jeux
de
données
hVp://www.w3.org/2005/Incubator/lld/XGR-‐lld-‐vocabdataset/
4. Des
catégories
pas
forcément
disjointes?
“Ontologie”
a
pu
être
u'lisé
pour
divers
“référen'els
séman'ques”
[Smith 2001]
5. Des
catégories
pas
forcément
disjointes?
• Conceptuellement,
elles
expriment
“de
la
séman'que”
• Parfois
un
artefact
appar'ent
à
deux
catégories
• Mais
d’un
point
de
vue
technique
(seman'c
web
stack)
il
y
a
une
vraie
différence
6. Eléments
de
métadonnées
A.k.a
ontologies
OWL,
metadata
element
sets
• Fournissent
les
classes
et
propriétés
qui
servent
de
support
à
l’expression
des
descrip'ons
• Types
d’ontologies
selon
la
portée
ontologie
noyau
vs.
ontologie
de
domaine
vs.
ontologie
d’applica'on
7. “Briques
de
construc'on”
des
graphes
RDF
myMES:suject
myVV:Amsterdam
http://example.org/article1
myMES:Article
rdf:type
9. Dans
l’inventaire
Library
Linked
Data
http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/#Metadata_Element_Sets
10. Dublin
Core
DCMI Metadata Terms
• A l’origine, 15 éléments généraux pour tous types de
documents
dc:title, dc:creator, dc:coverage, dc:subject
• Spécialisés en éléments plus spécifiques, avec par ex.
domaines et ranges
dcterms:spatial, dcterms:creator
dcterms:Agent
• Utilisable pour relier des resources, pas seulement des
descriptions “à plat”
• Effort communautaire
dublincore.org/
11. FOAF
Friend
of
a
Friend
• Décrire
des
personnes
–
réseaux
sociaux,
pages
personnelles…
• Porté
par
deux
personnes,
retour
d’expérience
des
u'lisateurs
• Approche
très
pragma'que
www.foaf-‐project.org/
12. OAI-‐ORE
Open
Archives
Ini'a've
-
Object
Reuse
and
Exchange
• Décrire des aggrégations de resources qui composent des
ressources numériques complexes
• Eléments clefs
– Aggrégation
– Ressource aggrégée
– “Proxy”
– “Resource map”
• Communauté OAI
cf. OAI-PMH
www.openarchives.org/ore/
13. Bibo
• Bibliographic
Ontology
• Ontologie
pour
les
ressources
bibliographiques
– Categorisa'on
de
documents
(AcademicAr'cle)
– Structure
des
documents
(chapter…)
– Cita'on
(citedBy)
• Créée
par
deux
personnes
bibliontology.com/
14. FRBR
• Modèle
conceptuel
développé
par
l’IFLA
• Il
existe
plusieurs
ontologies
(FRBRer,
FRBRcore,
FRBRoo)
15. Schema.org
• Représenter
dans
les
pages
web
des
informa'ons
de
base
sur
les
objets
qu’elle
représentent
Videos,
Volcans,
Sex
shops…
• Moteurs
de
recherche
(Bing,
Google,
Yahoo!)
• Approche
top-‐down,
mais
très
pragma'que
16. Et
bien
d’autres…
• CIDOC-‐CRM
• W3C
Media
Ontology
• Music
Ontology
…
17. Où
les
trouver
?
Rapports
• Library
Linked
Data
Moteurs
de
recherche
• Sindice
• Watson
Répertoires
• Linked
Open
Vocabularies
• Open
Metadata
Registry
www.w3.org/2005/Incubator/lld/XGR-‐lld-‐vocabdataset/
sindice.com
watson.kmi.open.ac.uk/
lov.okfn.org/dataset/lov/
metadataregistry.org
21. Europeana
Service
qui
donne
accès
aux
objets
numérisés
du
domaine
patrimonial
européen
• Portail
liés
aux
portails
des
ins'tu'ons
et
projets
partenaires
• Services
de
données:
– API
– Linked
Data
europeana.eu
pro.europeana.eu/api
data.europeana.eu
22. Mn;kl;k;klj;lkj;lkj;jh;lkj;klj;klj;
klj;klj
Qui
envoie
des
données
à
Europeana?
APEnet
Archives
Libraries
Museums
National Aggregators
Regional Aggregators
Horizontal Aggregators Vertical Aggregators
The European Library
ATHENA
European Film Gateway
Film archives
ELocal
GLAMs
Flanders museums
Culture Grid
GLAMs
“Dark” Aggregators
GLAMs
23. Qu’est-‐ce
qui
est
envoyé
à
Europeana?
1. Thumbnails
2. Metadata
3. Links to digital objects online
24. Résoudre
un
problème
d’intégra'on
de
données
Construire
un
service
d’accès
u'lisant
les
métadonnées
est
difficile
• Chaque
domaine
u'lise
ses
propres
modèles
et
formats
LIDO,
EAD…
• Solu'on
actuelle:
les
partenaires
fournissent
des
métadonnées
au
format
Europeana
Seman'c
Elements
(ESE)
– Plus
grand
commun
dénominateur
pour
les
métadonnées
– Données
“à
plat”
– Ne
respectent
pas
le
“one-‐to-‐one
principle”
– Perte
de
la
richesse
des
metadonnées
orginelles
25. Plus
de
“séman'que”
pour
l’accès
aux
objets
Construire
une
“couche
séman'que”
au-‐dessus
des
objets
26. Services
assistés
par
la
séman'que
• Exploita'on
de
rela'ons
comme:
“localisé
à”,
“a
pour
sujet”,
“concept
plus
générique”,
correspondences
entre
langues,
domaines
– Reformula'on
de
requêtes
– Regroupement
et
personnalisa'on
de
résultats
• Échanger
des
données
plus
riches
• Les
données
plus
riches
sont
souvent
déjà
là
!
– Thesauri,
classifica'ons…
– Éléments
de
données
complexes
(EAD,
MARC)
– Dans
le
domaine
patrimonial
ou
ailleurs
27. EDM
design
requirements
Données plus fines
• Distinction entre l’"objet fourni (tableau, livre…) et ses
représentations numériques
• Distinction entre l’objet et ses descriptions
• Permettre plusieurs descriptions pour un objet
Contenant éventuellement des assertions contradictoires
• Représentation d’objets complexes
• Ressources contextuelles, y compris concepts
28. EDM
design
requirements
Données plus interopérables
• Permettre la co-existence de plusieurs grains de données
Autoriser
des
profils
spécifiques
à
un
domaine
• Réutiliser et étendre des éléments de standards existants
29. EDM
:
les
bases
• OAI ORE pour l’organisation des metadonnées et des
représentations numériques des objets
• Dublin Core pour une partie des metadonnées
descriptives
• CIDOC-CRM comme inspiration pour la structure des
événements et des relations entre objets
• SKOS et d’autres référentiels pour les ressources
contextuelles
32. Aggrega'ons
OAI
ORE
32
aggrega'on
digital
representa'on
object
provenance
metadata
organiser la “contribution” d’un partenaire
33. Proxys
OAI
ORE
33
proxy
object
metadata
Représenter une “vue” sur les objets
34. Plusieurs
fournisseurs
=
plusieurs
aggrega'ons
34
DMF
proxy
Louvre
Proxy
Louvre
'tle
DMF
'tle
The
“real”
pain'ng
35. Europeana
comme
un
“simple”
fournisseur
de
metadonnées
normalisées
et
enrichies
35
Europeana
aggrega'on
“enriched”
metadata
36. En'tés
contextuelles
Récupér et exploiter des données “orginelles” ou enrichies réclame plus
que des descriptions centrées objet
Evénements, lieux, agents, concepts
38. EDM
est
un
effort
collabora'f
• Europeana v1.0 WP3: 60 participants
• Développement semi-ouvert, “en aquarium”
• Transversal
– Experts des bibliothèques, archives et musées
– Avec EDM, Europeana devient plus compatible avec les besoins de
communautés spécifiques. Il est aussi possible de créer des “profils”
d’EDM pour ces communautés
39. Bénéfices
de
l’approche
web
de
données
pour
la
concep'on
d’EDM
• Vocabulaires
à
réu'liser
• Approche
flexible
de
la
concep'on
et
la
ré-‐u'lisa'on
de
standards
• Ontologies
spécifiques
co-‐existant
avec
les
ontologies
standards
• Pas
de
contrainte
sur
le
grain
du
modèle
de
données
• Facilité
technique
de
la
connec'on
et
la
publica'on
des
données
• Vision
qui
appuie
les
stratégies
Open
Data
41. EDM
41
Elément
de
(méta)données
Concept
d’un
vocabulaire
d’autorité
42. SKOS
Simple
Knowledge
Organiza@on
System
Portée:
knowledge
organiza'on
systems
(KOS)
comme
les
thesauri,
systèmes
de
classifica'on,
autorités
ma'ères…
SKOS
permet
de
représenter
et
d’échanger
les
KOS
en
RDF
de
manière
simple
43. Représenter
la
séman'que
La
manière
formalisée:
OWL
Seman'c
Web
ontology
language
Ontologies
avec
une
séman'que
exploitable
par
la
machine
• Mère est
une
classe
• C’est
l’intersec'on
des
classes
Femme et
Parent!
• Parent est
la
classe
des
ressources
de
type
Personne qui
sont
liés
à
au
moins
une
autre
ressource
de
type
Personne en
u'lisant
la
propriété
estParentDe
…
44. SKOS
n’est
pas
pour
des
ontologies
formelles
• Il
est
possible
de
produire
des
ontologies
à
par'r
de
KOS,
mais
les
KOS
– Se
concentrent
souvent
sur
les
données
lexicales
Enfant U'liséPour
Progéniture!
– Ont
une
séman'que
plus
“molle”
Parent TermeLié
Enfant!
– Sont
parfois
gigantesques
et
donc
difficiles
à
“neVoyer”
• Et
pourtant
en
tant
que
tels
les
KOS
peuvent
être
u'les
à
de
nombreuses
applica'ons!
Recherche
séman'que,
annota'on…
45. Séman'que
et
interopérabilité
SKOS
–
les
bases
Pour
sa'sfaire
la
majorité
des
besoins
• Concepts
• Propriétés
lexicales
• Liens
séman'ques
• Notes
46. Un
thesaurus
fic'f
Animals
cats
UF (used for) domestic cats
RT (related term) wildcats
BT (broader term) animals
SN (scope note) used only for domestic cats
domestic cats
USE cats
wildcats
50. Un
graphe
SKOS
animals
cats
UF domestic cats
RT wildcats
BT animals
SN used only for domestic cats
domestic cats
USE cats
wildcats
51. Changement
par
rapport
aux
approches
tradi'onelles
• Approche
orientée
concepts
• Plus
de
fron'ère
“dure”
entre
vocabulaires
Extension
&
alignement
sont
facilités
à
travers
différents
contextes
• L’u'lisa'on
de
plusieurs
vocabulaires
dans
une
applica'on
est
facilitée
• Transi'on
vers
une
interoperabilité
plus
grande
avec
tous
types
de
jeux
de
données
52. Extensions
de
SKOS
• MADS/RDF
Autorités-‐ma'ères
(LCSH)
France –– Histoire –– XXeme siècle
• ISO25964
(en
cours)
Thesaurus
«
classiques
»
– Coumpound
equivalences:
Charbonnages USE Charbon + Mines
– Arrays:
Chaises
<Chaises par forme>
Fauteuils
…
53. SKOS
vs.
OWL
–
rappel
• Il
y
a
vraiment
une
différence
entre
les
deux
approches
Les
ressources
SKOS
(les
concepts)
sont
des
instances
de
classes
au
sens
de
OWL
(instances
de
skos:Concept).
Elles-‐mêmes
ne
sont
pas
des
classes
par
défaut.
• Des
ontologies
comme
SKOS
existent
pour
porter
et
exploiter
sur
le
web
de
données
des
données
séman'ques
“tradi'onelles”
sans
avoir
à
la
conver'r
(et
les
neVoyer)
en
ontologies
OWL
54. Vocabulaires
de
valeurs
Terminologie
du
groupe
LLD
Regroupe
vocabulaires
contrôlés,
vocabulaires
d’autorités,
mais
aussi
poten'ellement
des
folksonomies…
SKOS
est
une
ontologie
qui
permet
de
publier
un
semble
de
ressources
d’autorité,
référen'els
provenant
des
bibliothèques
ou
bien
d’autres
domaines
58. DBpedia,
Freebase?
• Le
web
de
données
efface
la
fon'ère
technique
entre
vocabulaire
d’autorité
et
«
simples
»
jeux
de
données
• Des
ressources
SKOS
peuvent
être
liées
à
des
ressources
différentes
Par
ex.
une
personne
et
le
«
concept
d’une
personne
»
dans
un
fichier
d’autorité
• Un
jeu
de
données
peut
devenir
un
référen'el
59. Linked
Library
Data
hVp://www.w3.org/2005/Incubator/lld/XGR-‐lld-‐vocabdataset/
60. Jeux
de
données
• Dans
le
domaine
bibliographique
– Catalogues
de
bibliothèques
na'onales
– Services
documentaires
spécialisés
61.
62. Jeux
de
données
a
réu'liser
et
lier
• Ressources
d’intérêt
bibliographique
sur
le
Data
Hub
thedatahub.org/group/lld
• Linked
Open
Data
Cloud
sur
le
Data
Hub
thedatahub.org/group/lod
• Moteurs
de
recherche
sur
le
Linked
Data
Cloud
Sindice.com
63. Merci
!
Remerciements
par'culiers:
• Equipe
et
partenaires
Europeana
• Membres
du
groupe
Library
Linked
Data
aisaac@few.vu.nl