Structurer, relier et diffuser des 
données avec les technologies du 
web sémantique :
l'exemple d'un référentiel sur les ...
Cour de la mosquée Touloun Vue de la cour de la mosquée Teyloun
Mosquée El Tulun Le Caire, cour d’une mosquée
Touloun : 13 résultats
Tulun : 24 résultats
Teyloun : 4 résultats
Touloun : 21 résultats
Tulun : 7 résultats
Teyloun : aucun résultat
Numéro 
d’inventaire
nom en arabe
translittérations 
normalisées
forme 
courante en 
français
typologie
localisation
comma...
Liste de monuments
variantes des noms des 
monuments et sources
Typologie architecturale
variantes des types de 
monuments...
Le modèle RDF (Resource Description Framework)
langage de base du web sémantique pour la description des ressources
 Les ...
Les principaux éléments de SKOS
SKOS (Simple Knowledge Organization System) est une recommandation du W3C pour la
descript...
Les liens avec des données de référence
 les ressources de la BnF : http://data.bnf.fr/
 LC Linked Data Service : http:/...
http://cairogazetteer.fr/invisu/r
esource/ark:/67717/f44b12a67
28e158676be6fddebf07f62
‫طولون‬ ‫بن‬ ‫أحمد‬ ‫جامع‬
skos:pre...
http://cairogazetteer.fr/invisu/
resource/ark:/67717/f44b12a
6728e158676be6fddebf07f62
La mosquée d'Ahmad ibn Tulun,
gouve...
Les outils de gestion et de
diffusion
Opentheso
http://opentheso.frantiq.fr/opentheso/
IQvoc
http://iqvoc.net/
Ginco + Gin...
De la source à la diffusion
Open
Refine
GINCO
GINCO
DIFF
.xml.xls .skos
Openrefine
.xls → .xml
( Concept et terme )
skos:Concept skos:prefLabel@fr
monuments/5 mosquée ibn Tulun
<concepts>
<ident...
Openrefine
.xls → .xml
( Autres données )
skos:broader
skos:related
skos:relatedMatch
skos:exactMatch
skos:closeMatch
skos...
Openrefine
( Templating )
Ginco
( Interface )
Ginco
( Export .xml )
<skos:Concept rdf:about="http://cairogazetteer.fr/invisu/resource/ark:/67717/f44b12a6728e158676be6fd...
Ginco-Diff
( Outil de diffusion )
Skos Play
( Outil de diffusion )
Pour conclure
référentiel
outils
données
Utilisation de SKOS
La modélisation des données entraîne leur
simplification. Les...
Les problèmes de doublons
 Doublons entre les termes préférentiels
distinction par la translittération
‫مسجد‬ mosquée (ma...
Structurer, relier et diffuser des données avec les technologies du web sémantique: l'exemple d'un référentiel sur les mon...
Prochain SlideShare
Chargement dans…5
×

Structurer, relier et diffuser des données avec les technologies du web sémantique: l'exemple d'un référentiel sur les monuments du Caire

2 204 vues

Publié le

Structurer, relier et diffuser des données avec les technologies du web sémantique: l'exemple d'un référentiel sur les monuments du Caire

Publié dans : Formation
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
2 204
Sur SlideShare
0
Issues des intégrations
0
Intégrations
435
Actions
Partages
0
Téléchargements
25
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Structurer, relier et diffuser des données avec les technologies du web sémantique: l'exemple d'un référentiel sur les monuments du Caire

  1. 1. Structurer, relier et diffuser des  données avec les technologies du  web sémantique : l'exemple d'un référentiel sur les monuments du Caire Lundis numériques de l’INHA ‐ 11 mai 2015 Pierre MOUNIER (InVisu USR 3103 CNRS/INHA) Emmanuelle PERRIN (InVisu USR 3103 CNRS/INHA)
  2. 2. Cour de la mosquée Touloun Vue de la cour de la mosquée Teyloun Mosquée El Tulun Le Caire, cour d’une mosquée
  3. 3. Touloun : 13 résultats Tulun : 24 résultats Teyloun : 4 résultats
  4. 4. Touloun : 21 résultats Tulun : 7 résultats Teyloun : aucun résultat
  5. 5. Numéro  d’inventaire nom en arabe translittérations  normalisées forme  courante en  français typologie localisation commanditaire variantes liens L’organisation et la  structuration des données
  6. 6. Liste de monuments variantes des noms des  monuments et sources Typologie architecturale variantes des types de  monuments et sources Relation générique‐spécifique ou classe‐instance L’organisation et la  structuration des données
  7. 7. Le modèle RDF (Resource Description Framework) langage de base du web sémantique pour la description des ressources  Les URI (Uniform Resource Identifier) : des ressources identifiées par des URI http://data.bnf.fr/ark:/12148/cb15908819z  La distinction entre le concept et le terme mosquée " ‫جامع‬ "  " mosquée"  " mosque"  a pour appellation en arabe a pour appellation en français a pour appellation en anglais concept terme
  8. 8. Les principaux éléments de SKOS SKOS (Simple Knowledge Organization System) est une recommandation du W3C pour la description des thésaurus et des vocabulaires contrôlés.  Les labels :  skos: prefLabel : équivalent du terme vedette ou du descripteur dans un thésaurus skos:altLabel : équivalent des termes rejetés ou non descripteurs (employé pour)  skos:hiddenLabel : peut être utilisé pour les pluriels ou les mots mal orthographiés les étiquettes de langue : la langue des termes est indiquée par le code ISO des langues L’extension SKOS‐XL  (SKOS eXtension for Labels)  permet d’apporter des informations supplémentaires sur les  libellés  Les relations sémantiques :  skos:broader : relation générique skos:narrower : relation spécifique skos:related : relation associative  Les définitions, notes d’applications et notes éditoriales : skos:definition skos:scopeNote skos:editorialNote  Les alignements :  skos:exactMatch : équivalence exacte skos:closeMatch : équivalence inexacte skos:broadMatch : relation générique skos:narrowMatch : relation spécifique skos:relatedMatch : relation associative
  9. 9. Les liens avec des données de référence  les ressources de la BnF : http://data.bnf.fr/  LC Linked Data Service : http://id.loc.gov/  The Getty Vocabularies : http://vocab.getty.edu/  Le Fichier d'autorité international virtuel : https://viaf.org/  International Standard Name Identifier : http://www.isni.org/  La base de données géographiques GeoNames : http://www.geonames.org/  Ddpedia : http://wiki.dbpedia.org/ Listes de jeux de données http://datahub.io/fr/dataset http://www.w3.org/2005/Incubator/lld/XGR‐lld‐vocabdataset‐20111025/ http://www.w3.org/2001/sw/wiki/SKOS/Datasets
  10. 10. http://cairogazetteer.fr/invisu/r esource/ark:/67717/f44b12a67 28e158676be6fddebf07f62 ‫طولون‬ ‫بن‬ ‫أحمد‬ ‫جامع‬ skos:prefLabel@ar " mosquée ibn Tulun"  skos:prefLabel@fr " jāmi‘ Aḥmad ibn  Ṭūlūn"  skos:prefLabel@ALA http://cairogazetteer.fr/invisu/reso urce/ark:/67717/d35049688efd41a 944d269a058233958 skos: altLabel@MUL " mosquée d'Ahmed  ibn Touloun"  skos:altLabel@MUL source  bibliographique dc:source http://cairogazetteer.fr/invisu/r esource/ark:/67717/02bd9dfea ea4fabffd04571e19688842 source  bibliographique " mosque of Ahmad ibn Tulun "  dc:source skos:altLabel@MUL skos: altLabel@MUL La modélisation SKOS :  Les informations terminologiques" ğāmiʿ Aḥmad ibn Ṭūlūn"  skos:prefLabel@ISO skos:Concept
  11. 11. http://cairogazetteer.fr/invisu/ resource/ark:/67717/f44b12a 6728e158676be6fddebf07f62 La mosquée d'Ahmad ibn Tulun, gouverneur de l'Égypte de 868 à 884, édifiée de 876 à 879 (AH 263‐265 ), se trouve dans le quartier d'al‐Sayyida Zaynab (anciennement Qal'at al‐kabsh). Numéro d'inventaire : 220. Coordonnées géographiques : N 30°01′43″ E 31°14′59″ skos:skopeNote@fr http://www.geonames.org/359 824/as‐sayyidah‐zaynab.html skos:relatedMatch http://cairogazetteer.fr/invisu/r esource/ark:/67717/c79e436c0 a1d37528b2ecbd26b928723 skos: broader skos:prefLabel@ar skos:prefLabel@fr skos:prefLabel@en " ǧāmiʿ "  " jāmi‘  "  " gami' "  skos:prefLabel@ISO skos:prefLabel@ALA skos:altLabel@MUL skos:relatedMatch http://isni.org/isni/000000011 6926412 http://www.geonames.org/ 7922805 skos: exactMatch http://data.bnf.fr/ark:/ 12148/cb11953036m http://id.loc.gov/author ities/subjects/sh850874 70 " ‫جامع‬ "  " mosquée "  " mosque "  skos: exactMatch fondateur quartier typologie localisation " gâma’ "  http://vocab.getty.edu/ aat/300007544 La modélisation SKOS : les relations génériques et associatives skos:altLabel@MUL
  12. 12. Les outils de gestion et de diffusion Opentheso http://opentheso.frantiq.fr/opentheso/ IQvoc http://iqvoc.net/ Ginco + Ginco-diff https://github.com/culturecommunication/ginco https://github.com/culturecommunication/ginco-diff
  13. 13. De la source à la diffusion Open Refine GINCO GINCO DIFF .xml.xls .skos
  14. 14. Openrefine .xls → .xml ( Concept et terme ) skos:Concept skos:prefLabel@fr monuments/5 mosquée ibn Tulun <concepts> <identifier>http://cairogazetteer.fr/invisu/resource/ark:/67717/f 44b12a6728e158676be6fddebf07f62</identifier> <created>2015-02-05T14:36:54+01:00</created> <modified>2015-02-05T14:36:54+01:00</modified> <status>1</status> <topConcept>false</topConcept> </concepts> <terms> <identifier>http://cairogazetteer.fr/invisu/resource/ark:/67717/5 d03278a4b5a1bbb1a7ea2c9ca984d6d</identifier> <lexicalValue>mosquée ibn Tulunmosquée ibn Tulun</lexicalValue> <created>2015-02-05T14:36:54+01:00</created> <modified>2015-02-05T14:36:54+01:00</modified> <prefered>true</prefered> <hidden>false</hidden> <status>1</status> <concept> <identifier>http://cairogazetteer.fr/invisu/resource/ark:/67717/f 44b12a6728e158676be6fddebf07f62</identifier> <created>2015-02-19T12:02:07.207+01:00</created> <date>2015-02-19T12:02:07.209+01:00</date> <status>1</status> <topConcept>true</topConcept> </concept> <language> <id>ar</id> <part1>ar</part1> <principalLanguage>true</principalLanguage> <refname>Arabe</refname> <topLanguage>true</topLanguage> </language> </terms> Templating
  15. 15. Openrefine .xls → .xml ( Autres données ) skos:broader skos:related skos:relatedMatch skos:exactMatch skos:closeMatch skos:scopeNote <hierarchicalRelationship/> <associativeRelationship/> <alignments/> <conceptNotes/> Templating Templating Templating
  16. 16. Openrefine ( Templating )
  17. 17. Ginco ( Interface )
  18. 18. Ginco ( Export .xml ) <skos:Concept rdf:about="http://cairogazetteer.fr/invisu/resource/ark:/67717/f44b12a6728e158676be6fddebf07f62 "> <skos:prefLabel xml:lang="fr-FR">mosquée ibn Tulun</skos:prefLabel> <skos:altLabel xml:lang="ALA">jāmi‘ Ibn Ṭūlūn</skos:altLabel> <xl:altLabel> <iso-thes:SimpleNonPreferredTerm rdf:about="http://cairogazetteer.fr/invisu/resource/ark:/67717/2ee341cba2ac22be94433ea04f70db5d"/> </xl:altLabel> <skos:broader> <skos:Concept rdf:about="http://cairogazetteer.fr/invisu/resource/ark:/67717/c79e436c0a1d37528b2ecbd26b928723"/> </skos:broader> <skos:relatedMatch rdf:resource="http://vocab.getty.edu/aat/300021806"/> </skos:Concept> <iso-thes:SimpleNonPreferredTerm rdf:about="http://cairogazetteer.fr/invisu/resource/ark:/67717/2ee341cba2ac22be94433ea04f70db5d"> <dc:source>http://www.loc.gov/catdir/cpso/romanization/arabic.pdf</dc:source> <iso-thes:status>1</iso-thes:status> <xl:literalForm xml:lang="ALA">jāmi‘ Ibn Ṭūlūn</xl:literalForm> <dct:modified>2015-04-08T12:13:25+02:00</dct:modified> <dct:created>2015-02-05T14:36:54+01:00</dct:created> </iso-thes:SimpleNonPreferredTerm>
  19. 19. Ginco-Diff ( Outil de diffusion )
  20. 20. Skos Play ( Outil de diffusion )
  21. 21. Pour conclure référentiel outils données Utilisation de SKOS La modélisation des données entraîne leur simplification. Les notes d’application contiennent des données non typées (coordonnées géographiques, date de construction). Les outils de diffusion ne sont pas au niveau des outils de gestion et occasionnent une perte d’information. Utilisation de Ginco Un outil fonctionnel, institutionnel et maintenu. Il a pu répondre à nos principales demandes :  extension SKOS‐XL pour indiquer les sources des variantes  paramétrage de langues virtuelles pour la translittération
  22. 22. Les problèmes de doublons  Doublons entre les termes préférentiels distinction par la translittération ‫مسجد‬ mosquée (masǧid) mosque (masjid) ‫جامع‬ mosquée (ǧāmiʿ) mosque (jāmi‘) ‫فندق‬ caravansérail (funduq) caravanserai (funduq) ‫وكالة‬ caravansérail (wikālaẗ) caravanserai (wikālah)  Doublon entre le type et le nom d’un monument distinction par la mention (architecture) pour les types de monuments Nilomètre (architecture) / Nilomètre  Doublon entre les noms des monuments distinction par la mention du quartier  caravansérail Qaytbay (al‐Gamaliyya) caravansérail Qaytbay (al‐Darb al‐ahmar)  Doublon entre les variantes distinction par le numéro du monument Okâla du sultan Kâïtbâï [75] Okâla du sultan Kâïtbâï [9]

×