Application Web sémantique sur
des manuscrits médiévaux, des incunables, leurs
anciens possesseurs et textes divers
Ret...
http://biblissima-condorcet.fr 2013 - 2016/17 (2019)
L’observatoire “Biblissima” (2013-2016/2017)
“La création d’un système de gestion et
d’analyse d’informations historiques ...
1/ Fusionner les
données
2/ Publier des liens
vers des notices des
partenaires
3/ Afficher les sources
des données
• Aligner
• Enrichir
• Partager les données
Pourquoi RDF ?
Nos données ...
• Manuscrits
– Parties / Groupes
– Feuillets / Pages
• Éditions
– Incunables
• Enluminures
• Marques de pr...
… structurées en 20+ bases de données
• MySQL
• Access
• EAD
• TEI-P5
• MARC XML + TEI-P5
Dataflow Biblissima
• Livraison de données au format EAD, MARC XML, TEI-P5 ou XML-Biblissima par
les partenaires Biblissim...
XML Pivot Biblissima
● Il est inspiré de l’EAD, de la TEI-P5 (chapter Manuscript Description) et de
FRBRoo
● Format d’expo...
XML « Tite Live : Histoire romaine »
Notice Europeana Regia « BnF, MSS Français 263 » en XML Pivot Biblissima
Défis
• absence d’identifiants ( => création des @id_bbma)
• peu d’utilisation de données d’autorité dans les bases parten...
Publication via cinq points d’entrée ...
personnes &
collectivités
œuvres
manuscrits & incunables
collections historiques
...
… et 14 vues différentes (+ RDF)
Établissement de conservation (ecrm:E40_Legal_Body, foaf:Organization)
Collectivité (ecrm...
Page « Établissement de conservation »
(Orléans. Médiathèque)
Page « Personne »
(Christine de Pisan)
Page « Lieu » (Pays, Villes, Abbayes)
(France ; Abbaye Saint-Denis)
Page « Œuvre textuelle »
(Titus Livius : Ab urbe condita)
Page « Texte » et page « Manuscrit »
(Titus Livius : Ab urbe condita ; BnF, Français 263)
Lien vers une page « Édition »
(Titus Livius : Ab urbe condita)
Page « Collection historique » et page « Collectivité »
(Abbaye Saint-Germain-des-Prés)
Pages « Personne » et « Inventaire »
(Duc de La Vallière)
Page « Inventaire numérisé »
Intention
• améliorer la visibilité des données des partenaires du projet
• relier entre elles les données des partenaires...
Équipes scientifiques et techniques BnF, IRHT, EPHE, CESR, CIHAM, ENC, CRAHAM, MRSH
Pool Biblissima (conception et réalisa...
Prochain SlideShare
Chargement dans…5
×

Application Web sémantique sur des manuscrits médiévaux - Retour d'expérience

396 vues

Publié le

Intervention de Stefanie Gehrke lors de la conférence SemWeb.Pro 2016 (Paris, 21 novembre 2016)

Publié dans : Technologie
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
396
Sur SlideShare
0
Issues des intégrations
0
Intégrations
104
Actions
Partages
0
Téléchargements
6
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Application Web sémantique sur des manuscrits médiévaux - Retour d'expérience

  1. 1. Application Web sémantique sur des manuscrits médiévaux, des incunables, leurs anciens possesseurs et textes divers Retour d’expérience Stefanie GEHRKE metadata@biblissima-condorcet.fr Équipex Biblissima http://biblissima-condorcet.fr SemWeb.Pro 2016 - Paris, 21 novembre 2016
  2. 2. http://biblissima-condorcet.fr 2013 - 2016/17 (2019)
  3. 3. L’observatoire “Biblissima” (2013-2016/2017) “La création d’un système de gestion et d’analyse d’informations historiques permettra de comprendre les circonstances et les modalités de la diffusion des connaissances, à travers l’étude de la transmission des livres et de leurs mouvements dans les bibliothèques au Moyen Âge et à la période Moderne.” Cluster de données “ (…) décrivant et analysant la transmission des livres, des textes, des images” (Source : http://www.biblissima-condorcet.fr/fr/projet/volet-1-observatoire-biblissima)
  4. 4. 1/ Fusionner les données 2/ Publier des liens vers des notices des partenaires 3/ Afficher les sources des données
  5. 5. • Aligner • Enrichir • Partager les données Pourquoi RDF ?
  6. 6. Nos données ... • Manuscrits – Parties / Groupes – Feuillets / Pages • Éditions – Incunables • Enluminures • Marques de provenance • Textes Liste de ressources : http://biblissima-condorcet.fr/fr/ressources/ressources-biblissima (notices et images) • Inventaires • Catalogues de vente • Collections historiques • Lieux • Dates • Personnes • Collectivités – Bibliothèques
  7. 7. … structurées en 20+ bases de données • MySQL • Access • EAD • TEI-P5 • MARC XML + TEI-P5
  8. 8. Dataflow Biblissima • Livraison de données au format EAD, MARC XML, TEI-P5 ou XML-Biblissima par les partenaires Biblissima • Extraction des entités nommées (CSV via XSLT) • Identification des individus (mise en relation avec des notices d’autorité de la BnF, DNB, LoC, VIAF et des notices de GeoNames, TGN et Wikidata) • Intégration des URLs de notices d’autorité dans le XML (<Concept>) (CSV 2 XML via XSLT) • Livraison de données au prestataire • Contrôle de qualité, import et fusion des données (CubicWeb) • Publication (pages Web, export, SPARQL-endpoint) (Documentation : http://doc.biblissima-condorcet.fr/contribuer-a-biblissima)
  9. 9. XML Pivot Biblissima ● Il est inspiré de l’EAD, de la TEI-P5 (chapter Manuscript Description) et de FRBRoo ● Format d’export et format d’import ● Pour l’instant une DTD très légère ● <RecordList><Database/></RecordList> ● Book | Identifier | Repository | Manifestation | GroupBooks | HasPart | Place | Participant | Work | Text | Language | Collection | HasFeature | Concept | Name ● @role | @id | @id_bbma | @canonical | @state (Documentation : http://doc.biblissima-condorcet.fr/contribuer-a-biblissima)
  10. 10. XML « Tite Live : Histoire romaine » Notice Europeana Regia « BnF, MSS Français 263 » en XML Pivot Biblissima
  11. 11. Défis • absence d’identifiants ( => création des @id_bbma) • peu d’utilisation de données d’autorité dans les bases partenaires ( => beaucoup d’alignements à faire) • absence de notices d’autorité pour beaucoup d’anciens possesseurs et de collections historiques, ainsi que pour des œuvres ( => création des @id_bbma, Name_Bbma et Title_Bbma) • travail sur les cotes ( => ./Identifier/@canonical) • ‘manuscrits attestés’ sans ‘titre’ => à améliorer • un établissement de conservation peut aussi avoir le rôle “ancien possesseur” • une unité textuelle d’un manuscrit peut être un inventaire (ex.: Biblioteca apostolica vaticana, Barb. Lat. 3180) • correction des données • granularité des données à afficher sur nos pages => L’import de données continue pendant l’année 2017.
  12. 12. Publication via cinq points d’entrée ... personnes & collectivités œuvres manuscrits & incunables collections historiques lieux
  13. 13. … et 14 vues différentes (+ RDF) Établissement de conservation (ecrm:E40_Legal_Body, foaf:Organization) Collectivité (ecrm:E40_Legal_Body, foaf:Organization) Personne (ecrm:E21_Person, foaf:Person) Lieu(efrbroo:E53_Place; geo:SpatialThing) Manuscrit (efrbroo:F4_Manifestation_Singleton; ecrm:E84_Information_Carrier) + Regroupment (en cours) + Unité codicologique (Feuillet) (?) (plutôt marque de provenance / enluminure ?) Incunable(efrbroo:F5_Item, rda:Item) Édition (efrbroo:F24_Publication_Expression) Œuvre (efrbroo:F15_Complex_Work) Texte (First Expression + Trad.) (efrbroo:F22_Self-Contained_Expression, ‘First Expression’ : rda:Work) Inventaire (ecrm:E31_Document) Collection historique (ecrm:E78_Collection) Marque de Provenance / Enluminure(ecrm:E25_Man-Made_Feature) (en cours)
  14. 14. Page « Établissement de conservation » (Orléans. Médiathèque)
  15. 15. Page « Personne » (Christine de Pisan)
  16. 16. Page « Lieu » (Pays, Villes, Abbayes) (France ; Abbaye Saint-Denis)
  17. 17. Page « Œuvre textuelle » (Titus Livius : Ab urbe condita)
  18. 18. Page « Texte » et page « Manuscrit » (Titus Livius : Ab urbe condita ; BnF, Français 263)
  19. 19. Lien vers une page « Édition » (Titus Livius : Ab urbe condita)
  20. 20. Page « Collection historique » et page « Collectivité » (Abbaye Saint-Germain-des-Prés)
  21. 21. Pages « Personne » et « Inventaire » (Duc de La Vallière)
  22. 22. Page « Inventaire numérisé »
  23. 23. Intention • améliorer la visibilité des données des partenaires du projet • relier entre elles les données des partenaires • combiner des données de bibliothèques et des données d’établissements de recherche • proposer des URLs pérennes (pour des collections historiques et des traductions notamment) • alignement avec des notices d’autorité • pour le grand public et des experts dans le domaine • et aussi pour des machines
  24. 24. Équipes scientifiques et techniques BnF, IRHT, EPHE, CESR, CIHAM, ENC, CRAHAM, MRSH Pool Biblissima (conception et réalisation de l’application) Doudou Dieye, IRHT (soutien technique) Matthieu Bonicel, coordinateur de l’observatoire Biblissima, BnF Pierre-Yves Buard et Cyril Masset (conseillers techniques, Biblissima) Anne-Marie Turcan-Verkerk, responsable scientifique et technique de Biblissima Logilab (réalisation technique) Merci beaucoup de votre attention ! Stefanie Gehrke, Coordinatrice données - Prototype – Publication Web sémantique Biblissima

×