Anforderungen an Thesauri im Semantic Web

J
Joachim NeubertZBW, Hamburg
ZBW is member of the Leibniz Association
Anforderungen an Thesauri
im Semantic Web
Joachim Neubert
ZBW – Leibniz Informationszentrum Wirtschaft, Kiel/Hamburg
Deutsche Nationalbibliothek
Leipzig 1.3.2016
Frankfurt a.M. 2.3.2016
Agenda
1. Thesauri im Semantic Web
2. Standards: SKOS, ISO 25964
3. STW als Beispiel eines SKOS-Thesaurus
4. Mappings / Crosskonkordanzen
5. Nutzung von SKOS-Thesauri und Mappings in Applikationen
6. Tools für SKOS-Thesauri
7. Anwendung auf die GND
8. Anforderungen / Wunschliste
Page 2
Page 3
Page 4
Page 5
Boom von Thesauri im Semantic Web
• bartoc.org verzeichnet rund 100 Thesauri im SKOS-Format
• Getty: große Umbauten und Öffnung mit Blickrichtung auf Linked
Open Data (AAT, Geographical Names, ULAN Artists)
• Reorganisation und tendenzielle Verschmelzung der
agrarwissenschaftlichen Vokabulare (Agrovoc, NAL Thesaurus, z.T.
CAB Thesaurus) im GACS (Global Agricultural Concept Scheme)
• Neuentwicklungen wie Getty CONA (Cultural Objects Name
Authority)
• Wikidata als „universelle Normdatei“ und Verknüpfungspunkt
multilingualer Informationsressourcen
Page 6
2. Thesaurus-Standards
Page 7
Page 8
Strukturierung durch SKOS
• Simple Knowledge Organization System
• entwickelt mit dem Ziel, Schlagwortsysteme, Thesauri,
Klassifikationen u.ä. für das Semantic Web nutzbar zu machen
• beruht auf eindeutigen Identifiern (URIs) für Begriffe
skos:Concept – „unit of thought“
• erlaubt zu Begriffen Vorzugsbezeichnungen und alternative
Bezeichnungen in beliebig vielen Sprachen
• unterstützt die üblichen Thesaurusrelationen (broader, narrower,
related)
Page 9
Strukturierung durch SKOS (2)
• ermöglicht Dokumentation (definition, scopeNote, historyNote, etc.)
• ergänzende Gliederung durch skos:Collections
• zusätzliche Strukturierungsmöglichkeiten durch SKOS-XL
(z.B. Beziehung zwischen einer Bezeichnung und deren Abkürzung)
• unterstützt Mapping verschiedener Thesauri (exactMatch,
closeMatch, broadMatch, narrowMatch, relatedMatch)
• erweiterbar durch anwendungsspezifische Klassen und
Eigenschaften
• seit August 2009 Recommendation des W3C
http://www.w3.org/2004/02/skos/
Thesaurus Norm ISO 25964
ISO 25964 – löste 2011 (Teil 1) und 2013 (Teil 2) die technisch völlig
überholten DIN und ISO Normen aus den 1970er und 1980er Jahren ab
• umfangreiche Begriffsdefinitionen
Concept (Begriff) und Term (Bezeichnung) wie in SKOS
• relationales Datenmodell zur Repräsentation von Thesauri
• zusätzliche Strukturierung mit Hilfe von ThesaurusArrays und
ConceptGroups (Modellierung von Microthesauri)
• Interoperabilität zwischen Vokabularen
Page 10
Verbindung SKOS - ISO 25964
ISO-THES RDF-Vokabular als Ergänzung zu SKOS und SKOS-XL
http://www.niso.org/schemas/iso25964/correspondencesSKOS/
• Korrespondenz SKOS-ISO25964, zugleich SKOS Erweiterung
• Empfehlung, wie zwischen generischen, partitiven und instanziellen
Unterbegriffen unterschieden werden kann
• Empfehlung, wie compound equivalences (Benutze Kombination) in
SKOS definiert werden
• Empfehlungen für Thesaurus Arrays, Mikrothesauri u.ä.
Page 11
Einsatzbereich von SKOS
• primär zur Datenpublikation im Web und zum Datenaustausch
• ermöglicht Interoperabilität und erleichtert Mappings zwischen
Vokabularen
• zielt nicht darauf, den gesamten Reichtum von Thesauri abdecken
• soll nicht automatisches Schlussfolgern (Reasoning) ermöglichen
• in der Regel nicht verwendet für die interne Darstellung von Thesauri
in Pflegesystemen
• Workflows und Stati (z.B. Kandidat, freigegeben, …)
• Changelog (wer hat was wann geändert, und vor allem warum?)
• Indexierung ist für SKOS generell „out of scope“
Page 12
3. STW als Beispiel eines SKOS-Thesaurus
Page 13
Page 14
Standard-Thesaurus Wirtschaft
• wurde in den 1990er Jahren unter öffentlicher Förderung von vier
wirtschaftswissenschaftlichen Institutionen entwickelt
• wird heute von der ZBW herausgegeben und weiterentwickelt
• umfasst ca. 6.000 Deskriptoren mit über 14.000 alternativen
Bezeichnungen in Deutsch und Englisch
• bildet feinmaschiges Begriffsnetz
• mehr als 13.000 Ober-/Unterbegriffsbeziehungen und 6.500
verwandte Begriffe
• zusätzlicher Zugang über Thesaurussystematik
mit rund 500 Stellen
Page 15
Suche mit Thesaurusunterstützung
Page 16
STW Begriffsnetz
Page 17
Systematischer Zugriff
Page 18
Daten-Einbettung in Webseiten mit RDFa
<descriptor/19090-6> # http://zbw.eu/stw/descriptor/19090-6
skos:inScheme <../stw> ; # http://zbw.eu/stw
a skos:Concept, zbwext:Descriptor ;
skos:prefLabel "Environmental reporting"@en, "Umweltbericht"@de ;
skos:altLabel "Corporate environmental accounting"@en, ... ;
skos:broader <descriptor/12394-0>, <thsys/70383>, <thsys/71033> ;
skos:related <descriptor/18183-4>, ... ;
skos:exactMatch <http://aims.fao.org/aos/agrovoc/c_9000050>,
<http://d-nb.info/gnd/4202417-1>,
<http://lod.gesis.org/thesoz/concept/10039271> ;
skos:closeMatch
<http://dbpedia.org/resource/Environmental_economics> ;
skos:relatedMatch <http://d-nb.info/gnd/4299127-4> ;
gbv:gvkppn "091395976"^^xsd:string .
Page 19
4. Mappings / Crosskonkordanzen
Page 20
Interoperabilität
• Datenbestände werden zunehmend über Portale, Discovery-
Systeme oder letztlich das Web miteinander verknüpft
• für die übergreifende Nutzung von Beständen mit gemischter
Erschließung sind Mappings notwendig
• strukturelle Ähnlichkeit von SKOS-Vokabularen erlaubt Einsatz von
standardisierten Tools
• Standardisierung der Mapping-Properties (skos:exactMatch etc.)
macht den Austausch und die Nutzung von einmal erzeugten
Mappings in unterschiedlichen Systemen einfach
Page 21
Erstellen von Mappings
• Optimal wäre eine Kombination und enge Integration von
automatischen und intellektuellen Mappingschritten
• Nutzung von Synonymen, Mehrsprachigkeit, Stringähnlichkeit,
linguistische Funktionen (z.B. Plural/Singular)
• Unterstützung bei intellektueller Kontrolle von Vorschlägen und beim
vollständig intellektuellen Erstellen einzelner Mappings
• klassische Ontology-Matching-Tools sind wenig geeignet für
umfangreiche Vokabulare
• Linked-Data-Tools häufig auf Optimierung eines vollautomatischen
Matchings ausgerichtet
• Offenes Problem: Pflege bei Änderungen der beteiligten Vokabulare
Page 22
Tools zum Erstellen von Mappings
• Silk (http://silkframework.org/) – generelles LOD-Mapping
• Amalgame (http://semanticweb.cs.vu.nl/amalgame/) – speziell
SKOS-Vokabulare, mehrstufige Workflows, intellektuelle Evaluierung
• CultuurLINK (http://cultuurlink.beeldengeluid.nl/) – Nachfolger von
Amalgame
• Cocoda (http://coli-conc.gbv.de/) – speziell SKOS-Vokabulare, v.a.
Klassifikationen, intellektuelle Erstellung (mit Autosuggest), bisher
Prototyp
Page 23
Exkurs: Mappings in Wikidata erstellen + pflegen?
• Wikidata = data backbone aller sprachspezifischen Wikipedia-
Ausgaben
• für jedes Wikipedia-Seite gibt es ein Wikidata-Datenobjekt (für die
GND z.B. Q36578), insgesamt 21 Mio.
• über 2000 Eigenschaften (Geburtsdatum, Geo-Koordinaten, …)
• bereits zahlreiche Eigenschaften für Normdaten (z.B. „GND-
Identifier“ P227)
• Vorläufer: PND-Projekt Wikipedia/DNB (seit 2009)
• Pflege wie in Wikipedia durch jedermann
Page 24
Use Case: Engl. Bezeichnungen für GND-Berufe
Ziel:
Zweisprachige Berufsbezeichnungen für wirtschaftswissenschaftlich
relevante Personen
Ausgangspunkt:
GND-Bezeichnungen sind ausschließlich deutschsprachig
Page 25
z.B. „Geograph“ / „Geographin“
• Wikidata-Datenobjekt mit dt. und engl. Bezeichnung existiert
(geschlechtsunspezifisch) (https://www.wikidata.org/wiki/Q901402)
• durch Nachtragen der GND-IDs ist die Übersetzung von der GND
aus erreichbar
• zugleich werden die deutsche und englische Wikipediaseite von der
GND aus erreichbar
• außerdem weitere Normdaten:
• ROME-Berufscode
• ISCO-Code
• Standard Occupational Classification Code
• Art&Architecture-Thesaurus-ID, Freebase-ID, NDL-ID, …
Page 26
User Interface mit Edit-Links in Wikidata
Page 27
Use Case (2): Mögliches Vorgehen
weitgehend script-bar:
für die x häufigsten Berufe
• Lookup der GND-ID in Wikidata
• falls gefunden: Engl. Bezeichnung entnehmen
• andernfalls: Lookup der deutschen Berufsbezeichnung (+
Synonyme) aus der GND in Wikidata
• falls gefunden: verifizieren und ggf. GND-ID nachtragen
• andernfalls: mit vermuteter engl. Bezeichnung suchen
• falls gefunden, deutsche Bezeichnung + GND-ID, ggf. auch
Link zu dt. Wikipedia-Seite in Wikidata nachtragen
• andernfalls: neues Wikidata-Datenobjekt anlegen (?)
Page 28
5. Nutzung von SKOS-Thesauri und Mappings in
Applikationen
Page 29
Unterstützung bei der intellektuellen Indexierung
• Autosuggest-Funktionen (wie in der STW-Webpräsenz)
• vor allem für nicht-bibliothekarische Nutzer
• Self-Upload in Digital Repositories (z.B. EconStor)
• Forschungsdaten-Infrastrukturen (z.B. Sowidatanet, Edavax)
Page 30
Übernahme von Indexaten
• wenn zu einem Deskriptor in Vokabular A ein mit exactMatch
gemappter Deskriptor in Vokabular B existiert
• in beide Richtungen möglich
• semiautomatisch (mit intellektueller Kontrolle)
• falls automatisch, sollte Unterscheidung von intellektuell
zugeordneten Deskriptoren möglich bleiben
Page 31
Thesaurus-unterstützte Suche
Page 32
http://econstor.eu
Thesaurus-unterstützte Suche (2)
Page 33
Nutzung von Synonymen beim Indexaufbau
Page 34
Im Portal EconBiz werden für STW- wie auch GND-Deskriptoren durch
zusätzliche Indexeinträge recherchierbar gemacht:
STW
GND
https://github.com/jneubert/sparql-queries/tree/master/stw#stw-misc
Perspektive: Publikationen als Knotenpunkte zur
Verknüpfung von Personen/Instit. und Themen
Page 35
6. Tools für SKOS-Thesauri
Page 36
Tools zur Thesaurusanzeige
• Skosmos (http://skosmos.org/)
• TemaTres (http://www.vocabularyserver.com/)
• ASKOSI (http://askosi.org/)
Auch Thesauruspflege:
• iQvoc (http://iqvoc.net/)
• VocBench (http://vocbench.uniroma2.it/)
• PoolParty (https://www.poolparty.biz/poolparty-thesaurus-manager/)
Page 37
Tools zur Qualitätssicherung
In den letzten Jahren mehrere Ansätze, SKOS-Thesauri entsprechend
der SKOS-Regeln und z.T. weiterer „best practices“ zu validieren:
• qSKOS (Christian Mader / Poolparty)
Validierung streng nach SKOS Reference
https://github.com/cmader/qSKOS/
• Skosify (Finnische Nationalbibliothek)
Konvertierung nach SKOS, Qualitätsverbesserung, Validierung
https://github.com/NatLibFi/Skosify
Paper: http://eprints.cs.univie.ac.at/3707/1/skosquality.pdf
Page 38
Tools zum Versionsvergleich
Was ist neu? Was hat sich geändert?
• skos-history
https://github.com/jneubert/skos-history
• Anwendung auf STW:
http://zbw.eu/stw/version/9.0/relaunch/about
Page 39
Page 40
7. Anwendung auf die GND
Page 41
Ein Experiment: GND Sachbegriffe in SKOS
Ausgangspunkt: GND Linked Data Dumps 2015-10-13
Teilmenge: gndo:SubjectHeadingSensoStricto (saz)
134822 Sachbegriffe
484 Sachgruppen
SKOS-Version mit ca. 2,3 Mio. Triples verfügbar unter
http://zbw.eu/beta/skosmos/swdskos/de
Code: https://github.com/jneubert/sparql-queries/tree/master/gnd
Page 42
Page 43
http://zbw.eu/beta/skosmos/swdskos
Daten, die für das Experiment ergänzt wurden
• skos:ConceptScheme
• Name
• Datum/Version
• skos:inScheme Statements – was gehört dazu, was nicht?
• Sachgruppen + deren Notationen
• SKOS-Properties:
• skos:prefLabel für gndo:preferredNameForTheSubjectHeading
• analog skos:altLabel, skos:definition
• generalisierte skos:broader Relation (für generic/instantial/partitive)
• fehlende Umkehrrelationen (broader/narrower)
Page 44
Repräsentation von GND Sachgruppen
• derzeit in einem eigenen skos:ConceptScheme als flache Liste von
skos:Concepts modelliert
http://d-nb.info/standards/vocab/gnd/gnd-sc
• alternative Möglichkeit: mehrstufige Hierarchie von
isothes:ConceptGroups (Subklasse von skos:Collection und daher
disjunct mit skos:Concept)
• Verknüpfung der einzelnen GND-Begriffe mit
gndo:gndSubjectCategory als Subproperty von skos:member
• in einer Sachsystematik ggf. Ausschluss von „Personen zu …“
Page 45
Hierarchie GND Sachbegriffe
Original-Relationen:
gndSubjectCategory 180583
broaderTermGeneral 92511
broaderTermGeneric 3971
broaderTermInstantial 4255
broaderTermPartitive 152
broaderTermWithMoreThanOneElement 2
Generierte Relationen (skos:broader): 281471
Page 46
Qualitätsprobleme aufspüren mit qSKOS
This is the quality report of the file(s) rdf/swdskos.ttl, generated by qSKOS on Do, 25 Feb 2016 17:50:55 +0100
* Summary of Quality Issue Occurrences:
Overlapping Labels: FAIL (948)
Cyclic Hierarchical Relations: FAIL (3)
Undefined SKOS Resources: OK (no potential problems found)
Relation Clashes: FAIL (151)
Mapping Clashes: FAIL (19)
Inconsistent Preferred Labels: OK (no potential problems found)
Disjoint Labels Violation: FAIL (10)
Unidirectionally Related Concepts: OK (no potential problems found)
* Detailed coverage of each Quality Issue:
--- Overlapping Labels
Description: Finds concepts with similar (identical) labels
Detailed information: https://github.com/cmader/qSKOS/wiki/Quality-Issues#overlapping-labels
count: 948
[http://d-nb.info/gnd/4632973-0 ("Mixing"@de, ALT_LABEL), http://d-nb.info/gnd/1042787395 ("Mixing"@de, ALT_LABEL)]
[http://d-nb.info/gnd/4340457-1 ("Flimmern"@de, PREF_LABEL), http://d-nb.info/gnd/4279005-0 ("Flimmern"@de, ALT_LABEL)]
...
[http://d-nb.info/standards/vocab/gnd/gnd-sc#3.2-3.6 ("Christentum"@de, PREF_LABEL), http://d-nb.info/gnd/4010074-1 ("Christentum"@de, PREF_L
...
[http://d-nb.info/gnd/7507234-8 ("Softwarepiraterie"@de, PREF_LABEL), http://d-nb.info/gnd/7504886-3 ("Softwarepiraterie"@de, PREF_LABEL)]
...
[http://d-nb.info/gnd/7501928-0 ("Nervenkrankheit"@de, PREF_LABEL), http://d-nb.info/gnd/1068493003 ("Nervenkrankheit"@de, PREF_LABEL)]
...
Page 47
Beispiel: (Schein-)Duplette „Nervenkrankheit“
Page 48
Der obige Record wird als Linked Data mit dem Typ
gndo:subjectHeadingSensoStricto (saz) ausgegeben
Beispiel: Zyklische hierarchische Relationen
Christenverfolgung OB Christenfeindlichkeit
Christenfeindlichkeit OB Christenverfolgung
Page 49
Versionsvergleich mit skos-history
Page 50
Zwei Versionen im Version Store: 2015-05-13 und 2015-10-13
Abfragbar mit SPARQL Queries in SPARQL Lab:
• Neue Begriffe
http://zbw.eu/beta/sparql-lab/?queryRef=https://api.github.com/repos/jneubert/skos-
history/contents/sparql/added_concepts.rq&endpoint=http://zbw.eu/beta/sparql/swdskosv/query&versionHistoryGraph=htt
p://zbw.eu/beta/swdskos/version&language=de
• Aufsplitterungen: Zu neuen Begriffen verschobene Benennungen
http://zbw.eu/beta/sparql-lab/?queryRef=https://api.github.com/repos/jneubert/skos-
history/contents/sparql/labels_moved_to_added_concepts.rq&endpoint=http://zbw.eu/beta/sparql/swdskosv/query&versio
nHistoryGraph=http://zbw.eu/beta/swdskos/version&language=de
• GND-spezifische Queries
Abfrage: Neue Begriffe nach Sachgruppen
Page 51
7. Conclusions
Page 52
Wunschliste für den GND Linked Data Dump
Metadaten zum gesamten Dataset, z.B. mit VoID, DCAT
• Name
• Version / Datum
• Publisher
• Lizenz
• Umfang
• Untermengen (Sachbegriffe, Personen, Institutionen, …)
Zugehörigkeit der einzelnen Konzepte zum Datenset explizit
kennzeichnen, z.B. mit dcterms:isPartOf
Page 53
Wunschliste (Fortsetzung)
Format
• utf-8 normalized (nicht in Grundzeichen und Akzent „zerlegt“)
• RDF validiert
• Datei aufgeteilt in Entitäten
Versionen
• alle veröffentlichten Versionen zum Download verfügbar
Struktur
• explizite Hierarchie in Sachgruppen-Systematik
Page 54
Zusammengefasst …
• Semantischen Reichtum der GND erhalten
• Kompatibilität zu SKOS-Vokabularen verbessern
(einige Früchte hängen sehr niedrig!)
Page 55
Vielen Dank!
Links:
STW: http://zbw.eu/stw
GND Sachbegriffe in Skosmos: http://zbw.eu/beta/skosmos/swdskos/de
SPARQL Endpoints: http://zbw.eu/beta/sparql
GND Beispielqueries: https://github.com/jneubert/sparql-queries/tree/master/gnd
Kontakt: j.neubert@zbw.eu
Page 56
1 sur 56

Recommandé

Katalogisierung mit dem Open-Source-Bibliothekssystem Koha par
Katalogisierung mit dem Open-Source-Bibliothekssystem KohaKatalogisierung mit dem Open-Source-Bibliothekssystem Koha
Katalogisierung mit dem Open-Source-Bibliothekssystem Kohahemmefelix
761 vues20 diapositives
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M... par
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...
SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: M...Institute for Digital Humanities, University of Cologne
497 vues49 diapositives
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL) par
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)
Open Source Bibliotheksmanagement (mit D:SWARM + AMSL)Felix Lohmeier
4.2K vues30 diapositives
Freie Katalogdaten und Linked Data par
Freie Katalogdaten und Linked DataFreie Katalogdaten und Linked Data
Freie Katalogdaten und Linked DataAdrian Pohl
682 vues34 diapositives
Freie und vernetzte Daten: Das Konzept des Linked Open Data und sein Einsatz ... par
Freie und vernetzte Daten: Das Konzept des Linked Open Data und sein Einsatz ...Freie und vernetzte Daten: Das Konzept des Linked Open Data und sein Einsatz ...
Freie und vernetzte Daten: Das Konzept des Linked Open Data und sein Einsatz ...Jürgen Diet
795 vues19 diapositives
Repositorieninhalte als Linked Data bereitstellen par
Repositorieninhalte als Linked Data bereitstellenRepositorieninhalte als Linked Data bereitstellen
Repositorieninhalte als Linked Data bereitstellenPascal-Nicolas Becker
701 vues16 diapositives

Contenu connexe

Tendances

Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de... par
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Felix Lohmeier
3.7K vues33 diapositives
RSS Feeds für Neuerwerbungen par
RSS Feeds für NeuerwerbungenRSS Feeds für Neuerwerbungen
RSS Feeds für NeuerwerbungenNowakman
764 vues10 diapositives
Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen übe... par
Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen  übe...Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen  übe...
Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen übe...Magnus Pfeffer
1.6K vues27 diapositives
Microformats & COinS par
Microformats & COinSMicroformats & COinS
Microformats & COinSChristian Hauschke
1.3K vues29 diapositives
Eine Infrastruktur für freie Katalogdaten. Konzeption und Entwicklung par
Eine Infrastruktur für freie Katalogdaten. Konzeption und EntwicklungEine Infrastruktur für freie Katalogdaten. Konzeption und Entwicklung
Eine Infrastruktur für freie Katalogdaten. Konzeption und EntwicklungAdrian Pohl
791 vues41 diapositives
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat... par
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...Pascal-Nicolas Becker
572 vues18 diapositives

Tendances(20)

Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de... par Felix Lohmeier
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Schlanke Discovery-Lösung auf Basis von TYPO3. Der neue Bibliothekskatalog de...
Felix Lohmeier3.7K vues
RSS Feeds für Neuerwerbungen par Nowakman
RSS Feeds für NeuerwerbungenRSS Feeds für Neuerwerbungen
RSS Feeds für Neuerwerbungen
Nowakman764 vues
Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen übe... par Magnus Pfeffer
Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen  übe...Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen  übe...
Abgleich von Titeldaten zur Übernahme von Sacherschließungsinformationen übe...
Magnus Pfeffer1.6K vues
Eine Infrastruktur für freie Katalogdaten. Konzeption und Entwicklung par Adrian Pohl
Eine Infrastruktur für freie Katalogdaten. Konzeption und EntwicklungEine Infrastruktur für freie Katalogdaten. Konzeption und Entwicklung
Eine Infrastruktur für freie Katalogdaten. Konzeption und Entwicklung
Adrian Pohl791 vues
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat... par Pascal-Nicolas Becker
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...
DepositOnce - Das Repositorium der TU Berlin für Forschungsdaten und Publikat...
Jetzt kommt zusammen, was zusammen gehört par Magnus Pfeffer
Jetzt kommt zusammen, was zusammen gehörtJetzt kommt zusammen, was zusammen gehört
Jetzt kommt zusammen, was zusammen gehört
Magnus Pfeffer2.3K vues
Dynamische Kataloganreicherung auf Basis von Linked Open Data par h_jansen
Dynamische Kataloganreicherung auf Basis von Linked Open DataDynamische Kataloganreicherung auf Basis von Linked Open Data
Dynamische Kataloganreicherung auf Basis von Linked Open Data
h_jansen847 vues
Open Source Software zur Verarbeitung und Analyse von Metadatenmanagement par Magnus Pfeffer
Open Source Software zur Verarbeitung und Analyse von MetadatenmanagementOpen Source Software zur Verarbeitung und Analyse von Metadatenmanagement
Open Source Software zur Verarbeitung und Analyse von Metadatenmanagement
Magnus Pfeffer1.6K vues
VIVO Use Case Dresden #VIVODE15 9.9.2015 par Felix Lohmeier
VIVO Use Case Dresden #VIVODE15 9.9.2015VIVO Use Case Dresden #VIVODE15 9.9.2015
VIVO Use Case Dresden #VIVODE15 9.9.2015
Felix Lohmeier3.6K vues
Magdeburg | 2010-07-12 | Einführung in das Semantic Web par Webmontag
Magdeburg | 2010-07-12 | Einführung in das Semantic WebMagdeburg | 2010-07-12 | Einführung in das Semantic Web
Magdeburg | 2010-07-12 | Einführung in das Semantic Web
Webmontag648 vues
Resource Discovery: Herausforderung und Chance für die Sacherschließung par Magnus Pfeffer
Resource Discovery:  Herausforderung und Chance für die SacherschließungResource Discovery:  Herausforderung und Chance für die Sacherschließung
Resource Discovery: Herausforderung und Chance für die Sacherschließung
Magnus Pfeffer4K vues
Open Access im Bibliothekskatalog (Wisskom2016 - Jülich) par Martin Blenkle
Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)
Open Access im Bibliothekskatalog (Wisskom2016 - Jülich)
Martin Blenkle270 vues
EAD – Facts & Figures. Grundlagen, Werkzeuge und die Zukunft mit EAD3 par Tobias Wildi
EAD – Facts & Figures. Grundlagen, Werkzeuge und die Zukunft mit EAD3EAD – Facts & Figures. Grundlagen, Werkzeuge und die Zukunft mit EAD3
EAD – Facts & Figures. Grundlagen, Werkzeuge und die Zukunft mit EAD3
Tobias Wildi458 vues
Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date... par intranda GmbH
Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...
Goobi und Dante - die Nutzung der neuen Normdatendienste der VZG bei der Date...
intranda GmbH834 vues
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken par Björn Muschall
AMSL Kick-off-Meeting sächsischer HochschulbibliothekenAMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
AMSL Kick-off-Meeting sächsischer Hochschulbibliotheken
Björn Muschall1.1K vues

En vedette

Using Wikidata as an Authority for the SowiDataNet Research Data Repository par
Using Wikidata as an Authority for the SowiDataNet Research Data RepositoryUsing Wikidata as an Authority for the SowiDataNet Research Data Repository
Using Wikidata as an Authority for the SowiDataNet Research Data RepositoryJoachim Neubert
4.8K vues4 diapositives
Authority Control: Wikipedia + Wikidata par
Authority Control: Wikipedia + WikidataAuthority Control: Wikipedia + Wikidata
Authority Control: Wikipedia + WikidataErika Herzog
411 vues19 diapositives
KOS evolution in Linked Data par
KOS evolution in Linked DataKOS evolution in Linked Data
KOS evolution in Linked DataJoachim Neubert
589 vues34 diapositives
NISO/DCMI Webinar: Cooperative Authority Control: The Virtual International A... par
NISO/DCMI Webinar: Cooperative Authority Control: The Virtual International A...NISO/DCMI Webinar: Cooperative Authority Control: The Virtual International A...
NISO/DCMI Webinar: Cooperative Authority Control: The Virtual International A...National Information Standards Organization (NISO)
56.4K vues74 diapositives
Digitization : a co-operation between the hbz, libraries and commercial partners par
Digitization : a co-operation between the hbz, libraries and commercial partnersDigitization : a co-operation between the hbz, libraries and commercial partners
Digitization : a co-operation between the hbz, libraries and commercial partnersintelligentinfo
6.3K vues8 diapositives
Linked Data Publishing with Drupal (SWIB13 workshop) par
Linked Data Publishing with Drupal (SWIB13 workshop)Linked Data Publishing with Drupal (SWIB13 workshop)
Linked Data Publishing with Drupal (SWIB13 workshop)Joachim Neubert
14.2K vues52 diapositives

En vedette(20)

Using Wikidata as an Authority for the SowiDataNet Research Data Repository par Joachim Neubert
Using Wikidata as an Authority for the SowiDataNet Research Data RepositoryUsing Wikidata as an Authority for the SowiDataNet Research Data Repository
Using Wikidata as an Authority for the SowiDataNet Research Data Repository
Joachim Neubert4.8K vues
Authority Control: Wikipedia + Wikidata par Erika Herzog
Authority Control: Wikipedia + WikidataAuthority Control: Wikipedia + Wikidata
Authority Control: Wikipedia + Wikidata
Erika Herzog411 vues
Digitization : a co-operation between the hbz, libraries and commercial partners par intelligentinfo
Digitization : a co-operation between the hbz, libraries and commercial partnersDigitization : a co-operation between the hbz, libraries and commercial partners
Digitization : a co-operation between the hbz, libraries and commercial partners
intelligentinfo6.3K vues
Linked Data Publishing with Drupal (SWIB13 workshop) par Joachim Neubert
Linked Data Publishing with Drupal (SWIB13 workshop)Linked Data Publishing with Drupal (SWIB13 workshop)
Linked Data Publishing with Drupal (SWIB13 workshop)
Joachim Neubert14.2K vues
Embrace The Chaos par jonphipps
Embrace The ChaosEmbrace The Chaos
Embrace The Chaos
jonphipps2.1K vues
Aligning library services with emerging research data needs par Andrew Sallans
Aligning library services with emerging research data needsAligning library services with emerging research data needs
Aligning library services with emerging research data needs
Andrew Sallans1.9K vues
DataUp Presentation at Cal Poly par Carly Strasser
DataUp Presentation at Cal PolyDataUp Presentation at Cal Poly
DataUp Presentation at Cal Poly
Carly Strasser4.2K vues
The Data Management Ecosystem par John Kunze
The Data Management EcosystemThe Data Management Ecosystem
The Data Management Ecosystem
John Kunze1.3K vues
MozCon 2013 Recap - Day One par Kane Jamison
MozCon 2013 Recap - Day OneMozCon 2013 Recap - Day One
MozCon 2013 Recap - Day One
Kane Jamison9.4K vues
Functional and Architectural Requirements for Metadata: Supporting Discovery... par Jian Qin
Functional and Architectural Requirements for Metadata: Supporting Discovery...Functional and Architectural Requirements for Metadata: Supporting Discovery...
Functional and Architectural Requirements for Metadata: Supporting Discovery...
Jian Qin1.8K vues
DCMI/RDA Task Group Report, DC-2010 Pittsburgh par Diane Hillmann
DCMI/RDA Task Group Report, DC-2010 PittsburghDCMI/RDA Task Group Report, DC-2010 Pittsburgh
DCMI/RDA Task Group Report, DC-2010 Pittsburgh
Diane Hillmann3.9K vues
Dagstuhl FOAF history talk par Dan Brickley
Dagstuhl FOAF history talkDagstuhl FOAF history talk
Dagstuhl FOAF history talk
Dan Brickley110.7K vues

Similaire à Anforderungen an Thesauri im Semantic Web

Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti... par
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...redsys
601 vues26 diapositives
DSpace und das Semantic Web par
DSpace und das Semantic WebDSpace und das Semantic Web
DSpace und das Semantic WebPascal-Nicolas Becker
842 vues48 diapositives
Einbindung von Linked Data in existierende Bibliotheksanswendungen par
Einbindung von Linked Data in existierende BibliotheksanswendungenEinbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende Bibliotheksanswendungenredsys
465 vues30 diapositives
Anforderungen an die Wissensrepräsentation im Social Semantic Web par
Anforderungen an die Wissensrepräsentation im Social Semantic WebAnforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic WebKatrin Weller
1.1K vues27 diapositives
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ... par
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...TIB Hannover
4.9K vues1 diapositive

Similaire à Anforderungen an Thesauri im Semantic Web(20)

Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti... par redsys
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
Integration von Normdaten in Bibliotheksanwendungen auf der Basis von Semanti...
redsys601 vues
Einbindung von Linked Data in existierende Bibliotheksanswendungen par redsys
Einbindung von Linked Data in existierende BibliotheksanswendungenEinbindung von Linked Data in existierende Bibliotheksanswendungen
Einbindung von Linked Data in existierende Bibliotheksanswendungen
redsys465 vues
Anforderungen an die Wissensrepräsentation im Social Semantic Web par Katrin Weller
Anforderungen an die Wissensrepräsentation im Social Semantic WebAnforderungen an die Wissensrepräsentation im Social Semantic Web
Anforderungen an die Wissensrepräsentation im Social Semantic Web
Katrin Weller1.1K vues
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ... par TIB Hannover
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...
Lambert Heller @ Zukunftswerkstatt, BID-Kongreß 2010: Thesenpapier zum Thema ...
TIB Hannover4.9K vues
Linked Open Data - Eine Perspektive für die Bibliothekswelt? par Felix Ostrowski
Linked Open Data - Eine Perspektive für die Bibliothekswelt?Linked Open Data - Eine Perspektive für die Bibliothekswelt?
Linked Open Data - Eine Perspektive für die Bibliothekswelt?
Felix Ostrowski733 vues
Präsentation social semantic web par _veronika_
Präsentation social semantic webPräsentation social semantic web
Präsentation social semantic web
_veronika_387 vues
Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten... par cneudecker
Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten...Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten...
Digitalisate kuratieren mit KI - von unstrukturierten Daten zu strukturierten...
cneudecker539 vues
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken par LydiaU
Kickoff Workshop zum Projekt amsl mit den sächsischen HochschulbibliothekenKickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
Kickoff Workshop zum Projekt amsl mit den sächsischen Hochschulbibliotheken
LydiaU680 vues
Wissensrepräsentation im Social Semantic Web par Katrin Weller
Wissensrepräsentation im Social Semantic WebWissensrepräsentation im Social Semantic Web
Wissensrepräsentation im Social Semantic Web
Katrin Weller277 vues
Anforderungen An Metadaten Ein Ausblick par guest32606b
Anforderungen An Metadaten Ein AusblickAnforderungen An Metadaten Ein Ausblick
Anforderungen An Metadaten Ein Ausblick
guest32606b275 vues
Semantic Web, SKOS und Linked Data par Kai Eckert
Semantic Web, SKOS und Linked DataSemantic Web, SKOS und Linked Data
Semantic Web, SKOS und Linked Data
Kai Eckert1.9K vues
amsl - Ergebnispräsentation der EFRE-Förderphase par Björn Muschall
amsl - Ergebnispräsentation der EFRE-Förderphaseamsl - Ergebnispräsentation der EFRE-Förderphase
amsl - Ergebnispräsentation der EFRE-Förderphase
Björn Muschall1.6K vues
DSpace as publication platform par redsys
DSpace as publication platformDSpace as publication platform
DSpace as publication platform
redsys550 vues
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo... par Dennis Zielke
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Laudatio Workshop Entwicklersession zu Gemeinsamkeiten in Forschungsdatenrepo...
Dennis Zielke1.2K vues
Einführung in die Literaturverwaltung par TIB Hannover
Einführung in die LiteraturverwaltungEinführung in die Literaturverwaltung
Einführung in die Literaturverwaltung
TIB Hannover2.2K vues

Plus de Joachim Neubert

Linking the 20th century paper history to the sum of all knowledge par
Linking the 20th century paper history to the sum of all knowledgeLinking the 20th century paper history to the sum of all knowledge
Linking the 20th century paper history to the sum of all knowledgeJoachim Neubert
974 vues21 diapositives
Exploring and mapping the category system of the world‘s largest public press... par
Exploring and mapping the category system of the world‘s largest public press...Exploring and mapping the category system of the world‘s largest public press...
Exploring and mapping the category system of the world‘s largest public press...Joachim Neubert
85 vues8 diapositives
Donating data to Wikidata: First experiences from the „20th Century Press Arc... par
Donating data to Wikidata: First experiences from the „20th Century Press Arc...Donating data to Wikidata: First experiences from the „20th Century Press Arc...
Donating data to Wikidata: First experiences from the „20th Century Press Arc...Joachim Neubert
95 vues11 diapositives
Wikidata (für Archive) par
Wikidata (für Archive)Wikidata (für Archive)
Wikidata (für Archive)Joachim Neubert
112 vues19 diapositives
Wikidata as a hub for the linked data cloud par
Wikidata as a hub for the linked data cloudWikidata as a hub for the linked data cloud
Wikidata as a hub for the linked data cloudJoachim Neubert
175 vues66 diapositives
Wikidata as opportunity for special collections: the 20th Century Press Archi... par
Wikidata as opportunity for special collections: the 20th Century Press Archi...Wikidata as opportunity for special collections: the 20th Century Press Archi...
Wikidata as opportunity for special collections: the 20th Century Press Archi...Joachim Neubert
3.9K vues25 diapositives

Plus de Joachim Neubert(20)

Linking the 20th century paper history to the sum of all knowledge par Joachim Neubert
Linking the 20th century paper history to the sum of all knowledgeLinking the 20th century paper history to the sum of all knowledge
Linking the 20th century paper history to the sum of all knowledge
Joachim Neubert974 vues
Exploring and mapping the category system of the world‘s largest public press... par Joachim Neubert
Exploring and mapping the category system of the world‘s largest public press...Exploring and mapping the category system of the world‘s largest public press...
Exploring and mapping the category system of the world‘s largest public press...
Joachim Neubert85 vues
Donating data to Wikidata: First experiences from the „20th Century Press Arc... par Joachim Neubert
Donating data to Wikidata: First experiences from the „20th Century Press Arc...Donating data to Wikidata: First experiences from the „20th Century Press Arc...
Donating data to Wikidata: First experiences from the „20th Century Press Arc...
Joachim Neubert95 vues
Wikidata as a hub for the linked data cloud par Joachim Neubert
Wikidata as a hub for the linked data cloudWikidata as a hub for the linked data cloud
Wikidata as a hub for the linked data cloud
Joachim Neubert175 vues
Wikidata as opportunity for special collections: the 20th Century Press Archi... par Joachim Neubert
Wikidata as opportunity for special collections: the 20th Century Press Archi...Wikidata as opportunity for special collections: the 20th Century Press Archi...
Wikidata as opportunity for special collections: the 20th Century Press Archi...
Joachim Neubert3.9K vues
20th Century Press Archives goes Wikidata par Joachim Neubert
20th Century Press Archives goes Wikidata20th Century Press Archives goes Wikidata
20th Century Press Archives goes Wikidata
Joachim Neubert288 vues
Chancen und Herausforderungen einer komplementären Nutzung von GND und Wikidata par Joachim Neubert
Chancen und Herausforderungen einer komplementären Nutzung von GND und WikidataChancen und Herausforderungen einer komplementären Nutzung von GND und Wikidata
Chancen und Herausforderungen einer komplementären Nutzung von GND und Wikidata
Joachim Neubert3.9K vues
Pressemappe 20. Jahrhundert: Personen- und Firmendossiers par Joachim Neubert
Pressemappe 20. Jahrhundert: Personen- und FirmendossiersPressemappe 20. Jahrhundert: Personen- und Firmendossiers
Pressemappe 20. Jahrhundert: Personen- und Firmendossiers
Joachim Neubert385 vues
20th Century Press Archives goes Wikidata par Joachim Neubert
20th Century Press Archives goes Wikidata20th Century Press Archives goes Wikidata
20th Century Press Archives goes Wikidata
Joachim Neubert219 vues
Linking Knowledge Organization Systems via Wikidata (DCMI conference 2018) par Joachim Neubert
Linking Knowledge Organization Systems via Wikidata (DCMI conference 2018)Linking Knowledge Organization Systems via Wikidata (DCMI conference 2018)
Linking Knowledge Organization Systems via Wikidata (DCMI conference 2018)
Joachim Neubert3.5K vues
Making Wikidata fit as a Linking Hub for Knowledge Organization Systems par Joachim Neubert
Making Wikidata fit as a Linking Hub for Knowledge Organization SystemsMaking Wikidata fit as a Linking Hub for Knowledge Organization Systems
Making Wikidata fit as a Linking Hub for Knowledge Organization Systems
Joachim Neubert3.6K vues
Wikidata as a linking hub for knowledge organization systems? Integrating an ... par Joachim Neubert
Wikidata as a linking hub for knowledge organization systems? Integrating an ...Wikidata as a linking hub for knowledge organization systems? Integrating an ...
Wikidata as a linking hub for knowledge organization systems? Integrating an ...
Joachim Neubert441 vues
EconBiz Research Dataset (SWIB16 Lightning Talk) par Joachim Neubert
EconBiz Research Dataset (SWIB16 Lightning Talk)EconBiz Research Dataset (SWIB16 Lightning Talk)
EconBiz Research Dataset (SWIB16 Lightning Talk)
Joachim Neubert498 vues
Change Tracking in Knowledge Organization Systems with skos-history par Joachim Neubert
Change Tracking in Knowledge Organization Systems with skos-historyChange Tracking in Knowledge Organization Systems with skos-history
Change Tracking in Knowledge Organization Systems with skos-history
Joachim Neubert407 vues
Leveraging SKOS to trace the overhaul of the STW Thesaurus for Economics par Joachim Neubert
Leveraging SKOS to trace the overhaul of the STW Thesaurus for EconomicsLeveraging SKOS to trace the overhaul of the STW Thesaurus for Economics
Leveraging SKOS to trace the overhaul of the STW Thesaurus for Economics
Joachim Neubert388 vues
skos-history: Tracking the evolution of Knowledge Organization Systems par Joachim Neubert
skos-history: Tracking the evolution of Knowledge Organization Systemsskos-history: Tracking the evolution of Knowledge Organization Systems
skos-history: Tracking the evolution of Knowledge Organization Systems
Joachim Neubert470 vues
Exploiting the version history of SKOS files: skos-history (SWIB13 Lightning ... par Joachim Neubert
Exploiting the version history of SKOS files: skos-history (SWIB13 Lightning ...Exploiting the version history of SKOS files: skos-history (SWIB13 Lightning ...
Exploiting the version history of SKOS files: skos-history (SWIB13 Lightning ...
Joachim Neubert417 vues

Anforderungen an Thesauri im Semantic Web

  • 1. ZBW is member of the Leibniz Association Anforderungen an Thesauri im Semantic Web Joachim Neubert ZBW – Leibniz Informationszentrum Wirtschaft, Kiel/Hamburg Deutsche Nationalbibliothek Leipzig 1.3.2016 Frankfurt a.M. 2.3.2016
  • 2. Agenda 1. Thesauri im Semantic Web 2. Standards: SKOS, ISO 25964 3. STW als Beispiel eines SKOS-Thesaurus 4. Mappings / Crosskonkordanzen 5. Nutzung von SKOS-Thesauri und Mappings in Applikationen 6. Tools für SKOS-Thesauri 7. Anwendung auf die GND 8. Anforderungen / Wunschliste Page 2
  • 6. Boom von Thesauri im Semantic Web • bartoc.org verzeichnet rund 100 Thesauri im SKOS-Format • Getty: große Umbauten und Öffnung mit Blickrichtung auf Linked Open Data (AAT, Geographical Names, ULAN Artists) • Reorganisation und tendenzielle Verschmelzung der agrarwissenschaftlichen Vokabulare (Agrovoc, NAL Thesaurus, z.T. CAB Thesaurus) im GACS (Global Agricultural Concept Scheme) • Neuentwicklungen wie Getty CONA (Cultural Objects Name Authority) • Wikidata als „universelle Normdatei“ und Verknüpfungspunkt multilingualer Informationsressourcen Page 6
  • 8. Page 8 Strukturierung durch SKOS • Simple Knowledge Organization System • entwickelt mit dem Ziel, Schlagwortsysteme, Thesauri, Klassifikationen u.ä. für das Semantic Web nutzbar zu machen • beruht auf eindeutigen Identifiern (URIs) für Begriffe skos:Concept – „unit of thought“ • erlaubt zu Begriffen Vorzugsbezeichnungen und alternative Bezeichnungen in beliebig vielen Sprachen • unterstützt die üblichen Thesaurusrelationen (broader, narrower, related)
  • 9. Page 9 Strukturierung durch SKOS (2) • ermöglicht Dokumentation (definition, scopeNote, historyNote, etc.) • ergänzende Gliederung durch skos:Collections • zusätzliche Strukturierungsmöglichkeiten durch SKOS-XL (z.B. Beziehung zwischen einer Bezeichnung und deren Abkürzung) • unterstützt Mapping verschiedener Thesauri (exactMatch, closeMatch, broadMatch, narrowMatch, relatedMatch) • erweiterbar durch anwendungsspezifische Klassen und Eigenschaften • seit August 2009 Recommendation des W3C http://www.w3.org/2004/02/skos/
  • 10. Thesaurus Norm ISO 25964 ISO 25964 – löste 2011 (Teil 1) und 2013 (Teil 2) die technisch völlig überholten DIN und ISO Normen aus den 1970er und 1980er Jahren ab • umfangreiche Begriffsdefinitionen Concept (Begriff) und Term (Bezeichnung) wie in SKOS • relationales Datenmodell zur Repräsentation von Thesauri • zusätzliche Strukturierung mit Hilfe von ThesaurusArrays und ConceptGroups (Modellierung von Microthesauri) • Interoperabilität zwischen Vokabularen Page 10
  • 11. Verbindung SKOS - ISO 25964 ISO-THES RDF-Vokabular als Ergänzung zu SKOS und SKOS-XL http://www.niso.org/schemas/iso25964/correspondencesSKOS/ • Korrespondenz SKOS-ISO25964, zugleich SKOS Erweiterung • Empfehlung, wie zwischen generischen, partitiven und instanziellen Unterbegriffen unterschieden werden kann • Empfehlung, wie compound equivalences (Benutze Kombination) in SKOS definiert werden • Empfehlungen für Thesaurus Arrays, Mikrothesauri u.ä. Page 11
  • 12. Einsatzbereich von SKOS • primär zur Datenpublikation im Web und zum Datenaustausch • ermöglicht Interoperabilität und erleichtert Mappings zwischen Vokabularen • zielt nicht darauf, den gesamten Reichtum von Thesauri abdecken • soll nicht automatisches Schlussfolgern (Reasoning) ermöglichen • in der Regel nicht verwendet für die interne Darstellung von Thesauri in Pflegesystemen • Workflows und Stati (z.B. Kandidat, freigegeben, …) • Changelog (wer hat was wann geändert, und vor allem warum?) • Indexierung ist für SKOS generell „out of scope“ Page 12
  • 13. 3. STW als Beispiel eines SKOS-Thesaurus Page 13
  • 14. Page 14 Standard-Thesaurus Wirtschaft • wurde in den 1990er Jahren unter öffentlicher Förderung von vier wirtschaftswissenschaftlichen Institutionen entwickelt • wird heute von der ZBW herausgegeben und weiterentwickelt • umfasst ca. 6.000 Deskriptoren mit über 14.000 alternativen Bezeichnungen in Deutsch und Englisch • bildet feinmaschiges Begriffsnetz • mehr als 13.000 Ober-/Unterbegriffsbeziehungen und 6.500 verwandte Begriffe • zusätzlicher Zugang über Thesaurussystematik mit rund 500 Stellen
  • 15. Page 15 Suche mit Thesaurusunterstützung
  • 18. Page 18 Daten-Einbettung in Webseiten mit RDFa
  • 19. <descriptor/19090-6> # http://zbw.eu/stw/descriptor/19090-6 skos:inScheme <../stw> ; # http://zbw.eu/stw a skos:Concept, zbwext:Descriptor ; skos:prefLabel "Environmental reporting"@en, "Umweltbericht"@de ; skos:altLabel "Corporate environmental accounting"@en, ... ; skos:broader <descriptor/12394-0>, <thsys/70383>, <thsys/71033> ; skos:related <descriptor/18183-4>, ... ; skos:exactMatch <http://aims.fao.org/aos/agrovoc/c_9000050>, <http://d-nb.info/gnd/4202417-1>, <http://lod.gesis.org/thesoz/concept/10039271> ; skos:closeMatch <http://dbpedia.org/resource/Environmental_economics> ; skos:relatedMatch <http://d-nb.info/gnd/4299127-4> ; gbv:gvkppn "091395976"^^xsd:string . Page 19
  • 20. 4. Mappings / Crosskonkordanzen Page 20
  • 21. Interoperabilität • Datenbestände werden zunehmend über Portale, Discovery- Systeme oder letztlich das Web miteinander verknüpft • für die übergreifende Nutzung von Beständen mit gemischter Erschließung sind Mappings notwendig • strukturelle Ähnlichkeit von SKOS-Vokabularen erlaubt Einsatz von standardisierten Tools • Standardisierung der Mapping-Properties (skos:exactMatch etc.) macht den Austausch und die Nutzung von einmal erzeugten Mappings in unterschiedlichen Systemen einfach Page 21
  • 22. Erstellen von Mappings • Optimal wäre eine Kombination und enge Integration von automatischen und intellektuellen Mappingschritten • Nutzung von Synonymen, Mehrsprachigkeit, Stringähnlichkeit, linguistische Funktionen (z.B. Plural/Singular) • Unterstützung bei intellektueller Kontrolle von Vorschlägen und beim vollständig intellektuellen Erstellen einzelner Mappings • klassische Ontology-Matching-Tools sind wenig geeignet für umfangreiche Vokabulare • Linked-Data-Tools häufig auf Optimierung eines vollautomatischen Matchings ausgerichtet • Offenes Problem: Pflege bei Änderungen der beteiligten Vokabulare Page 22
  • 23. Tools zum Erstellen von Mappings • Silk (http://silkframework.org/) – generelles LOD-Mapping • Amalgame (http://semanticweb.cs.vu.nl/amalgame/) – speziell SKOS-Vokabulare, mehrstufige Workflows, intellektuelle Evaluierung • CultuurLINK (http://cultuurlink.beeldengeluid.nl/) – Nachfolger von Amalgame • Cocoda (http://coli-conc.gbv.de/) – speziell SKOS-Vokabulare, v.a. Klassifikationen, intellektuelle Erstellung (mit Autosuggest), bisher Prototyp Page 23
  • 24. Exkurs: Mappings in Wikidata erstellen + pflegen? • Wikidata = data backbone aller sprachspezifischen Wikipedia- Ausgaben • für jedes Wikipedia-Seite gibt es ein Wikidata-Datenobjekt (für die GND z.B. Q36578), insgesamt 21 Mio. • über 2000 Eigenschaften (Geburtsdatum, Geo-Koordinaten, …) • bereits zahlreiche Eigenschaften für Normdaten (z.B. „GND- Identifier“ P227) • Vorläufer: PND-Projekt Wikipedia/DNB (seit 2009) • Pflege wie in Wikipedia durch jedermann Page 24
  • 25. Use Case: Engl. Bezeichnungen für GND-Berufe Ziel: Zweisprachige Berufsbezeichnungen für wirtschaftswissenschaftlich relevante Personen Ausgangspunkt: GND-Bezeichnungen sind ausschließlich deutschsprachig Page 25
  • 26. z.B. „Geograph“ / „Geographin“ • Wikidata-Datenobjekt mit dt. und engl. Bezeichnung existiert (geschlechtsunspezifisch) (https://www.wikidata.org/wiki/Q901402) • durch Nachtragen der GND-IDs ist die Übersetzung von der GND aus erreichbar • zugleich werden die deutsche und englische Wikipediaseite von der GND aus erreichbar • außerdem weitere Normdaten: • ROME-Berufscode • ISCO-Code • Standard Occupational Classification Code • Art&Architecture-Thesaurus-ID, Freebase-ID, NDL-ID, … Page 26
  • 27. User Interface mit Edit-Links in Wikidata Page 27
  • 28. Use Case (2): Mögliches Vorgehen weitgehend script-bar: für die x häufigsten Berufe • Lookup der GND-ID in Wikidata • falls gefunden: Engl. Bezeichnung entnehmen • andernfalls: Lookup der deutschen Berufsbezeichnung (+ Synonyme) aus der GND in Wikidata • falls gefunden: verifizieren und ggf. GND-ID nachtragen • andernfalls: mit vermuteter engl. Bezeichnung suchen • falls gefunden, deutsche Bezeichnung + GND-ID, ggf. auch Link zu dt. Wikipedia-Seite in Wikidata nachtragen • andernfalls: neues Wikidata-Datenobjekt anlegen (?) Page 28
  • 29. 5. Nutzung von SKOS-Thesauri und Mappings in Applikationen Page 29
  • 30. Unterstützung bei der intellektuellen Indexierung • Autosuggest-Funktionen (wie in der STW-Webpräsenz) • vor allem für nicht-bibliothekarische Nutzer • Self-Upload in Digital Repositories (z.B. EconStor) • Forschungsdaten-Infrastrukturen (z.B. Sowidatanet, Edavax) Page 30
  • 31. Übernahme von Indexaten • wenn zu einem Deskriptor in Vokabular A ein mit exactMatch gemappter Deskriptor in Vokabular B existiert • in beide Richtungen möglich • semiautomatisch (mit intellektueller Kontrolle) • falls automatisch, sollte Unterscheidung von intellektuell zugeordneten Deskriptoren möglich bleiben Page 31
  • 34. Nutzung von Synonymen beim Indexaufbau Page 34 Im Portal EconBiz werden für STW- wie auch GND-Deskriptoren durch zusätzliche Indexeinträge recherchierbar gemacht: STW GND https://github.com/jneubert/sparql-queries/tree/master/stw#stw-misc
  • 35. Perspektive: Publikationen als Knotenpunkte zur Verknüpfung von Personen/Instit. und Themen Page 35
  • 36. 6. Tools für SKOS-Thesauri Page 36
  • 37. Tools zur Thesaurusanzeige • Skosmos (http://skosmos.org/) • TemaTres (http://www.vocabularyserver.com/) • ASKOSI (http://askosi.org/) Auch Thesauruspflege: • iQvoc (http://iqvoc.net/) • VocBench (http://vocbench.uniroma2.it/) • PoolParty (https://www.poolparty.biz/poolparty-thesaurus-manager/) Page 37
  • 38. Tools zur Qualitätssicherung In den letzten Jahren mehrere Ansätze, SKOS-Thesauri entsprechend der SKOS-Regeln und z.T. weiterer „best practices“ zu validieren: • qSKOS (Christian Mader / Poolparty) Validierung streng nach SKOS Reference https://github.com/cmader/qSKOS/ • Skosify (Finnische Nationalbibliothek) Konvertierung nach SKOS, Qualitätsverbesserung, Validierung https://github.com/NatLibFi/Skosify Paper: http://eprints.cs.univie.ac.at/3707/1/skosquality.pdf Page 38
  • 39. Tools zum Versionsvergleich Was ist neu? Was hat sich geändert? • skos-history https://github.com/jneubert/skos-history • Anwendung auf STW: http://zbw.eu/stw/version/9.0/relaunch/about Page 39
  • 41. 7. Anwendung auf die GND Page 41
  • 42. Ein Experiment: GND Sachbegriffe in SKOS Ausgangspunkt: GND Linked Data Dumps 2015-10-13 Teilmenge: gndo:SubjectHeadingSensoStricto (saz) 134822 Sachbegriffe 484 Sachgruppen SKOS-Version mit ca. 2,3 Mio. Triples verfügbar unter http://zbw.eu/beta/skosmos/swdskos/de Code: https://github.com/jneubert/sparql-queries/tree/master/gnd Page 42
  • 44. Daten, die für das Experiment ergänzt wurden • skos:ConceptScheme • Name • Datum/Version • skos:inScheme Statements – was gehört dazu, was nicht? • Sachgruppen + deren Notationen • SKOS-Properties: • skos:prefLabel für gndo:preferredNameForTheSubjectHeading • analog skos:altLabel, skos:definition • generalisierte skos:broader Relation (für generic/instantial/partitive) • fehlende Umkehrrelationen (broader/narrower) Page 44
  • 45. Repräsentation von GND Sachgruppen • derzeit in einem eigenen skos:ConceptScheme als flache Liste von skos:Concepts modelliert http://d-nb.info/standards/vocab/gnd/gnd-sc • alternative Möglichkeit: mehrstufige Hierarchie von isothes:ConceptGroups (Subklasse von skos:Collection und daher disjunct mit skos:Concept) • Verknüpfung der einzelnen GND-Begriffe mit gndo:gndSubjectCategory als Subproperty von skos:member • in einer Sachsystematik ggf. Ausschluss von „Personen zu …“ Page 45
  • 46. Hierarchie GND Sachbegriffe Original-Relationen: gndSubjectCategory 180583 broaderTermGeneral 92511 broaderTermGeneric 3971 broaderTermInstantial 4255 broaderTermPartitive 152 broaderTermWithMoreThanOneElement 2 Generierte Relationen (skos:broader): 281471 Page 46
  • 47. Qualitätsprobleme aufspüren mit qSKOS This is the quality report of the file(s) rdf/swdskos.ttl, generated by qSKOS on Do, 25 Feb 2016 17:50:55 +0100 * Summary of Quality Issue Occurrences: Overlapping Labels: FAIL (948) Cyclic Hierarchical Relations: FAIL (3) Undefined SKOS Resources: OK (no potential problems found) Relation Clashes: FAIL (151) Mapping Clashes: FAIL (19) Inconsistent Preferred Labels: OK (no potential problems found) Disjoint Labels Violation: FAIL (10) Unidirectionally Related Concepts: OK (no potential problems found) * Detailed coverage of each Quality Issue: --- Overlapping Labels Description: Finds concepts with similar (identical) labels Detailed information: https://github.com/cmader/qSKOS/wiki/Quality-Issues#overlapping-labels count: 948 [http://d-nb.info/gnd/4632973-0 ("Mixing"@de, ALT_LABEL), http://d-nb.info/gnd/1042787395 ("Mixing"@de, ALT_LABEL)] [http://d-nb.info/gnd/4340457-1 ("Flimmern"@de, PREF_LABEL), http://d-nb.info/gnd/4279005-0 ("Flimmern"@de, ALT_LABEL)] ... [http://d-nb.info/standards/vocab/gnd/gnd-sc#3.2-3.6 ("Christentum"@de, PREF_LABEL), http://d-nb.info/gnd/4010074-1 ("Christentum"@de, PREF_L ... [http://d-nb.info/gnd/7507234-8 ("Softwarepiraterie"@de, PREF_LABEL), http://d-nb.info/gnd/7504886-3 ("Softwarepiraterie"@de, PREF_LABEL)] ... [http://d-nb.info/gnd/7501928-0 ("Nervenkrankheit"@de, PREF_LABEL), http://d-nb.info/gnd/1068493003 ("Nervenkrankheit"@de, PREF_LABEL)] ... Page 47
  • 48. Beispiel: (Schein-)Duplette „Nervenkrankheit“ Page 48 Der obige Record wird als Linked Data mit dem Typ gndo:subjectHeadingSensoStricto (saz) ausgegeben
  • 49. Beispiel: Zyklische hierarchische Relationen Christenverfolgung OB Christenfeindlichkeit Christenfeindlichkeit OB Christenverfolgung Page 49
  • 50. Versionsvergleich mit skos-history Page 50 Zwei Versionen im Version Store: 2015-05-13 und 2015-10-13 Abfragbar mit SPARQL Queries in SPARQL Lab: • Neue Begriffe http://zbw.eu/beta/sparql-lab/?queryRef=https://api.github.com/repos/jneubert/skos- history/contents/sparql/added_concepts.rq&endpoint=http://zbw.eu/beta/sparql/swdskosv/query&versionHistoryGraph=htt p://zbw.eu/beta/swdskos/version&language=de • Aufsplitterungen: Zu neuen Begriffen verschobene Benennungen http://zbw.eu/beta/sparql-lab/?queryRef=https://api.github.com/repos/jneubert/skos- history/contents/sparql/labels_moved_to_added_concepts.rq&endpoint=http://zbw.eu/beta/sparql/swdskosv/query&versio nHistoryGraph=http://zbw.eu/beta/swdskos/version&language=de • GND-spezifische Queries
  • 51. Abfrage: Neue Begriffe nach Sachgruppen Page 51
  • 53. Wunschliste für den GND Linked Data Dump Metadaten zum gesamten Dataset, z.B. mit VoID, DCAT • Name • Version / Datum • Publisher • Lizenz • Umfang • Untermengen (Sachbegriffe, Personen, Institutionen, …) Zugehörigkeit der einzelnen Konzepte zum Datenset explizit kennzeichnen, z.B. mit dcterms:isPartOf Page 53
  • 54. Wunschliste (Fortsetzung) Format • utf-8 normalized (nicht in Grundzeichen und Akzent „zerlegt“) • RDF validiert • Datei aufgeteilt in Entitäten Versionen • alle veröffentlichten Versionen zum Download verfügbar Struktur • explizite Hierarchie in Sachgruppen-Systematik Page 54
  • 55. Zusammengefasst … • Semantischen Reichtum der GND erhalten • Kompatibilität zu SKOS-Vokabularen verbessern (einige Früchte hängen sehr niedrig!) Page 55
  • 56. Vielen Dank! Links: STW: http://zbw.eu/stw GND Sachbegriffe in Skosmos: http://zbw.eu/beta/skosmos/swdskos/de SPARQL Endpoints: http://zbw.eu/beta/sparql GND Beispielqueries: https://github.com/jneubert/sparql-queries/tree/master/gnd Kontakt: j.neubert@zbw.eu Page 56