RVK 3.0 - Die Regensburger Verbundklassifikation als Normdatei für Bibliothek...
Bibliotheken und Linked Open Data Extended
1. Bibliotheken und Linked Open Data
Prof. Magnus Pfeffer
Hochschule der Medien, Stuttgart
pfeffer@hdm-stuttgart.de
2. Übersicht
Teil 1: Theorie
Das Resource Description Framework (RDF)
Linked Data
Open Data
Teil 2: Praxis
Projekte im Bibliotheksumfeld
Umsetzung mit eigenen Daten
Ausblick in andere Bereiche
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 2
3. Teil 1
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 3
4. Einleitung
Was Linked Open Data nicht ist:
Kompliziert
Ganz anders
Etwas komplett Neues
Eine Revolution!
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 4
5. Einleitung
Was Linked Open Data ist:
Sammlung von Standards und Best-Practice-
Handlungsempfehlungen
Gemeinsame Infrastruktur
Ziel: Einfach zugreifbare und interoperable Daten
Interoperabilität ist für
Bibliotheken nichts Neues!
Einfacher Zugriff
schon eher....
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 5
6. Das Resource Description
Framework (RDF)
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 6
9. Bibliotheksdaten: MARC
Interoperabel
Nahezu alle Bibliotheksinformations-
systeme können MARC lesen
Verständlich?
CAPTCHA - Completely Automated Public Turing
test to tell Cataloguers and Humans Apart
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 9
10. Bibliotheksdaten: MARC
Und was ist mit XML?
Nicht wirklich besser!
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 10
11. Bibliotheksdaten
Spezifische Datenformate
MARC / MAB
Spezifische Zugriffsprotokolle
z39.50 / SRU
OAI-PMH
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 11
12. Daten neu denken
Struktur
Felder
Tabellen
Datensätze
→ Syntax: Zulässige Zeichen(folgen)
Bedeutung
Feldbeschreibung
Tabellenkopf
Datenformat
→ Semantik: Zulässige Inhalte
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 12
13. Daten: Traditionell
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 13
14. Daten zu Aussagen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 14
15. Daten zu Aussagen
Ich bin ein Leopard-Drückerfisch.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 15
16. Daten zu Aussagen
Ich bin ein Leopard-Drückerfisch.
Ich gehöre zu den Drückerfischen.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 16
17. Daten zu Aussagen
Ich bin ein Leopard-Drückerfisch.
Ich gehöre zu den Drückerfischen.
Ich bin 50 cm lang.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 17
18. Bezug der Aussage eindeutig
Spezies 90020 ist ein Leopard-Drückerfisch.
Spezies 90020 gehört zu den Drückerfischen.
Spezies 90020 ist 50 cm lang.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 18
19. Identifikatoren
Nummern oder Zeichenfolgen identifizieren Konzepte
oder zusammengehörige Datensätze
Identifikatoren sind innerhalb der Datenbank eindeutig
Im Beispiel: numerische SpeciesID
→ Lokale semantische Eindeutigkeit herstellbar
Problem:
Erweiterung der lokalen zu globalen Identifikatoren
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 19
20. Identifikatoren
Problem:
Erweiterung der lokalen zu globalen Identifikatoren
Lösungsansatz:
Ein globaler Namensraum, der für alle am
Datenaustausch Interessierten zugänglich ist
Vorhandene Namensräume
URIs mit qualifizierten Domainnamen
URNs
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 20
21. Und jetzt mit URIs
Spezies 90020 ist ein Leopard-Drückerfisch.
Spezies 90020 gehört zu den Drückerfischen.
Spezies 90020 ist 50 cm lang.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 21
22. Und jetzt mit URIs
http://example.org/species/90020 http://example.org/common_name „Clown Triggerfish“.
Spezies 90020 gehört zu den Drückerfischen.
Spezies 90020 ist 50 cm lang.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 22
23. Und jetzt mit URIs
http://example.org/species/90020 http://example.org/common_name „Clown Triggerfish“.
Spezies 90020 gehört zu den Drückerfischen.
http://example.org/species/90020 http://example.org/length_cm 50.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 23
24. Und jetzt mit URIs
http://example.org/species/90020 http://example.org/common_name „Clown Triggerfish“.
http://example.org/species/90020 http://example.org/category http://example.org/triggerfish.
http://example.org/triggerfish http://example.org/name „Drückerfisch“.
http://example.org/triggerfish http://example.org/name „Triggerfish“.
http://example.org/species/90020 http://example.org/length_cm 50.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 24
25. Daten als Aussagen
Eigenschaften
Einfache Darstellung
Explizite Semantik
Beliebige Aggregation von Aussagen möglich
Unabhängig von den beschriebenen Entitäten
Unabhängig von den Prädikaten
Annahme: Die Aussagen sind alle „wahr“
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 25
26. RDF
Abstraktes Modell
Aussagen der Form Subjekt-Verb-Objekt
→ „Tripel“
URIs zur Bennennung der Entitäten
Globaler Namensraum
Als URLs über Standardprotokolle erreichbar
→ „dereferenzierbar“
Dateiformate zur Serialisierung
RDF/XML
Notation 3
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 26
27. Dereferenzierung von http-URIs
http://example.org/common_name „Clown Triggerfish“.
Über Http-Protokoll erreichbar
http://example.org/category http://example.org/triggerfish.
http://example.org/length_cm 50.
http://example.org/notes „Also known as the Big-spotted Triggerfish.“
Bei Aufruf:
Ausliefern von RDF-Daten für
Programme und Anwendungen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 27
28. Aussagen über Aussagen
RDF-Schema
Klassen von Entitäten
rdfs:Property Prädikate
rdf:Resource Resourcen
rdfs:Class Klassen
rdfs:Literal Literale
...
Eigenschaften
rdf:type Zuordnung zu einer Klasse
rdfs:domain zulässige Subjekte für ein Prädikat
rdfs:range zulässige Objekte für ein Prädikat
rdfs:label für Menschen verstehbare Bezeichnung
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 28
29. Aussagen über Prädikate
http://www.w3.org/2000/01/
rdf-schema#label
http://example.org/length_cm „Länge in cm“@de
http://www.w3.org/2000/01/ „length in cm“@en
rdf-schema#label
Unter dieser http-URI können
Browser und Programme diese
(und weitere) Angaben finden.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 29
30. Auswertung der Vokabulare
Name: „Clown Triggerfish“.
Kategorie http://example.org/triggerfish.
Länge in cm: 50.
Anmerkungen: „Also known as the Big-spotted Triggerfish.“
Bei Aufruf:
HTML-Seiten für Webbrowser
(Menschen)
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 30
31. Vokabulare
Sammlung von Prädikaten und Klassen
Für einen bestimmten Anwendungszweck
Nachnutzbar für alle im Linked Data Web
Beschreibung wieder in RDF und RDF-Schema
Aussagen über Aussagen
Einschränkung auf sinnvolle Domains und Ranges
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 31
32. Beispiel: Dublin Core
<?xml version="1.0"?> Prefixe für eine einfachere Notation
<?xml version="1.0"?>
<rdf:RDF
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://example.org/book/4387-1">
<rdf:Description rdf:about="http://example.org/book/4387-1">
<dc:creator>Karl Mustermann</dc:creator>
<dc:title>Algebra</dc:title>
<dc:subject>mathematics</dc:subject>
<dc:date>2000-01-23</dc:date>
<dc:language>EN</dc:language>
<dc:description>An introduction to algebra</dc:description>
<dc:description>An introduction to algebra</dc:description>
</rdf:Description>
</rdf:Description>
</rdf:RDF>
</rdf:RDF>
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 32
33. Zwischenfazit
Daten zu Aussagen
RDF
Vokabularien für Anwendungsbereiche
RDF und RDF-Schema
Dereferenzierbare URLs
Daten für Maschinen
Webseiten für Menschen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 33
34. Linked data
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 34
35. Logik
Web Ontology Language (OWL)
Erweiterung von RDF/RDF-Schema
Steigerung der Ausdrucksmächtigkeit
Teilweise Einschränkung der Ausdrucksmächtigkeit
Definition von Axiomen über Entitäten
Erlaubt Inferenz (= Ableitung von logischen Schlüssen)
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 35
36. Logik
Web Ontology Language (OWL)
Beispiele Damit können Daten und Vokabulare
zusammengeführt werden
owl:sameAs
Identität in jeder Hinsicht
owl:inverseOf
Angabe von inversen Beziehungen
Aus „A fatherOf B“ und „fatherOf owl:inverseOf sonOf“
folgt „B sonOf A“
owl:transitiveProperty
Angabe von transitiven Beziehungen
aus „A olderThan B“ und „B olderThan C
und „olderThan owl:transitiveProperty“
folgt „A olderThan C“
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 36
37. Linking data
http://example.org/category
http://example.org/species/90020 http://example.org/triggerfish.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 37
46. 2007
Bild: linkeddata.org
08.10.2007
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 46
47. 2007
Bild: linkeddata.org
07.11.2007
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 47
48. 2007
Bild: linkeddata.org
10.11.2007
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 48
49. 2008
Bild: linkeddata.org
28.02.2008
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 49
50. 2008
Bild: linkeddata.org
31.03.2008
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 50
51. 2008
Bild: linkeddata.org
18.09.2008
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 51
52. 2009
Bild: linkeddata.org
05.03.2009
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 52
53. 2009
Bild: linkeddata.org
27.03.2009
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 53
54. 2009
Bild: linkeddata.org
14.07.2009
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 54
55. 2010
Bild: linkeddata.org
22.09.2010
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 55
56. 2011
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 56
57. 2011
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 57
58. Zusammenfassung
Daten als Aussagen der Form Subjekt-Prädikat-Objekt
Aussagen können beliebig aggregriert werden
URLs als Identifikatoren
Dereferenzierung: Aufruf der URL gemäß Protokoll
Je nach Anfrage entweder RDF-Daten oder HTML
Vokabulare
Beschreibung von Eigenschaften und Beziehungen
Beschreibung als RDF und RDF-Schema
OWL als höhere Ebene
„sameAs“ zur Beschreibung semantischer Equivalenz
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 58
59. Weiterführende Informationen
Tutorials und Anleitungen
http://linkeddata.org/guides-and-tutorials
Tom Heath and Christian Bizer. Linked Data: Evolving
the Web into a Global Data Space. Morgan &
Claypool. 2011
http://linkeddatabook.com (Volltext)
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 59
60. Open Data
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 60
61. Technische Interoperabilität
Resource Description Framework (RDF)
„Cool URIs“
URIs sind im Web erreichbar
RDF-Daten oder HTML je nach Anfrage
URIs sind stabil
Keine Neubelegung einmal vergebener URIs
Einfache Schemata für den Aufbau der URIs
z.B. http://<Domainname>/data/species/<Identnummer>
Gemeinsame Vokabulare
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 61
62. Rechtliche Interoperabilität
Datensammlungen unterliegen dem Urheberrecht
Veröffentlichung
Kopie
Weiterverwendung mit anderen Daten
→ Lizenzierung durch den Urheber erforderlich
Lizenzmodelle
„Nur anschauen“
Eingeschränkte Nutzung
nichtkommerziell, Nennung der Quelle, keine Veränderungen
Uneingeschränkte Nutzung
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 62
63. Rechtliche Interoperabilität
Lizenzmodelle
„Nur anschauen“ = Keine Nutzung
Eingeschränkte Nutzung
Uneingeschränkte Nutzung
Standardlizenzen
Abbildung von sinnvollen Einschränkungen
Juristisch einwandfreie Formulierungen
Anpassungen an unterschiedliche Rechtssysteme
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 63
64. Die „Creative Commons“
Gründung
2001 in den USA von einer Gruppe um Lawrence Lessig
Anlass
Befürchtung, dass das US Copyright (und andere
Urheberrechtsgesetze) die Kreativität im Internet
behindern.
Ziele
Mehr „kreatives“ Material unter offenen, standardisierten
Lizenzen verfügbar machen
Die Lizenzen sollen flexibel, leicht verständlich, leicht zu
nutzen und weltweit gültig sein
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 64
65. Die Creative Commons Lizenzen
BY: Attribution Mehr Rechte vorbehalten
Namensnennung
SA: Sharealike
Weitergabe unter
gleichen Bedingungen
ND: No derivatives
Keine Veränderungen
NC: Non-commercial
Kein kommerzieller Einsatz
Weniger Rechte vorbehalten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 65
66. No rights reserved: CC-0 und PDDL
Keine Lizenz, sondern „Waiver“
Der Urheber erklärt öffentlich, von seinen
Urheberrechten keinen Gebrauch zu machen
Ziel
Werk wird faktisch „Public Domain“, also Allgemeingut
Abhängig vom Rechtsraum
In Deutschland kann das Urheberrecht weder aufgegeben
noch veräußert werden
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 66
67. Open Data Commons
Creative Commons
Primär ausgelegt auf „kreative“ Werke
Für Daten nicht optimal
1:1 Übertragung der Lizenzen auf Daten problematisch
Open Data Commons
Orientiert sich an Creative Commons
Für Daten besser geeignet:
ODC-BY: Attribution
ODC-ODbL: Attribution-Share-Alike
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 67
68. Eignung für Linked Open Data
Jede Einschränkung erschwert Interoperabilität
Non-commercial
Rechtliche Grauzone
Fehlende Definition: Was ist kommerzielles Handeln?
No-derivatives
Erlaubt keine Kombination mit anderen Daten
Daten könnten faktisch nur noch angezeigt werden
Share-Alike
„Infiziert“ die andere Daten mit seiner Lizenz
Nicht kombinierbar mit uneingeschränkten Daten!
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 68
69. Lizenzen für Open Data?
BY: Attribution Mehr Rechte vorbehalten
Namensnennung
SA: Sharealike
Weitergabe unter
gleichen Bedingungen
ND: No derivatives
Keine Veränderungen
NC: Non-commercial
Kein kommerzieller Einsatz
Weniger Rechte vorbehalten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 69
70. Warum nicht CC-BY?
Namensnennung „gut gemeint“
Aber: Praktisch schwer bis unmöglich umsetzbar
Beispiel:
Daten aus 17 Quellen in einer gemeinsamen Datenbank
Abfrage über ein Webinterface, Ausgabe von jeweils 10
Treffern
Anzeige erfordert Kombination und Anreicherung der Daten
Und nun:
Anzeige der Namen „pauschal“ am Ende?
Oder Anzeige an jedem einzelnen Datenelement? Wie?
Was tun bei abgeleiteten Daten (z.B. Berechnungen)?
Und die Anreicherungen?
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 70
71. Lizenzen für Open Data?
BY: Attribution Mehr Rechte vorbehalten
Namensnennung
SA: Sharealike
Weitergabe unter
gleichen Bedingungen
ND: No derivatives
Keine Veränderungen
NC: Non-commercial
Kein kommerzieller Einsatz
Weniger Rechte vorbehalten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 71
72. Für Bibliotheksdaten...
Public Domain!
(CC-0 oder PDDL)
Denn jede Einschränkung verhindert
die rechtliche Interoperabilität der Daten.
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 72
73. Zusammenfassung
Interoperabilität durch Linked Open Data
Standards
RDF, RDF-Schema, OWL
RDF/XML, Notation 3
Best Practice
„Cool URLs“
Verwendung bestehender Vokabulare
Freie Lizenzierung
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 73
74. Zeit für Fragen
?
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 74
75. Teil 2
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 75
76. Übersicht
Teil 1: Theorie
Das Resource Description Framework (RDF)
Linked Data
Open Data
Teil 2: Praxis
Projekte im Bibliotheksumfeld
Umsetzung mit eigenen Daten
Ausblick in andere Bereiche
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 76
77. Projekte im
Bibliotheksumfeld
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 77
78. 10 Jahre Semantic Web
Tim Berners- Tim Berners- Linked Data LIBRIS, HBZ, DNB,
Lee’s Artikel in Lee publiziert Tutorial LCSH.info UB
Scientific Prinzipien für (Bizer et al.) Mannheim,
American zum Linked Data …
Semantic Web
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
LOD LoC W3C DINI
Cloud, LCSH LLD AG
Linking (Offiziell) XG KIM
Open
Data
Projekt
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 78
79. 6 Jahre Linked Data
Tim Berners- Tim Berners- Linked Data LIBRIS, HBZ, DNB,
Lee’s Artikel in Lee publiziert Tutorial LCSH.info UB
Scientific Prinzipien für (Bizer et al.) Mannheim,
American zum Linked Data …
Semantic Web
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
LOD LoC W3C DINI
Cloud, LCSH LLD AG
Linking (Offiziell) XG KIM
Open
Data
Projekt
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 79
80. 4 Jahre Linked Data in Bibliotheken
Tim Berners- Tim Berners- Linked Data LIBRIS, HBZ, DNB,
Lee’s Artikel in Lee publiziert Tutorial LCSH.info UB
Scientific Prinzipien für (Bizer et al.) Mannheim,
American zum Linked Data …
Semantic Web
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
LOD LoC W3C DINI
Cloud, LCSH LLD AG
Linking (Offiziell) XG KIM
Open
Data
Projekt
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 80
81. 2 Jahre Linked Data in Deutschland
Tim Berners- Tim Berners- Linked Data LIBRIS, HBZ, DNB,
Lee’s Artikel in Lee publiziert Tutorial LCSH.info UB
Scientific Prinzipien für (Bizer et al.) Mannheim,
American zum Linked Data …
Semantic Web
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
LOD LoC W3C DINI
Cloud, LCSH LLD AG
Linking (Offiziell) XG KIM
Open
Data
Projekt
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 81
82. Projekte: Kerninhalte
Vokabulare
Normdaten
Titeldaten
Anreicherungen und Verknüpfungen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 82
83. Vokabulare
Dublin Core Metadata Elements (DC)
Komplettumfang „qualified Dublin Core“
Semantic Publishing and Referencing (SPAR)
„Strauß“ von Vokabularen
CiTO, the Citation Typing Ontology
FaBiO, the FRBR-aligned Bibliographic Ontology
BiRO, the Bibliographic Reference Ontology
C4O, the Citation Counting and Context Characterization
Ontology
DoCO, the Document Components Ontology
PRO, the Publishing Roles Ontology
PSO, the Publishing Status Ontology
PSO, the Publishing Status Ontology
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 83
84. Vokabulare
RDA in RDF
Element Sets
Elemente der FRBR-Gruppen
Value Vocabularies
Zulässige Werte für einzelne Elemente
Explizite Aufzählungen
Beispiel: http://rdvocab.info/termList/encFormat/1031
Vocabulary: RDA Encoding Format
Concepts: ASCII
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 84
85. Normdaten
„Das Rückgrat des Semantic Web“
Stabile Systeme zur Beschreibung und Vernetzung der
Daten insbesondere auf inhaltlicher Ebene
Simple Knowledge Organization System (SKOS)
Einfaches aber mächtiges Vokabular
Beschreibung von Konzepthierarchien
Beschreibung von Thesauri
Friend-of-a-Friend (FOAF)
Beschreibung von Beziehungen zwischen Personen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 85
86. Library of Congress Subject Headings
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 86
87. GND der Deutschen Nationalbibliothek
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 87
90. Titeldaten
LIBRIS der schwedischen Nationalbibliothek (2008)
HBZ, BSZ: Open Data für Katalogdaten. (März 2010)
UB Mannheim: Verknüpfungen zwischen HeBIS und SWB,
Linked Data Aufbereitung. (Juli 2010)
HBZ: lobid.org (September 2010):
Titeldaten als Linked Open Data
Identifikatoren für Organisationen
B3KAT (Winter 2011)
Erste vollständige Freigabe eines Verbundkatalogs plus
Linked Data-Umsetzung!
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 90
91. B3KAT – Verbundkatalog von BVB und KOBV
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 91
92. Andere Projekte im Bibliotheksumfeld
CultureGraph
Sammlung gemeinsamer Identifier und Verknüpfung
von Datensätzen zwischen Katalogen
Europeana
Open Data als Voraussetzung der Teilnahme
RDF-basiertes Datenmodell
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 92
93. Umsetzung mit eigenen Daten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 93
94. Überblick
Daten publizieren
Szenario
Daten
Varianten der Umsetzung
Angebote anreichern
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 94
95. Überblick
Daten publizieren
Szenario
Daten
Varianten der Umsetzung
Angebote anreichern
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 95
96. Szenario
Ziel: Erweiterung der bestehenden Webdienste
Bereits vorhandene bibliografische Daten im WWW
Online-Katalog (OPAC)
Dokumentenserver
Bibliografische Datensammlungen
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 96
97. Voraussetzungen
Möglichkeit der Anpassung der serverseitigen Skripte
Lizenzen beachten
Stabile URLs für die Ressourcen
Dokumentenserver: Teil der Funktion
OPAC:
Verbund-Identnummer als eindeutiger Identifikator nutzbar
Zugriff auf einen einzelnen Eintrag über Suche nach PPN
Stabile und kurze URLs durch URL-Rewriting realisierbar
http://mein.opac/data/12345667 nach
http://mein.opac/query.php?ppn=12345667
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 97
98. Aufbereitung der Daten
Schritte
Auswahl der Vokabularien
Konvertierung der Daten
Bereitstellen der Daten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 98
99. Vokabularien
Linked Data schreibt kein Vokabular vor
Aber: Orientierung an bestehenden Vokabularien
Mischen von Attributen aus verschiedenen Quellen
Katalogdaten
Dublin Core
Bibliographic Ontology (BibO)
Thesauri und Klassifikationen
Simple Knowledge Organization System (SKOS)
URLs für SWD Schlagwörter bei der DNB
URLs für die DDC bei OCLC
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 99
100. Konvertierung der Daten
Analyse des internen Datenformat
Dokumentenserver: Relationale Datenbank
OPAC: MAB / Marc21
Nachnutzung vorhandener Routinen
Abbildung auf Dublin Core dokumentiert
Ähnliche Zielformate wie Endnote, BibTeX
Fertige Lösungen z.B. von OAI-PMH/DC nach RDF
→ Konvertierung erfolgt serverseitig bei Darstellung
einer Ergebnisseite
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 100
101. Technisch Umsetzung – Variante 1
Einbetten der semantischen Informationen
Nutzung der vorhandenen Dienste-Infrastruktur
Erweiterung des bestehenden XHTML-Codes
Menschen- und maschinenlesbare Daten unter einer
URL
Datenformate
RDFa
Mikroformate
Microdata
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 101
102. Einbetten semantischer Informationen
RDFa
Allgemeines Datenformat
Annotation von sichtbaren Elementen der Webseite
Beispiel
http://swb.bsz-bw.de/DB=2.1/PPNSET?PPN=309704839
http://purl.org/dc/elements/1.1/author http://purl.org/dc/elements/1.1/date
Stuckenschmidt, Heiner 2009
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 102
103. RDFa in XHTML
<p
xmlns:dc="http://purl.org/dc/elements/1.1/"
about="http://www.exmpl.com/books/wikinomics">
In his latest book
<cite property="dc:title">Wikinomics</cite>,
<span property="dc:creator">Don Tapscott</span>
explains deep changes in technology,
demographics and business.
The book is due to be published in
<span property="dc:date"
content="2006-10-01">October 2006</span>.
</p>
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 103
104. Einbetten „light“
Mikroformate
Einbetten semantischer Annotationen in Webseiten
Anwendungsspezifisch
Einfach aufgebaut
Auch für Menschen les- und verstehbar
Beispiel: COinS
Mikroformat für bibliografische Angaben
Weite Verbreitung in OPACs, Verlagsseiten
Mit RDFa kombinierbar
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 104
106. Variante 1: Nutzen und Vorteile
Bibliotheken
Geringer Aufwand
Keine eigene Infrastruktur
Semantische Annotation auch für nicht-bibliografische
Daten möglich
Termine von Veranstaltungen
Koordinaten der Gebäude
Kontaktdaten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 106
107. Technische Umsetzung – Variante 2
Separate Datenhaltung
Content-Negotiation mit Redirect für RDF/XML
MIME-Type vom Webserver auf Datenserver
Hinweis auf RDF-Daten im HTML
<link rel="alternate"
type="application/rdf+xml"
href="link_to_RDF" />
Datenserver
Hochwertige Open-Source Softwarepakete verfügbar
Datenbank und Webserver integriert
Rückverknüpfung mit den bestehenden Webdiensten über
Redirects für HTML-Content
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 107
108. Variante 2: Nutzen und Vorteile
Bibliothek
Serverseitige Konvertierung entfällt
Suche und Abfragen in den RDF-Daten möglich
Abbildung der Daten in unterschiedlichen Vokabularen
Lokale Speicherung beliebiger weiterer RDF-Daten
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 108
109. Nutzen und Vorteile allgemein
Endnutzer
„Herauskratzen“ mit Copy-und-Paste von Informationen
aus Webseiten entfällt
Browser-Plugins für Datenweitergabe an externe
Programme
CoinS/RDFa an Literaturverwaltungsprogramme
Koordinaten an Routenplaner
Öffnungszeiten an Terminplaner
Personendaten an Kontaktmanager
Erstellen eigener Anwendungen möglich
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 109
110. Nutzen und Vorteile allgemein
Bibliothek
Sofortige Serviceverbesserung
Stabile URLs für Bookmarks
Übernahme von Daten in Literaturverwaltung
Sichtbarkeit in Suchmaschinen
Einfacher Zugang zu den eigenen Daten
Erweiterungen können einheitlich auf LOD aufsetzen
Abstraktionsebene zwischen Katalog und Erweiterungen
→ Übernahme von Entwicklungen für andere
Kataloge problemlos möglich!
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 110
111. Ausblick in andere Bereiche
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 111
123. Southampton, Anwendungen
Open Data und Linked Open Data
Einfacher Zugang und rechtlich problemlose Nutzung
Etliche Anwendungen bereits vorhanden
Viele von externen Anbietern
Mobile Anwendungen für mobile Geräte
Diverse Aufbereitungen, wie Busverbindungen
Telefonbuchanwendungen
Catering
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 123
126. Außerhalb von Bibliotheken
Open Data Initiativen von Staaten
www.data.gov (USA)
www.data.gov.uk (UK)
Medienunternehmen
http://www.guardian.co.uk/data (The Guardian, UK)
http://backstage.bbc.co.uk/ (BBC UK)
Live Sciences
http://www.brain-map.org/ (Allen Institute, US)
http://cu.bio2rdf.org/ (Carleton University, Canada)
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 126
127. Links
Library of Congress
http://lcsubjects.org/
ZBW Kiel
http://zbw.eu/stw/versions/latest/about
Deutsche Nationalbibliothek
http://www.d-nb.de/hilfe/service/linked_data_service.htm
Hochschul-Bibliothekszentrum NRW
http://lobid.org/de/
Bayrischer Bibliotheksverbund
http://www.bib-bvb.de/open-data.html
http://lod.b3kat.de/doc/
University of Southhampton
http://data.southampton.ac.uk/
Universität Münster
http://lodum.de/
UB Mannheim
http://data.bib.uni-mannheim.de/
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 127
129. Worum geht es?
Linked Open Data stellt Interoperabiltät von Daten her
Technisch durch das Resource Description Framework
Rechtlich durch die freie Lizenzierung der Inhalte
Linked Open Data „brummt“
Es existieren mehrere RDF-Vokabularien zur
Beschreibung bibliografischer Einheiten und der
Bezüge zwischen diesen
Wichtige Normdaten sind als Linked Open Data
veröffentlicht
Titeldaten mehrerer Nationalbibliotheken sind ebenfalls
verfügbar
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 129
130. Was bringt es?
Daten werden sichtbar
Für Suchmaschinen
Für Browser-Plugins (z.B. Literaturverwaltung)
Für alle Interessierten
Daten werden integrierbar
Verlinkung zu externen Angeboten
Verlinkung von externen Angeboten
Standardprotokoll anstelle obskurer Web APIs
Daten werden „neu gedacht“
Modellierung der Daten je nach Verwendungszweck
Ausprobieren neuer Strukturierungselemente
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 130
131. Und jetzt? Mitmachen!
Daten freigeben
Fremde Inhalte filtern, Freie Lizenz wählen
Bestehende Datendienste nutzen (Verbünde)
Selber basteln
Rewrite-Rules im OPAC-Webserver für stabile, kurze
URLs für alle Einträge
Einbetten der bibliografischen Daten als RDF oder
Mikroformat in die bestehenden HTML-Seiten
Am Ball bleiben
Jährlicher Workshop der DINI-AG „Kompetenzzentrum
Interoperable Metadaten (KIM)“
Jährliche Konferenz „Semantic Web in Bibliotheken“
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 131
132. Fragen und Diskussion
?
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 132
133. Verwendete Materialien
Aufbau und Beispiele nach einer Vorlage von
Kai Eckert
http://www.slideshare.net/kaiec
Lizenz: http://creativecommons.org/licenses/by-sa/3.0/
MARC Beispiele
Jindřich Mynarz
http://www.slideshare.net/jindrichmynarz
Lizenz: http://creativecommons.org/licenses/by/2.5/
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 133
134. Verwendete Materialien
Tagcloud erstellt mit wordle.net auf Basis des final reports der W3C
Library Linked Data Incubator Group
Silos
Wikimedia Commons, User leaflet
http://en.wikipedia.org/wiki/File:Ralls_Texas_Grain_Silos_2010.jpg
Lizenz: Public Domain
Closed Sign:
http://openclipart.org
Lizenz: Public Domain
Linking Open Data Cloud Diagramme
Von Richard Cyganiak und Anja Jentzsch
http://lod-cloud.net/
Lizenz: http://creativecommons.org/licenses/by-sa/3.0/
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 134
135. Lizenz
Diese Präsentation steht unter der Creative Commons
Attribution-ShareAlike Lizenz
http://creativecommons.org/licenses/by-sa/3.0
27. April 2012 Jahresversammlung des VdB Regionalverbands Südwest, Mainz 135