1. technische universität Universitätsbibliothek
dortmund
Semantic Web in Bibliotheken mal praktisch
Linked Open Data
:: ZBIW-Seminar ::
Hans-Georg Becker
3. Resource Description Framework (RDF)
Formale Sprache zur Darstellung von
strukturierten Daten -> XML
Formale Sprache zur Darstellung von
strukturierten Informationen mit Hauptaugenmerk auf
der Erhaltung der Semantik der Information und der
Verknüpfung von Ressourcen untereinander -> RDF
Jede Ressource wird eindeutig und dauerhaft
beschrieben -> URI
Linked Open Data 3
:: ZBIW-Seminar ::
Hans-Georg Becker
4. Die Bibliothek als Organisation
- benötigt ein URI
- hbz-Service: lobid.org/organisation prägt solche URIs
auf Basis des Online-ISIL-Verzeichnisses und der
MARC Organization Code Database
- Beispiel:
http://lobid.org/organisation/DE-290
- Also bitte nichts neues erfinden! Das hbz hat das für
uns schon gemacht
Linked Open Data 4
:: ZBIW-Seminar ::
Hans-Georg Becker
5. Semantische Anreicherung und Annotation von
HTML mit RDFa
RDFa ist ein Ansatz, bei dem in (X)HTML eingebettet wird.
Dazu wurde die (X)HTML-Syntax geringfügig erweitert. RDFa ist ausdrucksstark, da
man nicht auf bestimmte Themengebiete beschränkt ist, sondern mittels geeigneter
Ontologien Dinge aus allen Gebieten beschreiben kann.
<div about="http://lobid.org/organisation/DE-290" typeof="foaf:Organization"
class="Organisation">
<h1 property="foaf:name">Universitätsbibliothek Dortmund</h1>
<h2>ISIL: <span property="dcterms:identifier">DE-290</span></h2>
<div rel="geo:location" class="location">
<div typeof="rdf:Description“>
<span property="geo:lat" content="51.4943000"/>
<span property="geo:long" content="7.4154900"/>
</div>
</div>
</div>
Linked Open Data 5
:: ZBIW-Seminar ::
Hans-Georg Becker
6. Ein weiteres Beispiel mit RDFa
Online-Findbücher des Universitätsarchivs der TU Dortmund (im Aufbau, geht im Januar 2011
online)
<div xmlns:foaf="http://xmlns.com/foaf/0.1/"
xmlns:dcterms="http://purl.org/dc/terms/"
xmlns:pvn="http://purl.org/archival/provenance/0.1#"
xmlns:bibo="http://purl.org/ontology/bibo/"
xmlns:vcard="http://www.w3.org/2006/vcard/ns#">
<div about="#collection" typeof="pvn:Collection">
<div property="dcterms:title" content="Nachlass Ulrich Freyhoff"></div>
<div property="dcterms:creator" content="Dr. Stephanie Marra"></div>
<div property="dcterms:extent" content="Nachlass Prof. Dr. Ulrich Freyhoff (>
Teilnachlass im Rara-Raum: YQ 274)</emph><lb/><lb/>Ulrich Freyhoff wurde am [ttt]. [mm].1923 in
Oranienburg geboren. [...]"></div>
<div rel="pvn:heldBy">
<div about="http://lobid.org/organisation/DE-290" typeof="foaf:Organization">
<span property="foaf:name" content="Archiv der TU Dortmund"></span>
</div>
</div>
</div>
</div>
Linked Open Data 6
:: ZBIW-Seminar ::
Hans-Georg Becker
7. HTML-Attribute für RDFa
• „about“ identifiziert Subjekt
• „property“ identifiziert Prädikat
• „content“ identifiziert Objekt
• Wenn kein „content“ Attribut angegeben ist wird der Textknoten
benutzt
• „datatype“ identifiziert den Datentyp für das Objekt
• „rel“ gibt Informationen über den Gebrauch der Ressource
• „href“ identifiziert das Ressourcen Objekt
• „rev“ = „rel“ Rückwärts
Linked Open Data 7
:: ZBIW-Seminar ::
Hans-Georg Becker
8. Kleiner Exkurs: Prägen von URIs
- Wie wähle ich den URI? Möglichst Standards
z.B. LoC- oder OCLC-Nummer, OpenLibrary-ID, ISBN,
ISSN …
- Baut man Daten und deren URIs automatisch bei
Veränderung der Daten immer wieder neu auf, so muss
die Erzeugung der URIs reproduzierbar sein! -> nicht
trivial
- Wie definiert man eine stabile Domain? Z.B.
http://www.purl.org
Linked Open Data 8
:: ZBIW-Seminar ::
Hans-Georg Becker
9. Weitere Technik: Mikroformate
Mikroformate sind ein Markup-Format zur semantischen
Annotation von HTML oder XHTML.
Mikroformat-Annotationen können leicht aus Webseiten
extrahiert werden und machen weiteren Programmen
(etwa Suchmaschinen) die Bedeutung des Seiteninhalts
verständlich.
Jedes Mikroformat wurde für ein spezielles Themen-
oder Wissensgebiet entwickelt.
(vgl. Seite „Mikroformate“. In: Wikipedia, Die freie Enzyklopädie. Bearbeitungsstand: 23. September 2010, 07:37
UTC. URL: http://de.wikipedia.org/w/index.php?title=Mikroformate&oldid=79440500 (Abgerufen: 28. November
2010, 09:01 UTC) )
Linked Open Data 9
:: ZBIW-Seminar ::
Hans-Georg Becker
10. Mikroformate für Termine: hCalendar
hCalendar basiert auf dem Standard iCalendar / iCal
(RFC2445)
Die Definition des Mirkroformats wird durch ein link-Tag
im Header der HTML-Datei angegeben:
<link rel="profile"
href="http://microformats.org/profile/hcalendar"
/>
Linked Open Data 10
:: ZBIW-Seminar ::
Hans-Georg Becker
11. Beispiel für hCalendar: Programm InetBib-Tagung
<div id="i-head" class="vevent">
<img src="http://www.ub.uni-dortmund.de/inetbib2010/logos/logo2010.jpg"
alt="Logo Inetbib-Tagung" height="98" width="430" class="i-logo" />
<br />
<span class="summary">11. InetBib-Tagung</span>
vom <abbr title="20100414T1230" class="dtstart">14.</abbr>
bis <abbr title="20100416T1300" class="dtend">16. April 2010</abbr>
in <span class="location">Rämistrasse 101, Zürich</span>
</div>
Linked Open Data 11
:: ZBIW-Seminar ::
Hans-Georg Becker
12. Mikroformate für Kontaktinformationen: hCard
hCard basiert auf dem Standard vCard (RFC2426)
Hier lautet der Eintrag im HTML-Header:
<head
profile="http://microformats.org/profile/hcard">
Oder
<link rel="profile"
href="http://microformats.org/profile/hcard">
Linked Open Data 12
:: ZBIW-Seminar ::
Hans-Georg Becker
13. Beispiel für hCard: Ansprechpartner der UB Do
<tr class="vcard" id="hcard-Hans-Georg-Becker">
<td headers="name" class="fn n">
<span class="given-name">Hans-Georg</span>
<span class="family-name">Becker</span>
</td>
<td headers="tele" class="tel">
<span class="type unsichtbar">work </span>0231 / 755 – 4036
</td>
<td headers="mail">
<a class="email" href="mailto:hans-georg.becker@ub.tu-
dortmund.de">hans-georg.becker@ub.tu-dortmund.de</a>
</td>
</tr>
Linked Open Data 13
:: ZBIW-Seminar ::
Hans-Georg Becker
14. Mikroformate für bibliographische Daten
COinS – ContextObjects in Spans
Basiert auch dem Standard Open URL / Z39.88
Keine Definition im Header der HTML-Datei notwendig.
Ermöglich die Übernahme von bibliographischen
Informationen z.B. in Literaturverwaltungssysteme wie
Zotero oder Citavi
Linked Open Data 14
:: ZBIW-Seminar ::
Hans-Georg Becker
15. Beispiel für COinS: Neuerwerbungslisten
<a href="http://www.ub.tu-dortmund.de/katalog/titel/1302773">
<strong>Casters, Matt</strong></a><br>
Pentaho Kettle solutions : building open source ETL solutions with Pentaho Data
Integration<br>
Indianapolis, Ind.: Wiley, 2010<br>
ISBN: 978-0-470-63517-9<br>
Zweigstelle: BI | Abteilung: BI | Signatur: 3331/Cast
<span class="Z3988" title="ctx_ver=Z39.88-
2004&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Abook&rft.genre=book&rf
t.btitle=Pentaho+Kettle+solutions&rft.title=Pentaho+Kettle+solutions&rft.a
u=Casters,+Matt&rft.date=2010&rft.pub=Wiley&rft.place=Indianapolis,+In
d.&rft.isbn=978-0-470-63517-9&rft.edition=">
<br>
</span>
...
</p>
Linked Open Data 15
:: ZBIW-Seminar ::
Hans-Georg Becker
16. Beispiele für COinS:
… gibt es reichlich
-Blogbeiträge werden mittlerweile mit COinS versehen
-Die Neuerwerbungslisten der UB Dortmund
-Unser Katalog (ja, geht sogar mit SISIS ;-) )
-Und unser Zeitschrifteninformationsdienst ZID
-…
Linked Open Data 16
:: ZBIW-Seminar ::
Hans-Georg Becker
17. Was passiert nun mit den so veröffentlichten
Informationen?
Es gibt derzeit drei interessante Anwendungsformen:
- Der Browser als „Agent“
- Aggregation:
- Crawling, z.B. durch Google & Co.
- Wahrscheinlicher: Verwendung von GRDDL
Linked Open Data 17
:: ZBIW-Seminar ::
Hans-Georg Becker
18. Anwendung: User Agents, Browser Add-Ons
Browser als „Information broker“ kommt der Idee der intelligenten Softwareagenten
des Semantic Web schon sehr nahe.
Beispiele für Firefox: Plugins „Operator“ & „Tails“
Linked Open Data 18
:: ZBIW-Seminar ::
Hans-Georg Becker
19. Das Projekt GRDDL
- GRDDL isteine Methode, um RDF-Tripel aus XML-, also auch
aus XHTML-Dokumenten, zu extrahieren, um mittels Semantic
Web Technologien, wie der Abfragesprache SPARQL auf die
Daten zugreifen zu können.
- W3C bezeichnet GRDDL auch als „Bridge Between
HTML/Microformats and Semantic Web“ .
- GRDDL nutzt dabei den XSLT-Standard zur Transformation von
XML-Dialekten.
Linked Open Data 19
:: ZBIW-Seminar ::
Hans-Georg Becker
20. Ein Beispiel: Transformation von XHTML-Dokumenten
Referenzierung des XSLT-Skripts im <head>-Tag
- entweder das XSLT-Skript direkt referenziert
[...]
<head profile="http://www.w3.org/2003/g/data-view">
<title>Webseite mit hcalender-Informationen</title>
<link rel="transformation" href="http://www.w3.org/2002/12/cal/glean-hcal"/>
</head>
[...]
- oder indirekt über ein spezielles Metadatenprofil, in dem sich das Skript befindet
[...]
<head profile="http://purl.org/NET/erdf/profile">
<title>Webseite mit eRDF</title>
</head>
[...]
Linked Open Data 20
:: ZBIW-Seminar ::
Hans-Georg Becker
21. User Agent: W3C GRDDL Service
Linked Open Data 21
:: ZBIW-Seminar ::
Hans-Georg Becker
22. Tools für GRDDL
• Online Demo für Transformationen mittels GRDDL
vom W3C (http://www.w3.org/2004/01/rdxh/grddl-xml-
demo )
• GleanPy (http://www.w3.org/2003/g/glean.py )
Python Script für GRDDL Transformationen
• Raptor RDF Parser Toolkit (http://librdf.org/raptor/ )
Open Source C Bibliothek zum auslesen von RDF
Trippeln
Linked Open Data 22
:: ZBIW-Seminar ::
Hans-Georg Becker
23. Let‘s do it!
Linked Open Data 23
:: ZBIW-Seminar ::
Hans-Georg Becker