Entstehung der Forschungsdaten-Policy an der Humboldt-Universität zu Berlin
2014 05-15 netz-ag-linked_data
1. technische universität dortmund Universitätsbibliothek
Hans-Georg Becker | UB Dortmund
Netz-AG | Bensberg | 15.05.2014
Linked Data als Kernkonzept
2. Hans-Georg Becker | UB Dortmund
Netz-AG | Bensberg | 15.05.2014
Universitätsbibliothektechnische universität dortmund
2
Metadatenmanagement an der UB Dortmund
Bei der Einführung eines (Meta-)Datenmanagements an der
UB Dortmund wurden (derzeit vier) Prinzipien definiert:
1. Jeder Datensatz hat ein Mastersystem und
Masterformat!
2. Linked Data als Kernkonzept!
3. Es gibt nur ein Repositorium für digitale Objekte (Bezug
zum UniArchiv und zum Repo)!
4. Im ILS wird so wenig wie möglich und so viel wie nötig
erfasst. (ILS als Inventarisierungswerkzeug)!
3. Hans-Georg Becker | UB Dortmund
Netz-AG | Bensberg | 15.05.2014
Universitätsbibliothektechnische universität dortmund
3
Linked Data als Kernkonzept
„Links anstatt Strings“
„Catalinking“ anstatt „Cataloging“
Folgen:
Verstärkte Anwendung der GND
Verstärkte Anwendung von Systematiken und sonstigen
kontrollierten Vokabularen
Repräsentation der Daten nach RDF
4. Hans-Georg Becker | UB Dortmund
Netz-AG | Bensberg | 15.05.2014
Universitätsbibliothektechnische universität dortmund
4
Aktuelle Linked Data Projekte
Bibliographische Daten ins Web
Bestandsdaten ins Web
Dazu notwendig:
Organisationsstruktur ins Web
Sammlungsbeschreibung der UB Dortmund ins Web
Gebäudestruktur der TU Dortmund ins Web
Modellierung der Daten
Lizenz => (Meta-)Datenpolicy
Datenplattform
5. Hans-Georg Becker | UB Dortmund
Netz-AG | Bensberg | 15.05.2014
Universitätsbibliothektechnische universität dortmund
5
Bibliographische Daten ins Web – Ansatz 1
Daten als FRBRoo-Application Profile
Modellierung der Daten nach den Konzepten des CIDOC
CRM bzw. FRBRoo (vgl. FRBRoo – eine Anwendung in
The LODLAM Mercury, Volume 1, 2013)
Beispiel: mbW / RDF/TURTLE
Graph im Triple Store:
crm-ap-bib
6. Hans-Georg Becker | UB Dortmund
Netz-AG | Bensberg | 15.05.2014
Universitätsbibliothektechnische universität dortmund
6
Bibliographische Daten ins Web – Ansatz 2
Daten als schema.org: schema-bib
https://schema.org/
http://www.w3.org/community/schemabibex/ (W3C Schema
Bib Extend Community Group)
Wird von den großen Suchmaschinen gelesen, wenn in
Webseiten als RDFa oder Microdata eingebettet.
Graph im Triple Store: schema-bib
7. Hans-Georg Becker | UB Dortmund
Netz-AG | Bensberg | 15.05.2014
Universitätsbibliothektechnische universität dortmund
7
Bibliothekarische Bestandsdaten ins Web -1-
Daten als FRBRoo-Application Profile: crm-ap-holdings
Work in progress
Daten als schema.org: schema-holdings
Work in progress
Weitere Daten:
Facility-Data: crm-ap-facilities
Beispiel: Campus Nord der TU Dortmund
Organization-Data: crm-ap-org
Work in progress
Collection-Data: crm-ap-collections
Work in progress
8. Hans-Georg Becker | UB Dortmund
Netz-AG | Bensberg | 15.05.2014
Universitätsbibliothektechnische universität dortmund
8
Bibliothekarische Bestandsdaten ins Web -2-
Organization-Data: crm-ap-org
9. Hans-Georg Becker | UB Dortmund
Netz-AG | Bensberg | 15.05.2014
Universitätsbibliothektechnische universität dortmund
9
Bibliothekarische Bestandsdaten ins Web -3-
Collection-Data: crm-ap-collections
10. Hans-Georg Becker | UB Dortmund
Netz-AG | Bensberg | 15.05.2014
Universitätsbibliothektechnische universität dortmund
10
Linked Data Infrastruktur
Linked Media Framework (LMF)
Version 3.1.0
PostgreSQL-DB als Backend
Instanz
Resources-API
Search-API
SPARQL-Endpoint
Import / Publish
MODS-to-RDF/TURTLE
CSV-to-RDF/TURTLE
11. Hans-Georg Becker | UB Dortmund
Netz-AG | Bensberg | 15.05.2014
Universitätsbibliothektechnische universität dortmund
11
Bibliographische Daten ins Web - Prozess
Programm:
Java, Jedis, Jackson, OpenRDF;
baut ThreadPool auf, um Daten parallel an den Triplestore zu „posten“
LMF:
LDPath
Solr-Admin
Daten aktuell: Hochschulbibliographie UA-R
12. Hans-Georg Becker | UB Dortmund
Netz-AG | Bensberg | 15.05.2014
Universitätsbibliothektechnische universität dortmund
12
Bibliothekarische Bestandsdaten ins Web – Prozess
Programm: Java, HttpServlet als RESTful Webservice,
Jackson, OpenRDF
Datenladen per CSV-Batchprozess oder per Webformular
13. Hans-Georg Becker | UB Dortmund
Netz-AG | Bensberg | 15.05.2014
Universitätsbibliothektechnische universität dortmund
13
Es gibt noch einiges zu tun, …
Aber: Im Laufe des Sommers soll die Datenplattform inkl.
Datenpolicy online gehen.