3. Welche Objekte bekommen DataCite-DOI?
Im Fokus stehen Forschungsdaten aus akademischen,
non-profit Einrichtungen (Datenzentren)
Kriterien:
• Qualitä t der Daten
• Qualitä t der Metadaten
• Dauerhaftigkeit des Angebots
4. Deutsche DataCite-Partner
für Kunden aus den jeweiligen Fachgebieten:
• Lebenswissenschaften
• Sozialwissenschaften
• Technik & Naturwissenschaften
• Wirtschaftswissenschaften
6. Erste Schritte
• Datenzentrum und DataCite-Partner (Allocator) schließen
Kooperationsvereinbarung
• Allocator richtet für das Datenzentrum den Metadata
Store (MDS) Account ein
• Allocator weist Datenzentrum ein oder mehrere Prä fixe
zu
• Allocator unterstützt Datenzentrum beim praktischen
Einstieg (Testumgebung, Metadatenbeispiele, ...)
7. Rahmenbedingungen: Rechte und Pflichten
Datenzentrum
• Langzeitarchivierung: für mindestens 10 Jahre
• Qualitä tssicherung
• Metadatenzulieferung
• Bereitstellung der sogenannten Landing Pages
• Pflege und Persistenz
7
8. Rahmenbedingungen: Rechte und Pflichten
(2)
DataCite-Partner (Allocator)
• Prä fix-Vergabe
• dauerhafte Gewä hrleistung der Auflösbarkeit der
Identifier auf die vom Datenzentrum genannte Ziel-URL
• dauerhafte Bereitstellung der technischen Infrastruktur
(in Kooperation mit DataCite)
• Bereitstellung eines Suchinterface
8
9. DOI-Bestandteile
Jeder doi-Name ist eine einzigartige Folge
alphanumerischer Zeichen und besteht aus zwei Teilen:
Prä fix-Vergabe durch DataCite-Partner,
Suffix-Vergabe durch Datenzentrum
9
10. Suffix-Gestaltung
Beispiele:
• Ursprungs-DOI: 10.1234/abc123
• DOI einer neuen Version: 10.1234/abc123.1
• DOI eines Teils: 10.1234/abc123/2
Zugelassene Zeichen:
A – Z . (Punkt)
a – z - (Bindestrich)
0 – 9 _ (Unterstrich)
: (Doppelpunkt) / (Schrä gstrich)
10
11. Verträ ge & Kosten
„Die DOI-Vergabe ist ab Januar 2013 für
akademische Einrichtungen in Deutschland
kostenlos“.
11
15. Das DataCite Metadaten Schema
• Vorgabe der IDF, ein Mindestmaß an identifizierenden Metadaten
vorzuhalten.
• Aktuelle Version ist 3.0.
• Ein Metadatenschema für die Verlinkung von Daten und anderen
Objekten.
• Disziplinübergreifend.
• Auf Dublin Core basierend.
• DOI-Namen des Schemas:
• Dokumentation: doi:10.5438/0005
• Schema Definition: doi:10.5438/0006
16. Das DataCite Metadaten Schema
Pflichtfelder:
Identifier (mit type Attribut)
Creator (mit type und nameIdentifier Attributen)
Title (mit optionalem type Attribut)
Publisher
PublicationYear
Zitierung:
Creator (PublicationYear): Title. Publisher. Identifier
17. Das DataCite Metadaten Schema
‚Recommended‘ und Optionale Felder:
Subject (mit scheme Attribut)
Contributor (mit type und nameIdentifier Attributen)
Date (mit type Attribut)
Language
ResourceType (mit description Attribut)
AlternateIdentifier (mit type Attribut)
RelatedIdentifier (mit type und relationType Attributen)
Size
Format
Version
Rights
Description (mit type Attribut)
GeoLocation (mit point, box und place)
18. Metadata Store (MDS)
• Registrierung und Aktualisierung von DOI-Namen.
• Speicherung der Metadaten.
• Zugriff über API oder UI.
19. • Einfache API nach REST-Prinzipien
• ansprechbar aus praktisch jeder Programmiersprache
• gut integrierbar in bestehenden Systeme
• Verschlüsselter Datenverkehr (HTTPS)
• HTTP Basic authentication
• Dokumentation: https://mds.datacite.org/static/apidoc
MDS API
PUT /metadata/10.5072/TEST HTTP/1.1
Host: mds.datacite.org
Authorization: Basic
Rk9PLkJBUjoxMjM0NTY3OA==
Content-Type: application/xml;charset=UTF-8
<?xml version=“1.0“ encoding=“UTF-8“>
…
21. OAI-PMH Data Provider
• Stellt Metadaten aus dem MDS zum Harvesten bereit mit dem
Open Archives Initiative Protocol for Metadata Harvesting
(OAI-PMH).
• Metadaten sind CC0, aber Daten / Objekte müssen nicht
Open Access sein!
• Jeder kann diesen Service nutzen. Metadaten werden
u.a. bereits geharvestet von:
• GetInfo / TIB
• Thomson/Reuters -> Data Citation Index
• Base (Bielefeld)
• Verfügbare Metadaten-Formate:
• OAI Dublin Core (oai_dc)
• OAI DataCite (oai_datacite)
• DataCite Direct (datacite)
22. Statistiken
• Statistiken zu Registrierungen und Aufrufen von DOI-Namen
• Aufgelöst nach DataCite Mitglied, Datenzentrum und Präfix
23. Services in Kooperation mit CrossRef
http://crosscite.org/citeproc/
Ein Citation Formater, der über 100 verschiedene Zitat-
Formate ausgibt.
http://crosscite.org/cn/
Mit Content Negotiation ist es möglich, verschiedene
Medientypen eines registrierten Objektes aufzurufen
(reine Maschinen-Interaktion).
24. Content Negotiation
Direktes Auflösen zum Zitat:
http://data.datacite.org/application/x-datacite+text/10.5524/10000
Li, j; Zhang, G; Lambert, D; Wang, J (2011): Genomic data from
Emperor penguin. GigaScience. http://dx.doi.org/10.5524/100005
25. Content Negotiation
Direktes Auflösen zu RDF Metadaten:
http://data.datacite.org/application/rdf+xml/10.5524/100005
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-
ns#" xmlns:owl="http://www.w3.org/2002/07/owl#"
xmlns:j.0="http://purl.org/dc/terms/" > <rdf:Description
rdf:about="http://dx.doi.org/10.5524/100005">
<j.0:identifier>10.5524/100005</j.0:identifier> <j.0:creator>Li,
J</j.0:creator> <j.0:creator>Zhang, G</j.0:creator>
<j.0:creator>Wang, J</j.0:creator>
<owl:sameAs>doi:10.5524/100005</owl:sameAs>
<owl:sameAs>info:doi/10.5524/100005</owl:sameAs>
<j.0:publisher>GigaScience</j.0:publisher> <j.0:creator>Lambert,
D</j.0:creator> <j.0:date>2011</j.0:date> <j.0:title>Genomic
data from the Emperor penguin (Aptenodytes forsteri)</j.0:title>
</rdf:Description></rdf:RDF>