Präsentation im Rahmen des Viertes Treffen des Arbeitskreises Wissenschaftliche Archive in Berlin,
"Übernahme und Bewertung von Forschungsdaten" am 09. März 2016 in der TU Berlin
Forschungsdaten und Forschungsdateninfrastrukturen in den Wirtschaftswissensc...
Forschungsdaten – Nach der Publikation ist vor der Archivierung!
1. http://www.ianus-fdz.de Maurice Heinrich
Forschungsdaten –
Nach der Publikation
ist vor der Archivierung!
Übernahme und Bewertung von Forschungsdaten,
Viertes Treffen des Arbeitskreises Wissenschaftliche Archive in Berlin,
TU-Berlin, 09. März 2016
3. 3
Wie sieht der klassische Forschungsprozess heutzutage in den
Altertumswissenschaften aus Sicht der Forschungsdaten aus?
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
4. 4
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
Wie sieht der klassische Forschungsprozess heutzutage in den
Altertumswissenschaften aus Sicht der Forschungsdaten aus?
»» Einbahnstraße – mit Publikation sind Forschungsrohdaten der
Forschung dritter weitestgehend entzogen
»» Forschungsrohdaten werden selten mit Forschern geteilt
»» Forschungsrohdaten werden noch seltener veröffentlicht
5. 5
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
1
DIGITALE FORSCHUNGSDATEN IN DEN ALTERTUMSWISSENSCHAFTEN
STAKEHOLDERANALYSE 2013 ZU FORSCHUNGSDATEN IN DEN ALTERTUMSWISSENSCHAFTEN.
TEIL 2: KOMBINIERTE AUSWERTUNG & INTERPRETATION
6. 6
Erhebung
Wie stellt sich ein durchschnittliches archäologisches
Forschungsprojekt aus datentechnischer Sicht dar?
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
7. 7
Testdaten aus altertumswissenschaftlichen Forschungsprojekten
»» 20 altertumswissenschaftliche Institutionen
»» aus verschieden Disziplinen*
»» aus laufenden & abgeschlossenen Projekten
»» nicht explizit für die Archivierung aufbereitet
›› keine Auswahl, Formatvalidierung, Qualitsätsicherung etc.
›› unvollständige Dokumentation, Metadaten, Lizenzen etc.
›› oft nur Teile aus größeren Datenbeständen
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
9. 9
Quantitäten Insgesamt
»» 684,9 GB Speicher
»» 237.403 Dateien in 7.537 Ordnern
»» max. Ordnertiefe: 12 Ebenen
»» 462 Dateiformate
Durchschnittliches archäologisches Projekt (Mittelwert)
»» 38 GB Speicher
»» 12.425 Dateien in 380 Ordner
»» max. Ordnertiefe: 4 Ebenen
»» 40 Dateiformate
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
10. 10
Digitale Forschungsdaten in den Altertumswissenschaften sind
»» inhaltlich und technisch heterogen
»» einmalig, weil oft nicht reproduzierbar
»» für lange Zeiträume forschungsrelevant
»» institutionell verteilt und disparat
»» zum größten Teil unpubliziert
»» oftmals dem wissenschaftlichen Diskurs entzogen
»» für Dritte nur selten nachnutzbar
»» für die Zukunft gefährdet, da ein Daten- und Wissensverlust droht
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
12. 12
1. ALTERTUMSWISSENSCHAFTEN – HEUTE
Auch unpublizierte (Roh-)Daten besitzen hohe wissen-
schaftliche Bedeutung und benötigen kontinuierliche Pflege!
13. 13
FAZIT
»» Im Sinne der guten wissenschaftlichen Praxis sollten
digitale Forschungsdaten
›› ausreichend dokumentiert sein
›› von Datenkuratoren gepflegt werden
›› nachhaltig und langfristig archiviert werden
›› niedrigschwellig und online zur Verfügung gestellt werden
›› in der Nachnutzung immer kostenfrei sein
›› über eine möglichst offene Lizenz verfügen
ALTERTUMSWISSENSCHAFTEN – MORGEN
15. 15
2. SICHERN – BACKUP – ARCHIVIEREN
Sicherst du noch oder archivierst du schon?
16. 16
Differenzierung – Begriffsbedeutung
»» Sichern / Speichern –
Daten speichern; Daten aus dem Arbeitsspeicher eines
Programms auf einen Datenspeicher übertragen
»» Backup –
Abbild eines (Daten-)Speichers mit dem Zweck, den Inhalt dessen,
falls er beschädigt oder zerstört worden ist, wiederherzustellen
»» digitale (Langzeit-)Archivierung –
Erfassung, (langfristige) Aufbewahrung sowie die Erhaltung von
dauerhafter Verfügbarkeit von digitalen Informationen
2. SICHERN – BACKUP – ARCHIVIEREN
19. 19
»» Auswahl – signifikante Eigenschaften
»» Vorbereitung von Forschungsdaten
›› Datenformatsanpassungen
›› Metadatenanreicherung
›› Dokumenation
»» Kontaktaufnahme Archiv – Datenübergabe
»» Erste initiale Überprüfung durch Datenkuratoren
›› Preservation Planing
»» Finale Absprache Datengeber – Datenkurator
»» Beginn Datenkuratierung
3. VORBERREITENDE ARBEITSSCHRITTE
20. 20
3. VORBERREITENDE ARBEITSSCHRITTE
»» Auswahl – signifikante Eigenschaften
»» Vorbereitung von Forschungsdaten
›› Datenformatsanpassungen
›› Metadatenanreicherung
›› Dokumenation
»» Kontaktaufnahme Archiv – Datenübergabe
»» Erste initiale Überprüfung durch Datenkuratoren
›› Preservation Planing
»» Finale Absprache Datengeber – Datenkurator
»» Beginn Datenkuratierung
21. 21
3. VORBERREITENDE ARBEITSSCHRITTE
AIP -
Archivierungsformate
DIP -
Präsentationsformate
PDF/A-1 pdf präferiert pdf/A-2 pdf/A
PDF/A-2 pdf präferiert pdf/A-2 pdf/A
PDF/A-3 pdf akzeptiert pdf/A-2 + weitere Dateien pdf/A
andere PDF-Varianten pdf akzeptiert pdf/A-2 pdf/A
Portable Document Format (PDF/A) pdf präferiert pdf/A pdf/A
andere PDF-Varianten pdf akzeptiert pdf/A-2 pdf/A
OpenDocument Format odt präferiert odt + pdf/A odt, pdf/A
Microsoft Office XML docx präferiert docx + pdf/A docx, pdf/A
Microsoft Word doc akzeptiert docx + pdf/A docx, pdf/A
Rich Text Format rtf akzeptiert docx + pdf/A docx, pdf/A
Open Office XML sxw akzeptiert odt + pdf/A odt, pdf/A
Reiner Text, plain text txt präferiert txt txt
Strukturierter Text, Markup
xml, sgml, html etc. +
dtd, xsd etc.
präferiert xml, sgml, html etc. + dtd, xsd etc. xml, sgml, html etc. + dtd, xsd etc.
Baseline TIFF v. 6, unkomprimiert tiff, tif präferiert tiff (unkomprimiert v.6) jpeg
Adobe Digital Negative dng präferiert dng dng, jpeg
Portable Network Graphics png akzeptiert tiff (unkomprimiert v.6) png
Joint Photographic Expert Group jpeg, jpg akzeptiert tiff (unkomprimiert v.6) jpeg
Graphics Interchange Format gif akzeptiert tiff (unkomprimiert v.6) png
Windows Bitmap bmp akzeptiert tiff (unkomprimiert v.6) png
Photoshop (Adobe) psd akzeptiert tiff (unkomprimiert v.6) png, jpeg
CorelPaint cpt akzeptiert tiff (unkomprimiert v.6) png, jpeg
JPEG2000 jp2, jpx akzeptiert tiff (unkomprimiert v.6) jp2, jpx, jpeg
RAW image format nef, crw etc. akzeptiert dng jpeg
Comma Separated Values csv präferiert csv csv
Tab Separated Values tsv präferiert csv csv
OpenDocument Format ods präferiert ods ods
Microsoft Office XML xlsx präferiert xlsx xlsx
Strukturierter Text, Markup
xml, html etc. + dtd,
xsd etc.
präferiert xml, html etc. + dtd, xsd etc. xml, html etc. + dtd, xsd etc.
Portable Document Format (PDF/A) pdf akzeptiert pdf/A pdf/A
Open Office XML sxc akzeptiert ods ods
RASTERGRAFIKEN
DATEIFORMATE UND DATENMIGRATION
– Januar 2016 –
SIP - Abgabeformate
PDF-
DOKUMENTE
TEXTE/DOKUMENTETABELLEN
22. 22
3. VORBERREITENDE ARBEITSSCHRITTE
»» Auswahl – signifikante Eigenschaften
»» Vorbereitung von Forschungsdaten
›› Datenformatsanpassungen
›› Metadatenanreicherung
›› Dokumenation
»» Kontaktaufnahme Archiv – Datenübergabe
»» Erste initiale Überprüfung durch Datenkuratoren
›› Preservation Planing
»» Finale Absprache Datengeber – Datenkurator
»» Beginn Datenkuratierung
23. 23
3. VORBERREITENDE ARBEITSSCHRITTE
Bezeichnung Kurzdefinition
Identifizierung -
Projekttitel
Verbindliche Kurzbezeichnung des Projektes.
Identifizierung -
Alternativtitel
Ggf. alternative Titel für ein Projekt.
Identifizierung -
Projektnummer(n)
Nummern oder Kennungen, die z.B. innerhalb der durchführenden Organisation oder von Mittelgebern
verwendet wird, um das Projekt eindeutig identifizieren zu können.
Kurzbeschreibung
Knappe Angaben zur Fragestellung, zum Verlauf und Ergebnis des Projektes sowie Skizzierung der
Datensammlung (insgesamt ca. 100-300 Worte).
Schlagworte -
Fachdisziplinen
Stichworte, die die beteiligten Disziplinen und Fächer benennen. Sofern die Stichworte auf publizierten
Standards oder internen Thesauri beruhen, müssen diese mitangegeben werden.
Schlagworte -
Inhalt
Stichworte, die den Inhalt der Datensammlung benennen., z. B. zu Materialgruppen, Fundstellen-
Klassifizierung, Quellenarten, Kulturgruppen etc. Sofern die Stichworte auf publizierten Standards oder
internen Thesauri beruhen, müssen diese mitangegeben werden.
Schlagworte -
Methoden
Stichworte, die die eingesetzten Forschungsmethoden beschreiben. Sofern die Stichworte auf publizierten
Standards oder internen Thesauri beruhen, müssen diese mitangegeben werden.
Ausdehnung –
Geografisch-1
Detaillierte Angaben zur räumlichen Ausdehnung oder zum Fundort des untersuchten Gegenstandes
mittels geografischer Koordinaten. Die maximale Ausdehnung kann als Bounding Box angegeben werden.
Ausdehnung –
Geografisch-2
Sprachliche Beschreibung des untersuchten Gegenstandes mittels Ortsangaben mit Land, Stadt, Kreis,
Straße, Gemarkung etc. Sofern Namen sich im Lauf der Zeit geändert haben, dies gesondert vermerken.
Sofern eine Referenz zu einer Geo-Ressource oder einem Gazetteer existiert, sollte diese ebenfalls
angegeben werden.
Ausdehnung –
zeitlich
Chronologische Angaben zum untersuchten Gegenstand, entweder als Periodenbezeichnung und/oder mit
groben/genauen Jahresangaben. Sofern die Stichworte auf publizierten Standards oder internen Thesauri
beruhen, müssen diese mitangegeben werden.
Primärforscher -
Person
Personen, die entweder für das Projekt als Ganzes, für das Datenmanagement oder für die Erzeugung
bestimmter Datenarten zentral bzw. verantwortlich sind. Hier ist eine Kontaktadressen erforderlich und die
aktuelle/letzte institutionelle Zugehörigkeit, damit die Personen bei Rückfragen erreicht werden kann.
Eigentümer -
Organisation
Organisation, der die unter "Primärforscher" genannten Personen angehören, oder die nach Ausscheiden
derselben für die Daten verantwortlich ist, im weitesten Sinne also Eigentümer der Daten ist. Hier ist eine
Kontaktadresse erforderlich, damit die Organisation bei Rückfragen erreicht werden kann.
Finanzierung
Nennung der Organisation(en) / (Dritt-)Mittelgeber, durch die das Projekt finanziert wurde. Es sollte jeweils
der Zeitraum der Finanzierung angegeben werden.
Veröffentlichung -
Projektdaten
Wenn die hier beschriebene Datensammlung des Projektes bereits an anderer Stelle veröffentlicht / online
gestellt wurde, bitte entsprechende Angaben machen, z. B. durch Nennung der Organisationen,
Datenarchive, Online-Ressourcen etc.
Veröffentlichung
– Ergebnisse
Analoge oder digitale Publikationen zu Ergebnissen des Projektes oder zur Datensammlung des Projektes,
ausführliche bibliographische Angaben (ohne fachspezifische Abkürzungen) unter Nennung des Verlages
erforderlich.
Dauer - Projekt Anfangs- und Enddatum des Projektes.
PROJEKTBEZOGENE METADATEN
– vorläufiger Stand –
24. 24
3. VORBERREITENDE ARBEITSSCHRITTE
»» Auswahl – signifikante Eigenschaften
»» Vorbereitung von Forschungsdaten
›› Datenformatsanpassungen
›› Metadatenanreicherung
›› Dokumenation
»» Kontaktaufnahme Archiv – Datenübergabe
»» Erste initiale Überprüfung durch Datenkuratoren
›› Preservation Planing
»» Finale Absprache Datengeber – Datenkurator
»» Beginn Datenkuratierung
31. 31
IT-Empfehlungen für den nachhaltigen Umgang
mit digitalen Daten in den Altertumswissenschaften
»» Inhaltliche Zielsetzung
›› Langfristige Lesbarkeit und Nutzbarkeit von Daten
›› Hinweise zu Formaten und Metadaten
›› Unterscheidung von Dateiformaten und
Forschungsmethoden
»» konkrete Praxistipps und empfohlene Mindeststandards
›› zu technischen Aspekten – Dateiformaten
›› zur Dokumentation von Inhalten – Metadaten
5. ANGEBOTE & EMPFEHLUNGEN
32. 32
Vorbilder
»» Guides to Good Practice,
ADS (UK) und tDAR (USA)
»» Ratgeber zur Archivierung,
Verband der Landesarchäologen
»» IT-Leitfaden, DAI
AG Archivierung der Kommission �Archäologie und Informationssysteme“
im Verband der Landesarchäologen der Bundesrepublik Deutschland
Ratgeber zur
rchivierung digitaler Daten
T r i t t s t e i n e a u f d e m W e g z u m D i g i t a l a r c h i v
Vorabversion 0.07
Die AG Archivierung der Kommission �Archäologie und Informationssysteme“ im Verband der Lan-
desarchäologen Deutschlands verfolgt das Ziel, allgemein verfügbare methodische und technische
Ansätze zur Archivierung digitaler archäologischer Daten zu begutachten sowie praxisorientierte Emp-
fehlungen, Vorschläge und Tipps zu geben. Die Ergebnisse dieser Arbeit münden in diesen Ratgeber.
Sind auch noch einige Themenbereiche in Arbeit, so sind doch wesentliche Teile schon verfügbar und
werden in dieser Vorabversion vorgestellt
5. ANGEBOTE & EMPFEHLUNGEN
38. 38
WO FINDEN SIE WELCHE INHALTE?
Ergebnisse
»» http://www.ianus-fdz.de/projects/ergebnisse/wiki
IT-Empfehlungen
»» http://www.ianus-fdz.de/it-empfehlungen
Stakeholderanalyse
»» doi:10.13149/000.jah37w-q
39. 39
VIELEN DANK
Forschungsdatenzentrum
Archäologie &
Altertumswissenschaften
Austausch
Digitale Daten
Forschung
Nachnutzung
Archivierung
Planung
Datenerhaltung
Metadaten
Dokumentation
IT-Empfehlungen
IANUS
c/o Deutsches Archäologisches Institut
Podbielskiallee 69-71
D-14195 Berlin
Tel.: +49-(0)30-187711-359
Projektleitung
Prof. Dr. Friederike Fless
Prof. Dr. Ortwin Dally
Projektmanagement
Maurice Heinrich
Dr. Felix F. Schäfer
Weitere Infos
homepage: http://www.ianus-fdz.de
twitter: @Ianus_fdz
facebook: IANUS-Forschungsdatenzentrum
youtube: IANUS-Forschungsdatenzentrum