SlideShare ist ein Scribd-Unternehmen logo
1 von 33
Downloaden Sie, um offline zu lesen
Strukturelle Metadaten für historische Zeitungen.
Überlegungen zu einem Standardmodell
Günter Mühlberger
Universität Innsbruck
Digitalisierung und elektronische Archivierung
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Agenda
•Historische Zeitungen – ein kleiner Streifzug
•Warum strukturelle Metadaten?
•Konzepte / Standardisierung
•Umsetzung im Europeana Newspaper Projekt
•Ausblick
2
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Wiener Zeitung 1750
3
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Insprug, 7. Julii / 29. Juli 1750
4
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Lista deren Verstorbenen zu Wien, 1750
5
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Wiener Zeitung, 22. Jänner 1800
6
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Wiener Zeitung, 22. Jänner 1800
7
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Wiener Zeitung, 1800
8
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Grundriß der Handlungsgeschichte, 1799
9
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Die Presse, 18. Juni 1870
10
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Innsbrucker Nachrichten 4. Juni 1870
11
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
1925
12
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Arbeiterzeitung 2. Juni 1925
13
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Beobachtungen
• Zeitung = Neuigkeiten
• Lange Reihe von einzelnen Ereignissen
• Ordnung = Zeit und Ort
• Bis heute erhalten!
• Grundprinzip = Wiederholung
• Makrostruktur bleibt über lange Zeiträume erhalten
• Sektionen: Ort des Geschehens als die älteste Überschrift
• Ausdifferenzierungen
• Nicht alles lässt sich unter Zeit und Ort subsummieren: inhaltliche und andere Kriterien
• Titel (erste Worte eines Artikels, Worte in Klammer, etc.)
• Untertitel, Übertitel, etc.
• Verfasser eines Beitrags
• Originalbeitrag, Verfasser,...
• Announcen und Werbung
• Unterhaltung / Literarische Beiträge
• Meinung
• Etc.
14
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Warum strukturelle Metadaten?
• Volltextsuche
• Treffsicherheit bei der Volltextsuche
• Typische Einheit für Volltextsuche ist derzeit die Ausgabe und Seite – kann
präzisiert werden
• Strukturelle Metadaten als Facetten für die Suche
• Treffer in redaktionellem Inhalt hat andere Funktion als in einer Anzeige, Werbung,
etc.
• Beispiel (Leonding)
• Content Sections
• Crowd Sourcing
• Beispiel der Australischen Nationalbibliothek ist bekannt
• Was wäre, wenn Nutzer auch diverse strukturelle Metadaten korrigieren
könnten? Abgrenzung Werbung / Inhalt oder “Lista der Verstorbenen”,
etc.
• Benutzer müssen angeleitet werden, bzw. die Klassifikation sollte zur
Verfügung stehen
15
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Wert struktureller Metadaten
• OCR Korrektur
• Viele Elemente wiederholen sich und können mit vergleichsweise wenig
Mühe (automatisch) korrigiert werden, da sie ja grundsätzlich bekannt sind
• Bsp. Wiederkehrende Überschriften, Orte in Pre-Überschriften
• Bsp. Werbeeinschaltungen, die über Jahre hinweg gleich oder sehr ähnlich
sind
• Bsp. Regionale Zeitung: OCR Korrektur von allgemeinen Meldungen, die sich
besser und genauer in anderen Zeitungen der Epoche finden, wird weniger
Sinn machen, als z.B. die Korrektur der lokalen Nachrichten, die
ausschließlich in dieser Zeitung zu finden sind
• Voraussetzung für Natural Language Processing (NLP)
• Named Entities Recognition
• Topic Mining
• Summarization
• Verfahren benötigen möglichst klar abgegrenzte inhaltliche Einheiten
16
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Wert struktureller Metadaten
• Anreicherung durch Verlinkung mit externen, strukturierten
Datenquellen
• Z.B. Buchanzeigen: Machen einen ganz wesentlichen Teil historischer
Zeitungen aus – die genannten Titel lassen sich in modernen
Bibliothekskatalogen identifizieren
• Detto Theateraufführungen, oder die Liste der Verstorbenen
• Detto Kolportageromane, Gedichte und ähnliches
• Event Detection and Linking
• Viele der Content Unit beziehen sich auf Ereignisse, die an anderer Stelle
genauer beschrieben sind: Wikipedia Eintrag, Geschichtsbuch, etc.
• Zusammenführung von Zeitungsartikel mit standardisierter historischer
Information
17
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Vorschlag für drei einfache Begriffe
• Newspaper Content Units
• Klassifikation
• Newspaper Content Sections
• Newspaper Structural Elements
18
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Newspaper Content Units
•Definition
• Kriterium: Inhaltlich!
• In letzer Instanz entscheidet die inhaltliche Definition
•Eigenschaften
• Inhaltlich klar abgegrenzte Einheit
• Bsp.: Goldenes Dachl und Maria-Hilf-Gnadenbild
• Definierter Inhalt
• Als Abgrenzung gegen Sektionen
• Oftmals dezidierter Verfasser
• Oftmals im Layout abgegrenzt von anderen Einheiten
19
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Newspaper Content Section
•Definition
• Sind nicht so sehr inhaltliche Einheiten, sondern dienen der
Makro-Gliederung.
•Eigenschaften
• Wiederholen sich innerhalb der Zeitung über längere Zeiträume
und tendenziell ad infinito
• Meist im Layout klar abgehoben
• Enthalten (mehrere) inhaltliche Einheiten (NCI) zu dem
vorgegeben Thema (Ort, Schlagwort, Kategorie)
20
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Newspaper Structural Elements
•Definition
• Strukturelle Elemente werden durch ihre Funktion definiert – nicht
aber durch ihren Inhalt.
• Ihre Funktion liegt darin, dass sie dem Leser bei der Navigation,
beim Verständnis, etc. helfen, die Zeitung (in Papierform)
einfacher zu benutzen.
•Eigenschaften
• Sind immer Teil einer Newspaper Content Section oder Items.
• Sie fügen dem Inhalt zusätzliche Funktionen hinzu
• Bsp.: Titel: Früher gab es keine Titel von Artikeln, erst mit zunehmender
Größe der Seite, Mehrspaltigkeit, etc. war es nützlich dem Leser zu vermitteln
wo die nächste inhaltliche Einheit beginnt und worüber sie handelt.
21
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Daumenregeln
•Wenn man eine historische Zeitung oder einen Artikel in ein
eBook konvertieren würde, dann
• wären Newspaper Content Sections “Schlagworte” “Kategorien”
unter denen man den Inhalt finden würde
• bliebe der Text eines Newspaper Content Items unverändert,
• würde man Struktural Elements für die nähere Beschreibung
(Metadaten) bzw. für das neue Layout nützen, jedoch immer
verändern.
22
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
NCU - Klassifikation
•Klassifikation
• Wir haben ein unmittelbares Gefühl: Artikel, Wetterbericht,
Börsenbericht, Buchbesprechung, Werbung, Wohnungsverkauf,
Mietgesuch, etc.
• These: 80% der NCUs lassen sich einfach zuordnen
•Kriterien
• Was “bewirkt” ein NCU beim Leser?
• Bessere Informiertheit? Unterhaltung?...
23
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Texttypen - Klassen
•Fünf Klassen
• Information
• Anzeigen (classified advertisement) und Werbung
• Unterhaltung
• Meinung
• Metainformation
•Historischer Ausdifferenzierungsprozess
24
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Information
•Information
• Das wichtigste Konzept
• Neueste Nachrichten
• Der Leser sollte nachher “besser informiert” sein als vorher.
•Beispiele
• Artikel, Hintergrundartikel, Kurzartikel, aber auch Wetterbericht,
Börsennotizen, etc.
25
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Advertisement
•Anzeigen/Werbung
• Im englischen Sprachraum “classified advertisement” und
“advertisement” zusammengefasst
• Historisch gesehen relativ bald entstanden
• Typischerweise Information, die nicht direkt aus der Redaktion
kommt und für die der Verfasser zahlen muss
• Der Leser wird nicht nur informiert, sondern aufgefordert eine
bestimmte Handlung zu setzen: Ein Produkt zu kaufen, eine
Wohnung zu besichtigen, sich auf ein Stellenangebot zu melden,
an einem Begräbnis teilzunehmen, etc.
26
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Entertainment
•Unterhaltung
• Eine Kategorie, die offenbar erst im Laufe des 19. Jahrunderts
Einzug in die Zeitung hält.
• Kolportageroman als das bekannteste Beispiel, starke
Ausdifferenzierung.
• Der Leser soll emotional involviert werden, das bedeutet nicht
unbedingt “oberflächliches Amusement” sondern kann eben auch
die Liebesgeschichte, der Aphorismus, ein Gedicht sein
27
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Opinion
•Meinung
• Klare Abgrenzung Information – Meinung ist ein Dogma der
modernen Zeitung, allerdings historisch gesehen sehr spät erfolgt.
• Feuilleton als das bekannteste Beispiel aus dem 19. Jahrhundert
• Leser soll in seinen Werthaltungen gefordert werden. Zustimmung
oder Ablehnung als die intendierten Verhaltensweisen
• Beispiele wären Kommentare, Leitartikel, aber auch Leserbriefe,
etc.
28
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Metainformation
•Metainformation
• Kleine Kategorie, aber das Impressum oder die Richigstellung, etc.
können sonst eigentlich nicht subsummiert werden
• Wo spricht die Zeitung sozusagen über sich selbst?
29
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Beispiel
30
Innsbrucker Nachrichten, 4 Juni 1870
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Umsetzung in METS/ALTO
• ENMAP
• Strukturelle Metadaten vs. deskriptive Metadaten
• Autor, Titel, Untertitel, Ort der Handlung, dazugehöriges Bild und
Bildunterschrift, etc. sind “normale” bibliographische MD
• Sollten in METS DMD abgebildet werden, dort MODS als Schema
• Daumenregel: bibliographische MD sollten verläßlich sein (manuelle
Erfassung oder Korrektur)
• Sollten nur für NCU erstellt werden.
• Strukturelle Elemente
• Logische StructMap in METS enthält NCUs und NCS als die wichtigsten
Gliederungselemente, diese sind verlinkt mit der DMD Section.
• Strukturelle Elemente finden sich in der StructMap gelistet.
31
This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the
Competitiveness and Innovation Framework Programme by the European Community
http://ec.europa.eu/ict_psp
Ausblick
•ENP interner Workshop in Innsbruck
• Praxistest
• Probe, ob diese Kategorien auch für andere Länder und Sprachen
verwendet werden können, bzw. wie robust die Definitionen etc.
sind
•Geplant: Workshop zur automatisierten Erkennung
struktureller Metadaten
• Ende 2014
• In Vorbereitung
•Veröffentlichung zum Thema
32
Vielen Dank für die Aufmerksamkeit!
lGünter Mühlberger
<guenter.muehlberger@uibk.ac.at>

Weitere ähnliche Inhalte

Andere mochten auch

Europeana Newspapers Amsterdam workshop introduction
Europeana Newspapers Amsterdam workshop introductionEuropeana Newspapers Amsterdam workshop introduction
Europeana Newspapers Amsterdam workshop introductionEuropeana Newspapers
 
Challenges and solutions in creating a european historic newspapers browser
Challenges and solutions in creating a european historic newspapers browser Challenges and solutions in creating a european historic newspapers browser
Challenges and solutions in creating a european historic newspapers browser Europeana Newspapers
 
Historical newspapers in the context of Digital Library of Slovenia
Historical newspapers in the context of Digital Library of SloveniaHistorical newspapers in the context of Digital Library of Slovenia
Historical newspapers in the context of Digital Library of SloveniaEuropeana Newspapers
 
Projekt Europeana Newspapers - online brána k evropským historickým novinám
Projekt Europeana Newspapers - online brána k evropským historickým novinámProjekt Europeana Newspapers - online brána k evropským historickým novinám
Projekt Europeana Newspapers - online brána k evropským historickým novinámEuropeana Newspapers
 
Europeana Newspapers Polish Information Day
Europeana Newspapers Polish Information DayEuropeana Newspapers Polish Information Day
Europeana Newspapers Polish Information DayEuropeana Newspapers
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayEuropeana Newspapers
 
eluxemburgensia: the portal for Luxembourg's historic newspapers
eluxemburgensia: the portal for Luxembourg's historic newspaperseluxemburgensia: the portal for Luxembourg's historic newspapers
eluxemburgensia: the portal for Luxembourg's historic newspapersEuropeana Newspapers
 
The European(a) Newspapers Project
The European(a) Newspapers ProjectThe European(a) Newspapers Project
The European(a) Newspapers ProjectEuropeana Newspapers
 
ENP Belgrade WS refinement introduction
ENP Belgrade WS refinement introductionENP Belgrade WS refinement introduction
ENP Belgrade WS refinement introductionEuropeana Newspapers
 

Andere mochten auch (15)

Europeana Newspapers Amsterdam workshop introduction
Europeana Newspapers Amsterdam workshop introductionEuropeana Newspapers Amsterdam workshop introduction
Europeana Newspapers Amsterdam workshop introduction
 
Challenges and solutions in creating a european historic newspapers browser
Challenges and solutions in creating a european historic newspapers browser Challenges and solutions in creating a european historic newspapers browser
Challenges and solutions in creating a european historic newspapers browser
 
Historical newspapers in the context of Digital Library of Slovenia
Historical newspapers in the context of Digital Library of SloveniaHistorical newspapers in the context of Digital Library of Slovenia
Historical newspapers in the context of Digital Library of Slovenia
 
Projekt Europeana Newspapers - online brána k evropským historickým novinám
Projekt Europeana Newspapers - online brána k evropským historickým novinámProjekt Europeana Newspapers - online brána k evropským historickým novinám
Projekt Europeana Newspapers - online brána k evropským historickým novinám
 
ENP Belgrade WS Introduction
ENP Belgrade WS IntroductionENP Belgrade WS Introduction
ENP Belgrade WS Introduction
 
Europeana Newspapers Polish Information Day
Europeana Newspapers Polish Information DayEuropeana Newspapers Polish Information Day
Europeana Newspapers Polish Information Day
 
Presentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information DayPresentation of Claus Gravenhorst, BnF Information Day
Presentation of Claus Gravenhorst, BnF Information Day
 
eluxemburgensia: the portal for Luxembourg's historic newspapers
eluxemburgensia: the portal for Luxembourg's historic newspaperseluxemburgensia: the portal for Luxembourg's historic newspapers
eluxemburgensia: the portal for Luxembourg's historic newspapers
 
The European(a) Newspapers Project
The European(a) Newspapers ProjectThe European(a) Newspapers Project
The European(a) Newspapers Project
 
Trtovac, dakic, september 2012
Trtovac, dakic, september 2012Trtovac, dakic, september 2012
Trtovac, dakic, september 2012
 
ENP Belgrade WS refinement introduction
ENP Belgrade WS refinement introductionENP Belgrade WS refinement introduction
ENP Belgrade WS refinement introduction
 
On the two sides of the pond
On the two sides of the pondOn the two sides of the pond
On the two sides of the pond
 
Metadata
MetadataMetadata
Metadata
 
What is a named entity
What is a named entityWhat is a named entity
What is a named entity
 
ENP Belgrade WS Metadata
ENP Belgrade WS MetadataENP Belgrade WS Metadata
ENP Belgrade WS Metadata
 

Ähnlich wie Europeana Newspapers German infoday - Struturelle Metadata historische Zeitungen

Digitalisierte Zeitungen und Digital Humanities - Probleme und Chancen
Digitalisierte Zeitungen und Digital Humanities - Probleme und ChancenDigitalisierte Zeitungen und Digital Humanities - Probleme und Chancen
Digitalisierte Zeitungen und Digital Humanities - Probleme und Chancencneudecker
 
Bessere Suchergebnisse durch Named Entity Recognition
Bessere Suchergebnisse durch Named Entity RecognitionBessere Suchergebnisse durch Named Entity Recognition
Bessere Suchergebnisse durch Named Entity Recognitioncneudecker
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newspapers
 
Europeana Newspapers German Infoday Quality Assessment
Europeana Newspapers German Infoday Quality AssessmentEuropeana Newspapers German Infoday Quality Assessment
Europeana Newspapers German Infoday Quality AssessmentEuropeana Newspapers
 
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACTEU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACTMax Kaiser
 
Citizen Wiki - Partizipative Verwaltung - Government 2.0
Citizen Wiki - Partizipative Verwaltung - Government 2.0Citizen Wiki - Partizipative Verwaltung - Government 2.0
Citizen Wiki - Partizipative Verwaltung - Government 2.0Willi Schroll
 
2015 epcon stadt_als_energiequelle_v11
2015 epcon stadt_als_energiequelle_v112015 epcon stadt_als_energiequelle_v11
2015 epcon stadt_als_energiequelle_v11Wilson Maluenda
 
OkLab Leipzig (state: 2017)
OkLab Leipzig (state: 2017)OkLab Leipzig (state: 2017)
OkLab Leipzig (state: 2017)joergreichert
 
Europeana Newspapers German infoday - Semantics
Europeana Newspapers German infoday - SemanticsEuropeana Newspapers German infoday - Semantics
Europeana Newspapers German infoday - SemanticsEuropeana Newspapers
 
Dipl.-Ing. Christoph Raber (BMWA)
Dipl.-Ing. Christoph Raber (BMWA)Dipl.-Ing. Christoph Raber (BMWA)
Dipl.-Ing. Christoph Raber (BMWA)Praxistage
 
MR Mag. Alfred Ruzicka (BMVIT)
MR Mag. Alfred Ruzicka (BMVIT)MR Mag. Alfred Ruzicka (BMVIT)
MR Mag. Alfred Ruzicka (BMVIT)Praxistage
 
Das IWG–Netzwerk e.V. stellt sich vor!
Das IWG–Netzwerk e.V. stellt sich vor!Das IWG–Netzwerk e.V. stellt sich vor!
Das IWG–Netzwerk e.V. stellt sich vor!Michael Fanning
 
Datenraum für Kultur- und Kulturerbedaten, 15. Nov. 2022
Datenraum für Kultur- und Kulturerbedaten, 15. Nov. 2022Datenraum für Kultur- und Kulturerbedaten, 15. Nov. 2022
Datenraum für Kultur- und Kulturerbedaten, 15. Nov. 2022Beat Estermann
 
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...Martin Kaltenböck
 
Europeana Newspapers German infoday - OCR @ CCS
Europeana Newspapers German infoday - OCR @ CCS Europeana Newspapers German infoday - OCR @ CCS
Europeana Newspapers German infoday - OCR @ CCS Europeana Newspapers
 
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...Patrick Peiffer
 
23 beyer katzenberger-dachli conference - beyer
23 beyer katzenberger-dachli conference - beyer23 beyer katzenberger-dachli conference - beyer
23 beyer katzenberger-dachli conference - beyerOGD-DACHLI Konferenzreihe
 

Ähnlich wie Europeana Newspapers German infoday - Struturelle Metadata historische Zeitungen (20)

Digitalisierte Zeitungen und Digital Humanities - Probleme und Chancen
Digitalisierte Zeitungen und Digital Humanities - Probleme und ChancenDigitalisierte Zeitungen und Digital Humanities - Probleme und Chancen
Digitalisierte Zeitungen und Digital Humanities - Probleme und Chancen
 
Bessere Suchergebnisse durch Named Entity Recognition
Bessere Suchergebnisse durch Named Entity RecognitionBessere Suchergebnisse durch Named Entity Recognition
Bessere Suchergebnisse durch Named Entity Recognition
 
Europeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday NeudeckerEuropeana Newpapers LFT Infoday Neudecker
Europeana Newpapers LFT Infoday Neudecker
 
Europeana Newspapers German Infoday Quality Assessment
Europeana Newspapers German Infoday Quality AssessmentEuropeana Newspapers German Infoday Quality Assessment
Europeana Newspapers German Infoday Quality Assessment
 
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACTEU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
EU-Projekte an der Österreichischen Nationalbibliothek - Beispiel IMPACT
 
Citizen Wiki - Partizipative Verwaltung - Government 2.0
Citizen Wiki - Partizipative Verwaltung - Government 2.0Citizen Wiki - Partizipative Verwaltung - Government 2.0
Citizen Wiki - Partizipative Verwaltung - Government 2.0
 
2015 epcon stadt_als_energiequelle_v11
2015 epcon stadt_als_energiequelle_v112015 epcon stadt_als_energiequelle_v11
2015 epcon stadt_als_energiequelle_v11
 
OkLab Leipzig (state: 2017)
OkLab Leipzig (state: 2017)OkLab Leipzig (state: 2017)
OkLab Leipzig (state: 2017)
 
Europeana Newspapers German infoday - Semantics
Europeana Newspapers German infoday - SemanticsEuropeana Newspapers German infoday - Semantics
Europeana Newspapers German infoday - Semantics
 
Innovation_Produktmanagement
Innovation_ProduktmanagementInnovation_Produktmanagement
Innovation_Produktmanagement
 
Dipl.-Ing. Christoph Raber (BMWA)
Dipl.-Ing. Christoph Raber (BMWA)Dipl.-Ing. Christoph Raber (BMWA)
Dipl.-Ing. Christoph Raber (BMWA)
 
MR Mag. Alfred Ruzicka (BMVIT)
MR Mag. Alfred Ruzicka (BMVIT)MR Mag. Alfred Ruzicka (BMVIT)
MR Mag. Alfred Ruzicka (BMVIT)
 
Das IWG–Netzwerk e.V. stellt sich vor!
Das IWG–Netzwerk e.V. stellt sich vor!Das IWG–Netzwerk e.V. stellt sich vor!
Das IWG–Netzwerk e.V. stellt sich vor!
 
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
Fachliche Vernetzung von Repositories auf europäischer Ebene - das Beispiel N...
 
Selbermachen!
Selbermachen! Selbermachen!
Selbermachen!
 
Datenraum für Kultur- und Kulturerbedaten, 15. Nov. 2022
Datenraum für Kultur- und Kulturerbedaten, 15. Nov. 2022Datenraum für Kultur- und Kulturerbedaten, 15. Nov. 2022
Datenraum für Kultur- und Kulturerbedaten, 15. Nov. 2022
 
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
Open Data Portal (ODP) Österreich - Präsentation bei der opendata.ch 2014 in ...
 
Europeana Newspapers German infoday - OCR @ CCS
Europeana Newspapers German infoday - OCR @ CCS Europeana Newspapers German infoday - OCR @ CCS
Europeana Newspapers German infoday - OCR @ CCS
 
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
Trier - Digitale Rekonstruktionen mittelalterlicher Bibliotheken- Europeana -...
 
23 beyer katzenberger-dachli conference - beyer
23 beyer katzenberger-dachli conference - beyer23 beyer katzenberger-dachli conference - beyer
23 beyer katzenberger-dachli conference - beyer
 

Mehr von Europeana Newspapers

Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisPresentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisEuropeana Newspapers
 
Presentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayPresentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayEuropeana Newspapers
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayEuropeana Newspapers
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayEuropeana Newspapers
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayEuropeana Newspapers
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayEuropeana Newspapers
 
IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday GenereuxEuropeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday GenereuxEuropeana Newspapers
 
Europeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday BolioliEuropeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday BolioliEuropeana Newspapers
 

Mehr von Europeana Newspapers (20)

Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in ParisPresentation of Philippe Mezzasalma at the BnF Information Day in Paris
Presentation of Philippe Mezzasalma at the BnF Information Day in Paris
 
Presentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information DayPresentation of Ioannis Anagnostopoulos at BnF Information Day
Presentation of Ioannis Anagnostopoulos at BnF Information Day
 
Presentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information DayPresentation of Clemens Neudecker, BnF Information Day
Presentation of Clemens Neudecker, BnF Information Day
 
Presentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information DayPresentation of Hans-Jörg Lieder, BnF Information Day
Presentation of Hans-Jörg Lieder, BnF Information Day
 
Présentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information DayPrésentation Günter Mühlberger, BnF Information Day
Présentation Günter Mühlberger, BnF Information Day
 
Presentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information DayPresentation of Alaa Abi Haidar at the BnF Information Day
Presentation of Alaa Abi Haidar at the BnF Information Day
 
IFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza AtanassovaIFLA 2014 Europeana Newspapers Rossitza Atanassova
IFLA 2014 Europeana Newspapers Rossitza Atanassova
 
Europeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne KoutsEuropeana Newspapers Estonian Infoday Ragne Kouts
Europeana Newspapers Estonian Infoday Ragne Kouts
 
Europeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel VeimannEuropeana Newspapers Estonian Infoday Kristel Veimann
Europeana Newspapers Estonian Infoday Kristel Veimann
 
Europeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista KiisaEuropeana Newspapers Estonian Infoday Krista Kiisa
Europeana Newspapers Estonian Infoday Krista Kiisa
 
Europeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista AruEuropeana Newspapers Estonian Infoday Krista Aru
Europeana Newspapers Estonian Infoday Krista Aru
 
Europeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred PussEuropeana Newspapers Estonian Infoday Fred Puss
Europeana Newspapers Estonian Infoday Fred Puss
 
Europeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday ThompsonEuropeana Newspapers LFT Infoday Thompson
Europeana Newspapers LFT Infoday Thompson
 
Europeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday RossiEuropeana Newspapers LFT Infoday Rossi
Europeana Newspapers LFT Infoday Rossi
 
Europeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday MuehlbergerEuropeana Newspapers LFT Infoday Muehlberger
Europeana Newspapers LFT Infoday Muehlberger
 
Europeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday MessinaEuropeana Newspapers LFT Infoday Messina
Europeana Newspapers LFT Infoday Messina
 
Europeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday MarchettiEuropeana Newspapers Infoday Marchetti
Europeana Newspapers Infoday Marchetti
 
Europeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday KempfEuropeana Newspapers LFT Infoday Kempf
Europeana Newspapers LFT Infoday Kempf
 
Europeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday GenereuxEuropeana Newspapers LFT Infoday Genereux
Europeana Newspapers LFT Infoday Genereux
 
Europeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday BolioliEuropeana Newspapers LFT Infoday Bolioli
Europeana Newspapers LFT Infoday Bolioli
 

Europeana Newspapers German infoday - Struturelle Metadata historische Zeitungen

  • 1. Strukturelle Metadaten für historische Zeitungen. Überlegungen zu einem Standardmodell Günter Mühlberger Universität Innsbruck Digitalisierung und elektronische Archivierung
  • 2. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Agenda •Historische Zeitungen – ein kleiner Streifzug •Warum strukturelle Metadaten? •Konzepte / Standardisierung •Umsetzung im Europeana Newspaper Projekt •Ausblick 2
  • 3. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Wiener Zeitung 1750 3
  • 4. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Insprug, 7. Julii / 29. Juli 1750 4
  • 5. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Lista deren Verstorbenen zu Wien, 1750 5
  • 6. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Wiener Zeitung, 22. Jänner 1800 6
  • 7. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Wiener Zeitung, 22. Jänner 1800 7
  • 8. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Wiener Zeitung, 1800 8
  • 9. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Grundriß der Handlungsgeschichte, 1799 9
  • 10. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Die Presse, 18. Juni 1870 10
  • 11. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Innsbrucker Nachrichten 4. Juni 1870 11
  • 12. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp 1925 12
  • 13. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Arbeiterzeitung 2. Juni 1925 13
  • 14. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Beobachtungen • Zeitung = Neuigkeiten • Lange Reihe von einzelnen Ereignissen • Ordnung = Zeit und Ort • Bis heute erhalten! • Grundprinzip = Wiederholung • Makrostruktur bleibt über lange Zeiträume erhalten • Sektionen: Ort des Geschehens als die älteste Überschrift • Ausdifferenzierungen • Nicht alles lässt sich unter Zeit und Ort subsummieren: inhaltliche und andere Kriterien • Titel (erste Worte eines Artikels, Worte in Klammer, etc.) • Untertitel, Übertitel, etc. • Verfasser eines Beitrags • Originalbeitrag, Verfasser,... • Announcen und Werbung • Unterhaltung / Literarische Beiträge • Meinung • Etc. 14
  • 15. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Warum strukturelle Metadaten? • Volltextsuche • Treffsicherheit bei der Volltextsuche • Typische Einheit für Volltextsuche ist derzeit die Ausgabe und Seite – kann präzisiert werden • Strukturelle Metadaten als Facetten für die Suche • Treffer in redaktionellem Inhalt hat andere Funktion als in einer Anzeige, Werbung, etc. • Beispiel (Leonding) • Content Sections • Crowd Sourcing • Beispiel der Australischen Nationalbibliothek ist bekannt • Was wäre, wenn Nutzer auch diverse strukturelle Metadaten korrigieren könnten? Abgrenzung Werbung / Inhalt oder “Lista der Verstorbenen”, etc. • Benutzer müssen angeleitet werden, bzw. die Klassifikation sollte zur Verfügung stehen 15
  • 16. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Wert struktureller Metadaten • OCR Korrektur • Viele Elemente wiederholen sich und können mit vergleichsweise wenig Mühe (automatisch) korrigiert werden, da sie ja grundsätzlich bekannt sind • Bsp. Wiederkehrende Überschriften, Orte in Pre-Überschriften • Bsp. Werbeeinschaltungen, die über Jahre hinweg gleich oder sehr ähnlich sind • Bsp. Regionale Zeitung: OCR Korrektur von allgemeinen Meldungen, die sich besser und genauer in anderen Zeitungen der Epoche finden, wird weniger Sinn machen, als z.B. die Korrektur der lokalen Nachrichten, die ausschließlich in dieser Zeitung zu finden sind • Voraussetzung für Natural Language Processing (NLP) • Named Entities Recognition • Topic Mining • Summarization • Verfahren benötigen möglichst klar abgegrenzte inhaltliche Einheiten 16
  • 17. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Wert struktureller Metadaten • Anreicherung durch Verlinkung mit externen, strukturierten Datenquellen • Z.B. Buchanzeigen: Machen einen ganz wesentlichen Teil historischer Zeitungen aus – die genannten Titel lassen sich in modernen Bibliothekskatalogen identifizieren • Detto Theateraufführungen, oder die Liste der Verstorbenen • Detto Kolportageromane, Gedichte und ähnliches • Event Detection and Linking • Viele der Content Unit beziehen sich auf Ereignisse, die an anderer Stelle genauer beschrieben sind: Wikipedia Eintrag, Geschichtsbuch, etc. • Zusammenführung von Zeitungsartikel mit standardisierter historischer Information 17
  • 18. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Vorschlag für drei einfache Begriffe • Newspaper Content Units • Klassifikation • Newspaper Content Sections • Newspaper Structural Elements 18
  • 19. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Newspaper Content Units •Definition • Kriterium: Inhaltlich! • In letzer Instanz entscheidet die inhaltliche Definition •Eigenschaften • Inhaltlich klar abgegrenzte Einheit • Bsp.: Goldenes Dachl und Maria-Hilf-Gnadenbild • Definierter Inhalt • Als Abgrenzung gegen Sektionen • Oftmals dezidierter Verfasser • Oftmals im Layout abgegrenzt von anderen Einheiten 19
  • 20. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Newspaper Content Section •Definition • Sind nicht so sehr inhaltliche Einheiten, sondern dienen der Makro-Gliederung. •Eigenschaften • Wiederholen sich innerhalb der Zeitung über längere Zeiträume und tendenziell ad infinito • Meist im Layout klar abgehoben • Enthalten (mehrere) inhaltliche Einheiten (NCI) zu dem vorgegeben Thema (Ort, Schlagwort, Kategorie) 20
  • 21. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Newspaper Structural Elements •Definition • Strukturelle Elemente werden durch ihre Funktion definiert – nicht aber durch ihren Inhalt. • Ihre Funktion liegt darin, dass sie dem Leser bei der Navigation, beim Verständnis, etc. helfen, die Zeitung (in Papierform) einfacher zu benutzen. •Eigenschaften • Sind immer Teil einer Newspaper Content Section oder Items. • Sie fügen dem Inhalt zusätzliche Funktionen hinzu • Bsp.: Titel: Früher gab es keine Titel von Artikeln, erst mit zunehmender Größe der Seite, Mehrspaltigkeit, etc. war es nützlich dem Leser zu vermitteln wo die nächste inhaltliche Einheit beginnt und worüber sie handelt. 21
  • 22. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Daumenregeln •Wenn man eine historische Zeitung oder einen Artikel in ein eBook konvertieren würde, dann • wären Newspaper Content Sections “Schlagworte” “Kategorien” unter denen man den Inhalt finden würde • bliebe der Text eines Newspaper Content Items unverändert, • würde man Struktural Elements für die nähere Beschreibung (Metadaten) bzw. für das neue Layout nützen, jedoch immer verändern. 22
  • 23. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp NCU - Klassifikation •Klassifikation • Wir haben ein unmittelbares Gefühl: Artikel, Wetterbericht, Börsenbericht, Buchbesprechung, Werbung, Wohnungsverkauf, Mietgesuch, etc. • These: 80% der NCUs lassen sich einfach zuordnen •Kriterien • Was “bewirkt” ein NCU beim Leser? • Bessere Informiertheit? Unterhaltung?... 23
  • 24. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Texttypen - Klassen •Fünf Klassen • Information • Anzeigen (classified advertisement) und Werbung • Unterhaltung • Meinung • Metainformation •Historischer Ausdifferenzierungsprozess 24
  • 25. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Information •Information • Das wichtigste Konzept • Neueste Nachrichten • Der Leser sollte nachher “besser informiert” sein als vorher. •Beispiele • Artikel, Hintergrundartikel, Kurzartikel, aber auch Wetterbericht, Börsennotizen, etc. 25
  • 26. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Advertisement •Anzeigen/Werbung • Im englischen Sprachraum “classified advertisement” und “advertisement” zusammengefasst • Historisch gesehen relativ bald entstanden • Typischerweise Information, die nicht direkt aus der Redaktion kommt und für die der Verfasser zahlen muss • Der Leser wird nicht nur informiert, sondern aufgefordert eine bestimmte Handlung zu setzen: Ein Produkt zu kaufen, eine Wohnung zu besichtigen, sich auf ein Stellenangebot zu melden, an einem Begräbnis teilzunehmen, etc. 26
  • 27. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Entertainment •Unterhaltung • Eine Kategorie, die offenbar erst im Laufe des 19. Jahrunderts Einzug in die Zeitung hält. • Kolportageroman als das bekannteste Beispiel, starke Ausdifferenzierung. • Der Leser soll emotional involviert werden, das bedeutet nicht unbedingt “oberflächliches Amusement” sondern kann eben auch die Liebesgeschichte, der Aphorismus, ein Gedicht sein 27
  • 28. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Opinion •Meinung • Klare Abgrenzung Information – Meinung ist ein Dogma der modernen Zeitung, allerdings historisch gesehen sehr spät erfolgt. • Feuilleton als das bekannteste Beispiel aus dem 19. Jahrhundert • Leser soll in seinen Werthaltungen gefordert werden. Zustimmung oder Ablehnung als die intendierten Verhaltensweisen • Beispiele wären Kommentare, Leitartikel, aber auch Leserbriefe, etc. 28
  • 29. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Metainformation •Metainformation • Kleine Kategorie, aber das Impressum oder die Richigstellung, etc. können sonst eigentlich nicht subsummiert werden • Wo spricht die Zeitung sozusagen über sich selbst? 29
  • 30. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Beispiel 30 Innsbrucker Nachrichten, 4 Juni 1870
  • 31. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Umsetzung in METS/ALTO • ENMAP • Strukturelle Metadaten vs. deskriptive Metadaten • Autor, Titel, Untertitel, Ort der Handlung, dazugehöriges Bild und Bildunterschrift, etc. sind “normale” bibliographische MD • Sollten in METS DMD abgebildet werden, dort MODS als Schema • Daumenregel: bibliographische MD sollten verläßlich sein (manuelle Erfassung oder Korrektur) • Sollten nur für NCU erstellt werden. • Strukturelle Elemente • Logische StructMap in METS enthält NCUs und NCS als die wichtigsten Gliederungselemente, diese sind verlinkt mit der DMD Section. • Strukturelle Elemente finden sich in der StructMap gelistet. 31
  • 32. This project is partially funded under the ICT Policy Support Programme (ICT PSP) as part of the Competitiveness and Innovation Framework Programme by the European Community http://ec.europa.eu/ict_psp Ausblick •ENP interner Workshop in Innsbruck • Praxistest • Probe, ob diese Kategorien auch für andere Länder und Sprachen verwendet werden können, bzw. wie robust die Definitionen etc. sind •Geplant: Workshop zur automatisierten Erkennung struktureller Metadaten • Ende 2014 • In Vorbereitung •Veröffentlichung zum Thema 32
  • 33. Vielen Dank für die Aufmerksamkeit! lGünter Mühlberger <guenter.muehlberger@uibk.ac.at>