SlideShare ist ein Scribd-Unternehmen logo
1 von 18
Downloaden Sie, um offline zu lesen
Felix Sasaki und Georg Rehm
Mockups von Jan Nehring
DFKI GmbH – Forschungsbereich Sprachtechnologie, Berlin
Fachtagung „Digitale Kuratierungstechnologien“
Humboldtuniversität, Oktober 2015
Digitale Kuratierungstechnologien
Beispiele aus ausgewählten Branchen
Branchen
Input Prozesse Software Output
Tweet Analysieren Textverarbeitung Zeitungsartikel
Zeitungsartikel Auswählen Präsentationen Multimedia-Website
Agenturmeldung Fokussieren Tabellenkalkulation TV-Beitrag
Facebook-Meldung Überarbeiten Email Ausstellungskatalog
Suchergebnis Einlesen Browser Mobile Applikation
Email Schreiben Groupware Mashup (z.B. Karte)
SMS Gestalten Branchenapplikationen Textbeitrag
Konzept Recherchieren CMS Konzept
Textdateien Bewerten ECMS Zeitstrahl
Video Evaluieren CRM Fachartikel
Karte Ordnen Unternehmens-Software Studie
Stockfotos Sortieren Grafik-/Layout-Software Präsentation
In-house Datenbank Strukturieren Telefonie Faktensammlung
Kalendereintrag Zusammenfassen etc. Exponatsartikel
Spreadsheets Kürzen Analysen
Archiv Übersetzen etc.
etc. Informieren
Kombinieren
Abstrahieren
Einordnen
Visualisieren
Generieren
Annotieren
Referenzieren
etc.
Enthalten, in jeweils unterschiedlichen Verhältnissen, Text, Daten, Metadaten, Bild, Video, Ton,
Visualisierungen, sonstige interaktive Elemente, Multimedia-Bausteine, spezifische Textstrukturen etc.
Branchen
Input Prozesse Software Output
Tweet Analysieren Textverarbeitung Zeitungsartikel
Zeitungsartikel Auswählen Präsentationen Multimedia-Website
Agenturmeldung Fokussieren Tabellenkalkulation TV-Beitrag
Facebook-Meldung Überarbeiten Email Ausstellungskatalog
Suchergebnis Einlesen Browser Mobile Applikation
Email Schreiben Groupware Mashup (z.B. Karte)
SMS Gestalten Branchenapplikationen Textbeitrag
Konzept Recherchieren CMS Konzept
Textdateien Bewerten ECMS Zeitstrahl
Video Evaluieren CRM Fachartikel
Karte Ordnen Unternehmens-Software Studie
Stockfotos Sortieren Grafik-/Layout-Software Präsentation
In-house Datenbank Strukturieren Telefonie Faktensammlung
Kalendereintrag Zusammenfassen etc. Exponatsartikel
Spreadsheets Kürzen Analysen
Archiv Übersetzen etc.
etc. Informieren
Kombinieren
Abstrahieren
Einordnen
Visualisieren
Generieren
Annotieren
Referenzieren
etc.
Enthalten, in jeweils unterschiedlichen Verhältnissen, Text, Daten, Metadaten, Bild, Video, Ton,
Visualisierungen, sonstige interaktive Elemente, Multimedia-Bausteine, spezifische Textstrukturen etc.
Sprach- und Wissenstechnologien:
•  Semantische Analyse (AP1)
•  Mehrsprachigkeit (AP2)
•  Semantische Generierung (AP3)
Drei Funktionsbereiche
•  Semantische Textanalyse:
–  Anreicherung von Informationen mit Metadaten (z.B. zu Eigennamen)
–  Automatisches Textzusammenfassen
–  Integration von Informationen aus externen Datenquellen inkl.
Provenance-Information, etwa LOD (z.B. DBpedia, Wikidata)
•  Semantische Generierung:
–  Hypertextualisierung und Aufbereitung von Informationssammlungen
zu Texten und Hypertexten (Semantic Story Telling)
–  Nutzung von Markup-Sprachen für thematische, räumliche, temporale
Annotation und Darstellung
•  Internationalisierung und Mehrsprachigkeit:
–  Anwendung von W3C-Standards (z.B. ITS 2.0), Verknüpfung mit LOD
–  Integration und Adaptation von maschineller Übersetzung (MT)
4Fachtagung „Digitale Kuratierungstechnologien“ 2015
Semantische Analyse
•  Geringe Präzision
•  Keine Adaptierbarkeit
•  „Nur Text“ Verarbeitung – erschwerte Einbindung in Workflows
5
State of the Art
“The chancellor of Germany will visit several countries. Mrs. Merkel will start in
Brazil.” ✖
✖
✖ Nicht analysiert
Fachtagung „Digitale Kuratierungstechnologien“ 2015
Semantische Analyse
6
DKT Innovation
•  Hohe Präzision mit tiefer Verarbeitung
•  Adaption zu Nutzer spezifischen Domänen
•  Dokumentstruktur spezifische Abdeckung zahlreicher Inhaltsformate / -
workflows
“The chancellor of Germany will visit several countries. Mrs. Merkel will start in
Brazil.” ✔
✔
✔ Analysiert
✔
“The
chancellor
…”
Eingabe: Text, HTML, Word, ...
Analyse (Domäne:
Politik,
Wirtschaft, ...
„Meine In-House
Domäne“)
Weitere
Kuratierungs-
prozesse
✔
identisch
Teil von
Fachtagung „Digitale Kuratierungstechnologien“ 2015
Mehrsprachigkeit
•  Verbreitet: Maschinelle Übersetzung (MT) mit geringer Qualität
(Inbound Translation)
•  Wünschenswert: Hoch qualitative MT (HQMT)
7
State of the Art
„Der Kanzler von Deutschland werden mehrere Länder besuchen. Frau Merkel in
Brasilien zu starten.“
“The chancellor of Germany will visit several countries. Mrs. Merkel will start in
Brazil.”
Maschinelle
Übersetzung
✖
✖✖
✖
Fachtagung „Digitale Kuratierungstechnologien“ 2015
Mehrsprachigkeit
8
DKT Innovation
•  Einfache Schnittstellen für Inbound Translation
•  In Richtung HQMT: Adaption von MT durch externe Wissensquellen
•  In Richtung HQMT: Verbesserung des MT Workflows durch
standardisierte Metadaten
„Der Kanzler von Deutschland wird mehrere Länder besuchen. Frau Merkel in
Brasilien starten.“
“The chancellor of Germany will visit several countries. Mrs. Merkel will start in
Brazil.”
Maschinelle
Übersetzung
Externe
Wissens-
quellen
Metadaten
✔✖
✖
„wird“ fehlt
Fachtagung „Digitale Kuratierungstechnologien“ 2015
Semantische Generierung
•  Verbreitet: Template-basierte Ansätze
•  Geringe Sprach- und Domänenabdeckung
9
State of the Art
„In @@@@ scheint die Sonne. Es ist zur Zeit @@@@ Grad.“
„In Rio de Janeiro scheint die Sonne. Es ist zur Zeit 28 Grad.“
Generierung
Wetterberichte
Fachtagung „Digitale Kuratierungstechnologien“ 2015
Semantische Generierung
10
DKT Innovation
•  Enge Verknüpfung mit semantischer Analyse und Mehrsprachigkeit
•  Adaption von Stil, Grammatik etc. durch Textstrukturgrammatiken ->
Basis für Storytemplates
“The chancellor of Germany … will start in Brazil.”
http://www.dbpedia.org/resource/Brazil
„Brasilien hat über 200 Millionen Einwohner.
Bekannte Städte sind: Rio de Janeiro, ...“
Externe,
sprachübergreifend
e Wissensquellen
Textstruktur-
grammatiken ->
Story-templates
Semantische
Generierung
Ergebnis
semantische Analyse
Sprach- und Medien
übergreifende
Generierung –
„Den Nutzer
berühren“
Fachtagung „Digitale Kuratierungstechnologien“ 2015
Wichtig: Nutzerperspektiven
In vier Branchen ...
1.  ART&COM: Kommunikationslösungen für Museen,
Showrooms, Events etc.
2.  Condat: Redaktionen im Medienbereich, z.B. von TV/
Radio-Sendern
3.  3pc: Websites und mobile Anwendungen für Kunden aus
Wirtschaft, Wissenschaft und Kultur
4.  kreuzwerker: Gestaltung von Transformationsprozessen
im IT-Bereich
11Fachtagung „Digitale Kuratierungstechnologien“ 2015
Wichtig: Nutzerperspektiven
... mit verschiedenen Personas – exemplarische, typische
Nutzern und exemplarischen Herausforderungen in der
jeweiligen Branche
1.  Projektleiter für Ausstellungsentwurf
–  Herausforderung „Kooperative Erstellung von Inhalten“
2.  Medienredakteur
–  Berücksichtigung mehrsprachiger Inhalte
3.  Anwendungsentwickler für digitale Archive
–  Anpassung von Navigationsstrukturen in kuratierten
Inhalten
4.  Softwareintegrator für Kuratierungs-Workflows
–  Flexible Verknüpfung bestehender Softwareschnittstellen
12Fachtagung „Digitale Kuratierungstechnologien“ 2015
MOCKUPS FÜR DIE NUTZER
13Fachtagung „Digitale Kuratierungstechnologien“ 2015
Beispiele ...
... für einige Personas
1.  Projektleiter für Ausstellungsentwurf
–  Herausforderung „Kooperative Erstellung von Inhalten“
2.  Medienredakteur
–  Berücksichtigung mehrsprachiger Inhalte
Die Entwicklung der Sprach- und Wissenstechnologien
durch die Anforderungen der Kuratierungsbranchen leiten
14Fachtagung „Digitale Kuratierungstechnologien“ 2015
Projektleiter für Ausstellungsentwurf
•  „Ich muss Materialien sammeln ... tausende von Dateien
in unterschiedlichen Formaten, Textschnipseln ... Wie
bewahre ich den Überblick?“
•  Digitale Kuratierung: Wahrung der Provenienz
–  Jede Kuratierungseinheit hat einen eindeutigen
Identifikator – eine Webadresse
–  Der Workflow erlaubt beim Einbinden der Ressourcen die
URIs zu speichern
–  Beispiel dkt-demo/provenienz.html
•  Hochladen einer HTML-Datei in den Workflow
•  Analysieren von relevanten Textstücken, z.B.
Personennamen
•  URIs für die Daten als ganzes und für alle Entitäten
15Fachtagung „Digitale Kuratierungstechnologien“ 2015
Medienredakteur
•  „Ich muss bis morgen einen Artikel über ... schreiben.
Wie finde ich relevante Quellen über Sprachgrenzen
hinweg?“
•  Digitale Kuratierung: sprachübergreifender Zugang
–  Beispiel dkt-demo/medienredakteur.html
•  Redakteur gibt Satz mit verschiedenen Namen ein
•  Alle Namen werden automatisch identifiziert
•  Sprachübergreifende Schreibweisen werden aus Webquellen
gesucht
•  Eine Websuche mit den Schreibweisen wird ausgeführt
•  Die ersten Treffer werden automatisch übersetzt
•  Der Redakteur kann entscheiden ob er die Artikel manuell
übersetzen lässt
16Fachtagung „Digitale Kuratierungstechnologien“ 2015
Nächste Schritte
•  Nutzung der Kuratierungstechnologien analysieren
–  Durch die Entwickler der Kuratierungstechnologien
vorangetrieben
•  Sprach- und Wissenstechnologien den Anforderungen
entsprechend entwickeln
–  Keine Black Box Technologien mehr – den Nutzern das
geben, was sie brauchen
17Fachtagung „Digitale Kuratierungstechnologien“ 2015
Felix Sasaki und Georg Rehm
Mockups von Jan Nehring
DFKI GmbH – Forschungsbereich Sprachtechnologie, Berlin
Fachtagung „Digitale Kuratierungstechnologien“
Humboldtuniversität, Oktober 2015
Digitale Kuratierungstechnologien
Beispiele aus ausgewählten Branchen

Weitere ähnliche Inhalte

Ähnlich wie Digitale Kuratierungstechnologien – Beispiele aus ausgewählten Branchen

Kuratieren im Zeitalter der KI
Kuratieren im Zeitalter der KIKuratieren im Zeitalter der KI
Kuratieren im Zeitalter der KIGeorg Rehm
 
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Georg Rehm
 
Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?Semantic Web Company
 
CeBIT 2011: CONTENTUS goes Business im Internet der Dienste
CeBIT 2011: CONTENTUS goes Business im Internet der DiensteCeBIT 2011: CONTENTUS goes Business im Internet der Dienste
CeBIT 2011: CONTENTUS goes Business im Internet der Diensteacosta-consult
 
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...Georg Rehm
 
Onno Reiners: E-Learning einfach selbst erstellen
Onno Reiners: E-Learning einfach selbst erstellenOnno Reiners: E-Learning einfach selbst erstellen
Onno Reiners: E-Learning einfach selbst erstellenlernet
 
Horizon Report 2015 Library Edition
Horizon Report 2015 Library EditionHorizon Report 2015 Library Edition
Horizon Report 2015 Library EditionRudolf Mumenthaler
 
Digitale Kuratierungstechnologien für verschiedene Branchen und Anwendungssze...
Digitale Kuratierungstechnologien für verschiedene Branchen und Anwendungssze...Digitale Kuratierungstechnologien für verschiedene Branchen und Anwendungssze...
Digitale Kuratierungstechnologien für verschiedene Branchen und Anwendungssze...Georg Rehm
 
Automatisierte Generierung hybrider Apps für Mobile Devices
Automatisierte Generierung hybrider Apps für Mobile DevicesAutomatisierte Generierung hybrider Apps für Mobile Devices
Automatisierte Generierung hybrider Apps für Mobile DevicesJens Küsters
 
Traumziel MV: Relaunch eines Tourismusportals mit Typo3 Extbase und Fluid
Traumziel MV:  Relaunch eines Tourismusportals mit Typo3 Extbase und FluidTraumziel MV:  Relaunch eines Tourismusportals mit Typo3 Extbase und Fluid
Traumziel MV: Relaunch eines Tourismusportals mit Typo3 Extbase und FluidQbus Werbeagentur
 
3. PM-Tag Karlsruhe, Projektwissensmanagement
3. PM-Tag Karlsruhe, Projektwissensmanagement3. PM-Tag Karlsruhe, Projektwissensmanagement
3. PM-Tag Karlsruhe, ProjektwissensmanagementStefan Landwehr
 
Mit Domain-driven Design (DDD) nützliche und flexible Software bauen
Mit Domain-driven Design (DDD) nützliche und flexible Software bauenMit Domain-driven Design (DDD) nützliche und flexible Software bauen
Mit Domain-driven Design (DDD) nützliche und flexible Software bauenDigicomp Academy AG
 
Mehrsprachigkeit und semantische Technologien
Mehrsprachigkeit und semantische TechnologienMehrsprachigkeit und semantische Technologien
Mehrsprachigkeit und semantische TechnologienGeorg Rehm
 
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008Deutsche Digitale Bibliothek - Vorstellung CeBit 2008
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008Ralf Stockmann
 
E-teaching Präsenation
E-teaching PräsenationE-teaching Präsenation
E-teaching Präsenatione-teaching.org
 
Semantic Web Technologies - SS 2010 - 01 - Einfuehrung
Semantic Web Technologies - SS 2010 - 01 - EinfuehrungSemantic Web Technologies - SS 2010 - 01 - Einfuehrung
Semantic Web Technologies - SS 2010 - 01 - EinfuehrungSteffen Schloenvoigt
 
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...Becker Hans-Georg
 

Ähnlich wie Digitale Kuratierungstechnologien – Beispiele aus ausgewählten Branchen (20)

Kuratieren im Zeitalter der KI
Kuratieren im Zeitalter der KIKuratieren im Zeitalter der KI
Kuratieren im Zeitalter der KI
 
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
Transformieren, Manipulieren, Kuratieren: Technologien für die Wissensarbeit ...
 
Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?Linked Data - Das Ende des Dokuments?
Linked Data - Das Ende des Dokuments?
 
CeBIT 2011: CONTENTUS goes Business im Internet der Dienste
CeBIT 2011: CONTENTUS goes Business im Internet der DiensteCeBIT 2011: CONTENTUS goes Business im Internet der Dienste
CeBIT 2011: CONTENTUS goes Business im Internet der Dienste
 
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
Generische Kuratierungstechnologien für spezifische Anwendungsfälle: Hintergr...
 
Onno Reiners: E-Learning einfach selbst erstellen
Onno Reiners: E-Learning einfach selbst erstellenOnno Reiners: E-Learning einfach selbst erstellen
Onno Reiners: E-Learning einfach selbst erstellen
 
Horizon Report 2015 Library Edition
Horizon Report 2015 Library EditionHorizon Report 2015 Library Edition
Horizon Report 2015 Library Edition
 
Digitale Kuratierungstechnologien für verschiedene Branchen und Anwendungssze...
Digitale Kuratierungstechnologien für verschiedene Branchen und Anwendungssze...Digitale Kuratierungstechnologien für verschiedene Branchen und Anwendungssze...
Digitale Kuratierungstechnologien für verschiedene Branchen und Anwendungssze...
 
Automatisierte Generierung hybrider Apps für Mobile Devices
Automatisierte Generierung hybrider Apps für Mobile DevicesAutomatisierte Generierung hybrider Apps für Mobile Devices
Automatisierte Generierung hybrider Apps für Mobile Devices
 
Traumziel MV: Relaunch eines Tourismusportals mit Typo3 Extbase und Fluid
Traumziel MV:  Relaunch eines Tourismusportals mit Typo3 Extbase und FluidTraumziel MV:  Relaunch eines Tourismusportals mit Typo3 Extbase und Fluid
Traumziel MV: Relaunch eines Tourismusportals mit Typo3 Extbase und Fluid
 
1 - Einfuehrung
1 - Einfuehrung1 - Einfuehrung
1 - Einfuehrung
 
3. PM-Tag Karlsruhe, Projektwissensmanagement
3. PM-Tag Karlsruhe, Projektwissensmanagement3. PM-Tag Karlsruhe, Projektwissensmanagement
3. PM-Tag Karlsruhe, Projektwissensmanagement
 
Mit Domain-driven Design (DDD) nützliche und flexible Software bauen
Mit Domain-driven Design (DDD) nützliche und flexible Software bauenMit Domain-driven Design (DDD) nützliche und flexible Software bauen
Mit Domain-driven Design (DDD) nützliche und flexible Software bauen
 
SWT
SWTSWT
SWT
 
SWT2011 - 01 - Motivation
SWT2011 - 01 - MotivationSWT2011 - 01 - Motivation
SWT2011 - 01 - Motivation
 
Mehrsprachigkeit und semantische Technologien
Mehrsprachigkeit und semantische TechnologienMehrsprachigkeit und semantische Technologien
Mehrsprachigkeit und semantische Technologien
 
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008Deutsche Digitale Bibliothek - Vorstellung CeBit 2008
Deutsche Digitale Bibliothek - Vorstellung CeBit 2008
 
E-teaching Präsenation
E-teaching PräsenationE-teaching Präsenation
E-teaching Präsenation
 
Semantic Web Technologies - SS 2010 - 01 - Einfuehrung
Semantic Web Technologies - SS 2010 - 01 - EinfuehrungSemantic Web Technologies - SS 2010 - 01 - Einfuehrung
Semantic Web Technologies - SS 2010 - 01 - Einfuehrung
 
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
MODS2FRBRoo : Ein Tool zur Anbindung von bibliographischen Daten an eine Onto...
 

Mehr von Georg Rehm

QURATOR: A Flexible AI Platform for the Adaptive Analysis and Creative Genera...
QURATOR: A Flexible AI Platform for the Adaptive Analysis and Creative Genera...QURATOR: A Flexible AI Platform for the Adaptive Analysis and Creative Genera...
QURATOR: A Flexible AI Platform for the Adaptive Analysis and Creative Genera...Georg Rehm
 
Observations on Annotations – From Computational Linguistics and the World Wi...
Observations on Annotations – From Computational Linguistics and the World Wi...Observations on Annotations – From Computational Linguistics and the World Wi...
Observations on Annotations – From Computational Linguistics and the World Wi...Georg Rehm
 
The Preparation, Impact and Future of the META-NET White Paper Series “Europe...
The Preparation, Impact and Future of the META-NET White Paper Series “Europe...The Preparation, Impact and Future of the META-NET White Paper Series “Europe...
The Preparation, Impact and Future of the META-NET White Paper Series “Europe...Georg Rehm
 
AI and Conference Interpretation – From Smart Assistants for the Human Interp...
AI and Conference Interpretation – From Smart Assistants for the Human Interp...AI and Conference Interpretation – From Smart Assistants for the Human Interp...
AI and Conference Interpretation – From Smart Assistants for the Human Interp...Georg Rehm
 
Künstliche Intelligenz beim Dolmetschen und Übersetzen
Künstliche Intelligenz beim Dolmetschen und ÜbersetzenKünstliche Intelligenz beim Dolmetschen und Übersetzen
Künstliche Intelligenz beim Dolmetschen und ÜbersetzenGeorg Rehm
 
Herausforderungen und Lösungen für die europäische Sprachtechnologie- Forschu...
Herausforderungen und Lösungen für die europäische Sprachtechnologie- Forschu...Herausforderungen und Lösungen für die europäische Sprachtechnologie- Forschu...
Herausforderungen und Lösungen für die europäische Sprachtechnologie- Forschu...Georg Rehm
 
European Language Technologies – Past, Present and Future
European Language Technologies – Past, Present and FutureEuropean Language Technologies – Past, Present and Future
European Language Technologies – Past, Present and FutureGeorg Rehm
 
Towards a Human Language Project for Multilingual Europe: AI and Interpretation
Towards a Human Language Project for Multilingual Europe: AI and InterpretationTowards a Human Language Project for Multilingual Europe: AI and Interpretation
Towards a Human Language Project for Multilingual Europe: AI and InterpretationGeorg Rehm
 
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) ÜberblickKI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) ÜberblickGeorg Rehm
 
Language Technologies for Multilingual Europe - Towards a Human Language Proj...
Language Technologies for Multilingual Europe - Towards a Human Language Proj...Language Technologies for Multilingual Europe - Towards a Human Language Proj...
Language Technologies for Multilingual Europe - Towards a Human Language Proj...Georg Rehm
 
AI for Translation Technologies and Multilingual Europe
AI for Translation Technologies and Multilingual EuropeAI for Translation Technologies and Multilingual Europe
AI for Translation Technologies and Multilingual EuropeGeorg Rehm
 
Artificial Intelligence for the Film Industry
Artificial Intelligence for the Film IndustryArtificial Intelligence for the Film Industry
Artificial Intelligence for the Film IndustryGeorg Rehm
 
KI für die Kundenkommunikation
KI für die KundenkommunikationKI für die Kundenkommunikation
KI für die KundenkommunikationGeorg Rehm
 
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen BibliothekenDigitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen BibliothekenGeorg Rehm
 
EPUB, quo vadis? Publishing im W3C
EPUB, quo vadis? Publishing im W3CEPUB, quo vadis? Publishing im W3C
EPUB, quo vadis? Publishing im W3CGeorg Rehm
 
Human Language Technologies in a Multilingual Europe
Human Language Technologies in a Multilingual EuropeHuman Language Technologies in a Multilingual Europe
Human Language Technologies in a Multilingual EuropeGeorg Rehm
 
Language Technologies for Big Data – A Strategic Agenda for the Multilingual ...
Language Technologies for Big Data – A Strategic Agenda for the Multilingual ...Language Technologies for Big Data – A Strategic Agenda for the Multilingual ...
Language Technologies for Big Data – A Strategic Agenda for the Multilingual ...Georg Rehm
 
Multilingual Europe in late 2016 – A Strategic Research and Innovation Agenda...
Multilingual Europe in late 2016 – A Strategic Research and Innovation Agenda...Multilingual Europe in late 2016 – A Strategic Research and Innovation Agenda...
Multilingual Europe in late 2016 – A Strategic Research and Innovation Agenda...Georg Rehm
 
Multilingualism for Digital Europe
Multilingualism for Digital EuropeMultilingualism for Digital Europe
Multilingualism for Digital EuropeGeorg Rehm
 
Curation Technologies for Multilingual Europe
Curation Technologies for Multilingual EuropeCuration Technologies for Multilingual Europe
Curation Technologies for Multilingual EuropeGeorg Rehm
 

Mehr von Georg Rehm (20)

QURATOR: A Flexible AI Platform for the Adaptive Analysis and Creative Genera...
QURATOR: A Flexible AI Platform for the Adaptive Analysis and Creative Genera...QURATOR: A Flexible AI Platform for the Adaptive Analysis and Creative Genera...
QURATOR: A Flexible AI Platform for the Adaptive Analysis and Creative Genera...
 
Observations on Annotations – From Computational Linguistics and the World Wi...
Observations on Annotations – From Computational Linguistics and the World Wi...Observations on Annotations – From Computational Linguistics and the World Wi...
Observations on Annotations – From Computational Linguistics and the World Wi...
 
The Preparation, Impact and Future of the META-NET White Paper Series “Europe...
The Preparation, Impact and Future of the META-NET White Paper Series “Europe...The Preparation, Impact and Future of the META-NET White Paper Series “Europe...
The Preparation, Impact and Future of the META-NET White Paper Series “Europe...
 
AI and Conference Interpretation – From Smart Assistants for the Human Interp...
AI and Conference Interpretation – From Smart Assistants for the Human Interp...AI and Conference Interpretation – From Smart Assistants for the Human Interp...
AI and Conference Interpretation – From Smart Assistants for the Human Interp...
 
Künstliche Intelligenz beim Dolmetschen und Übersetzen
Künstliche Intelligenz beim Dolmetschen und ÜbersetzenKünstliche Intelligenz beim Dolmetschen und Übersetzen
Künstliche Intelligenz beim Dolmetschen und Übersetzen
 
Herausforderungen und Lösungen für die europäische Sprachtechnologie- Forschu...
Herausforderungen und Lösungen für die europäische Sprachtechnologie- Forschu...Herausforderungen und Lösungen für die europäische Sprachtechnologie- Forschu...
Herausforderungen und Lösungen für die europäische Sprachtechnologie- Forschu...
 
European Language Technologies – Past, Present and Future
European Language Technologies – Past, Present and FutureEuropean Language Technologies – Past, Present and Future
European Language Technologies – Past, Present and Future
 
Towards a Human Language Project for Multilingual Europe: AI and Interpretation
Towards a Human Language Project for Multilingual Europe: AI and InterpretationTowards a Human Language Project for Multilingual Europe: AI and Interpretation
Towards a Human Language Project for Multilingual Europe: AI and Interpretation
 
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) ÜberblickKI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick
KI, Sprachtechnologie und Digital Humanities: Ein (unvollständiger) Überblick
 
Language Technologies for Multilingual Europe - Towards a Human Language Proj...
Language Technologies for Multilingual Europe - Towards a Human Language Proj...Language Technologies for Multilingual Europe - Towards a Human Language Proj...
Language Technologies for Multilingual Europe - Towards a Human Language Proj...
 
AI for Translation Technologies and Multilingual Europe
AI for Translation Technologies and Multilingual EuropeAI for Translation Technologies and Multilingual Europe
AI for Translation Technologies and Multilingual Europe
 
Artificial Intelligence for the Film Industry
Artificial Intelligence for the Film IndustryArtificial Intelligence for the Film Industry
Artificial Intelligence for the Film Industry
 
KI für die Kundenkommunikation
KI für die KundenkommunikationKI für die Kundenkommunikation
KI für die Kundenkommunikation
 
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen BibliothekenDigitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
Digitale Kuratierungstechnologien: Anwendungsfälle in Digitalen Bibliotheken
 
EPUB, quo vadis? Publishing im W3C
EPUB, quo vadis? Publishing im W3CEPUB, quo vadis? Publishing im W3C
EPUB, quo vadis? Publishing im W3C
 
Human Language Technologies in a Multilingual Europe
Human Language Technologies in a Multilingual EuropeHuman Language Technologies in a Multilingual Europe
Human Language Technologies in a Multilingual Europe
 
Language Technologies for Big Data – A Strategic Agenda for the Multilingual ...
Language Technologies for Big Data – A Strategic Agenda for the Multilingual ...Language Technologies for Big Data – A Strategic Agenda for the Multilingual ...
Language Technologies for Big Data – A Strategic Agenda for the Multilingual ...
 
Multilingual Europe in late 2016 – A Strategic Research and Innovation Agenda...
Multilingual Europe in late 2016 – A Strategic Research and Innovation Agenda...Multilingual Europe in late 2016 – A Strategic Research and Innovation Agenda...
Multilingual Europe in late 2016 – A Strategic Research and Innovation Agenda...
 
Multilingualism for Digital Europe
Multilingualism for Digital EuropeMultilingualism for Digital Europe
Multilingualism for Digital Europe
 
Curation Technologies for Multilingual Europe
Curation Technologies for Multilingual EuropeCuration Technologies for Multilingual Europe
Curation Technologies for Multilingual Europe
 

Digitale Kuratierungstechnologien – Beispiele aus ausgewählten Branchen

  • 1. Felix Sasaki und Georg Rehm Mockups von Jan Nehring DFKI GmbH – Forschungsbereich Sprachtechnologie, Berlin Fachtagung „Digitale Kuratierungstechnologien“ Humboldtuniversität, Oktober 2015 Digitale Kuratierungstechnologien Beispiele aus ausgewählten Branchen
  • 2. Branchen Input Prozesse Software Output Tweet Analysieren Textverarbeitung Zeitungsartikel Zeitungsartikel Auswählen Präsentationen Multimedia-Website Agenturmeldung Fokussieren Tabellenkalkulation TV-Beitrag Facebook-Meldung Überarbeiten Email Ausstellungskatalog Suchergebnis Einlesen Browser Mobile Applikation Email Schreiben Groupware Mashup (z.B. Karte) SMS Gestalten Branchenapplikationen Textbeitrag Konzept Recherchieren CMS Konzept Textdateien Bewerten ECMS Zeitstrahl Video Evaluieren CRM Fachartikel Karte Ordnen Unternehmens-Software Studie Stockfotos Sortieren Grafik-/Layout-Software Präsentation In-house Datenbank Strukturieren Telefonie Faktensammlung Kalendereintrag Zusammenfassen etc. Exponatsartikel Spreadsheets Kürzen Analysen Archiv Übersetzen etc. etc. Informieren Kombinieren Abstrahieren Einordnen Visualisieren Generieren Annotieren Referenzieren etc. Enthalten, in jeweils unterschiedlichen Verhältnissen, Text, Daten, Metadaten, Bild, Video, Ton, Visualisierungen, sonstige interaktive Elemente, Multimedia-Bausteine, spezifische Textstrukturen etc.
  • 3. Branchen Input Prozesse Software Output Tweet Analysieren Textverarbeitung Zeitungsartikel Zeitungsartikel Auswählen Präsentationen Multimedia-Website Agenturmeldung Fokussieren Tabellenkalkulation TV-Beitrag Facebook-Meldung Überarbeiten Email Ausstellungskatalog Suchergebnis Einlesen Browser Mobile Applikation Email Schreiben Groupware Mashup (z.B. Karte) SMS Gestalten Branchenapplikationen Textbeitrag Konzept Recherchieren CMS Konzept Textdateien Bewerten ECMS Zeitstrahl Video Evaluieren CRM Fachartikel Karte Ordnen Unternehmens-Software Studie Stockfotos Sortieren Grafik-/Layout-Software Präsentation In-house Datenbank Strukturieren Telefonie Faktensammlung Kalendereintrag Zusammenfassen etc. Exponatsartikel Spreadsheets Kürzen Analysen Archiv Übersetzen etc. etc. Informieren Kombinieren Abstrahieren Einordnen Visualisieren Generieren Annotieren Referenzieren etc. Enthalten, in jeweils unterschiedlichen Verhältnissen, Text, Daten, Metadaten, Bild, Video, Ton, Visualisierungen, sonstige interaktive Elemente, Multimedia-Bausteine, spezifische Textstrukturen etc. Sprach- und Wissenstechnologien: •  Semantische Analyse (AP1) •  Mehrsprachigkeit (AP2) •  Semantische Generierung (AP3)
  • 4. Drei Funktionsbereiche •  Semantische Textanalyse: –  Anreicherung von Informationen mit Metadaten (z.B. zu Eigennamen) –  Automatisches Textzusammenfassen –  Integration von Informationen aus externen Datenquellen inkl. Provenance-Information, etwa LOD (z.B. DBpedia, Wikidata) •  Semantische Generierung: –  Hypertextualisierung und Aufbereitung von Informationssammlungen zu Texten und Hypertexten (Semantic Story Telling) –  Nutzung von Markup-Sprachen für thematische, räumliche, temporale Annotation und Darstellung •  Internationalisierung und Mehrsprachigkeit: –  Anwendung von W3C-Standards (z.B. ITS 2.0), Verknüpfung mit LOD –  Integration und Adaptation von maschineller Übersetzung (MT) 4Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 5. Semantische Analyse •  Geringe Präzision •  Keine Adaptierbarkeit •  „Nur Text“ Verarbeitung – erschwerte Einbindung in Workflows 5 State of the Art “The chancellor of Germany will visit several countries. Mrs. Merkel will start in Brazil.” ✖ ✖ ✖ Nicht analysiert Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 6. Semantische Analyse 6 DKT Innovation •  Hohe Präzision mit tiefer Verarbeitung •  Adaption zu Nutzer spezifischen Domänen •  Dokumentstruktur spezifische Abdeckung zahlreicher Inhaltsformate / - workflows “The chancellor of Germany will visit several countries. Mrs. Merkel will start in Brazil.” ✔ ✔ ✔ Analysiert ✔ “The chancellor …” Eingabe: Text, HTML, Word, ... Analyse (Domäne: Politik, Wirtschaft, ... „Meine In-House Domäne“) Weitere Kuratierungs- prozesse ✔ identisch Teil von Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 7. Mehrsprachigkeit •  Verbreitet: Maschinelle Übersetzung (MT) mit geringer Qualität (Inbound Translation) •  Wünschenswert: Hoch qualitative MT (HQMT) 7 State of the Art „Der Kanzler von Deutschland werden mehrere Länder besuchen. Frau Merkel in Brasilien zu starten.“ “The chancellor of Germany will visit several countries. Mrs. Merkel will start in Brazil.” Maschinelle Übersetzung ✖ ✖✖ ✖ Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 8. Mehrsprachigkeit 8 DKT Innovation •  Einfache Schnittstellen für Inbound Translation •  In Richtung HQMT: Adaption von MT durch externe Wissensquellen •  In Richtung HQMT: Verbesserung des MT Workflows durch standardisierte Metadaten „Der Kanzler von Deutschland wird mehrere Länder besuchen. Frau Merkel in Brasilien starten.“ “The chancellor of Germany will visit several countries. Mrs. Merkel will start in Brazil.” Maschinelle Übersetzung Externe Wissens- quellen Metadaten ✔✖ ✖ „wird“ fehlt Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 9. Semantische Generierung •  Verbreitet: Template-basierte Ansätze •  Geringe Sprach- und Domänenabdeckung 9 State of the Art „In @@@@ scheint die Sonne. Es ist zur Zeit @@@@ Grad.“ „In Rio de Janeiro scheint die Sonne. Es ist zur Zeit 28 Grad.“ Generierung Wetterberichte Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 10. Semantische Generierung 10 DKT Innovation •  Enge Verknüpfung mit semantischer Analyse und Mehrsprachigkeit •  Adaption von Stil, Grammatik etc. durch Textstrukturgrammatiken -> Basis für Storytemplates “The chancellor of Germany … will start in Brazil.” http://www.dbpedia.org/resource/Brazil „Brasilien hat über 200 Millionen Einwohner. Bekannte Städte sind: Rio de Janeiro, ...“ Externe, sprachübergreifend e Wissensquellen Textstruktur- grammatiken -> Story-templates Semantische Generierung Ergebnis semantische Analyse Sprach- und Medien übergreifende Generierung – „Den Nutzer berühren“ Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 11. Wichtig: Nutzerperspektiven In vier Branchen ... 1.  ART&COM: Kommunikationslösungen für Museen, Showrooms, Events etc. 2.  Condat: Redaktionen im Medienbereich, z.B. von TV/ Radio-Sendern 3.  3pc: Websites und mobile Anwendungen für Kunden aus Wirtschaft, Wissenschaft und Kultur 4.  kreuzwerker: Gestaltung von Transformationsprozessen im IT-Bereich 11Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 12. Wichtig: Nutzerperspektiven ... mit verschiedenen Personas – exemplarische, typische Nutzern und exemplarischen Herausforderungen in der jeweiligen Branche 1.  Projektleiter für Ausstellungsentwurf –  Herausforderung „Kooperative Erstellung von Inhalten“ 2.  Medienredakteur –  Berücksichtigung mehrsprachiger Inhalte 3.  Anwendungsentwickler für digitale Archive –  Anpassung von Navigationsstrukturen in kuratierten Inhalten 4.  Softwareintegrator für Kuratierungs-Workflows –  Flexible Verknüpfung bestehender Softwareschnittstellen 12Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 13. MOCKUPS FÜR DIE NUTZER 13Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 14. Beispiele ... ... für einige Personas 1.  Projektleiter für Ausstellungsentwurf –  Herausforderung „Kooperative Erstellung von Inhalten“ 2.  Medienredakteur –  Berücksichtigung mehrsprachiger Inhalte Die Entwicklung der Sprach- und Wissenstechnologien durch die Anforderungen der Kuratierungsbranchen leiten 14Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 15. Projektleiter für Ausstellungsentwurf •  „Ich muss Materialien sammeln ... tausende von Dateien in unterschiedlichen Formaten, Textschnipseln ... Wie bewahre ich den Überblick?“ •  Digitale Kuratierung: Wahrung der Provenienz –  Jede Kuratierungseinheit hat einen eindeutigen Identifikator – eine Webadresse –  Der Workflow erlaubt beim Einbinden der Ressourcen die URIs zu speichern –  Beispiel dkt-demo/provenienz.html •  Hochladen einer HTML-Datei in den Workflow •  Analysieren von relevanten Textstücken, z.B. Personennamen •  URIs für die Daten als ganzes und für alle Entitäten 15Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 16. Medienredakteur •  „Ich muss bis morgen einen Artikel über ... schreiben. Wie finde ich relevante Quellen über Sprachgrenzen hinweg?“ •  Digitale Kuratierung: sprachübergreifender Zugang –  Beispiel dkt-demo/medienredakteur.html •  Redakteur gibt Satz mit verschiedenen Namen ein •  Alle Namen werden automatisch identifiziert •  Sprachübergreifende Schreibweisen werden aus Webquellen gesucht •  Eine Websuche mit den Schreibweisen wird ausgeführt •  Die ersten Treffer werden automatisch übersetzt •  Der Redakteur kann entscheiden ob er die Artikel manuell übersetzen lässt 16Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 17. Nächste Schritte •  Nutzung der Kuratierungstechnologien analysieren –  Durch die Entwickler der Kuratierungstechnologien vorangetrieben •  Sprach- und Wissenstechnologien den Anforderungen entsprechend entwickeln –  Keine Black Box Technologien mehr – den Nutzern das geben, was sie brauchen 17Fachtagung „Digitale Kuratierungstechnologien“ 2015
  • 18. Felix Sasaki und Georg Rehm Mockups von Jan Nehring DFKI GmbH – Forschungsbereich Sprachtechnologie, Berlin Fachtagung „Digitale Kuratierungstechnologien“ Humboldtuniversität, Oktober 2015 Digitale Kuratierungstechnologien Beispiele aus ausgewählten Branchen