13. Standardisierung
hil_?
Dewey
Decimal
Classificabon
Chinese
Library
Classificabon
Library
of
Congress
Classificabon
Nippon
Decimal
Classificabon
Universal
Decimal
Classificabon
Basisklassifikabon
Regensburger
Verbundklassifikabon
…
Sasaki
–
Webtechcon
2011
13
14. Man
muss
wissen
wo(für)
Dewey
Decimal
Classificabon
Chinese
Library
Classificabon
Library
of
Congress
Classificabon
Nippon
Decimal
Classificabon
Universal
Decimal
Classificabon
Basisklassifikabon
Regensburger
Verbundklassifikabon
…
Geeignet
je
nach
Region,
Sprache,
wissenscha_lich
vs.
allgemein,
Fachgebiet,
...
Sasaki
–
Webtechcon
2011
14
15. Überblick
• Metadaten:
Warum?
• Geschichte
• Metadaten
im
Web
• Metadaten
und
Websearch
• Metadaten
und
Sprachtechnologie
• Fazit
Sasaki
–
Webtechcon
2011
15
21. Idenbfikatoren
HTTP
Header
Doctype
Im
Inhalt
Von
hkp://www.w3.org/TR/webarch/
Sasaki
–
Webtechcon
2011
21
22. Metadaten
im
Inhalt
–
für
ausgewählte
Zielgruppen
<span
xml:lang="zh-‐CN">[ zh-‐CN]</span>
Sprachtags
zur
<span
xml:lang="ja">[
ja]</span>
Glyphauswahl
<span
xml:lang="ko">[
ko]</span>
Sasaki
–
Webtechcon
2011
22
23. Metadaten
im
Inhalt
–
für
ausgewählte
Zielgruppen
WAI-‐ARIA
für
Accessibility
Sasaki
–
Webtechcon
2011
23
24. Metadaten
im
Inhalt
–
für
jeden
das
Passende
• Metadaten
und
CSS
–
was
ist
der
Unterschied?
• Keiner
–
nur
(potenbell)
unterschiedliche
Zielgruppen
• Metadaten
=
„Styling
für
besondere
Zwecke“
Sasaki
–
Webtechcon
2011
24
26. Zwischenfazit:
Metadaten
setzen
sich
durch
• Wenn
es
die
richbge
Mischung
gibt
– Metadatenproduzenten
– Metadatenkonsumenten
– Tools
die
beide
unterstützen
– Tolle
(=
besser
als
bisher)
Anwendungen
Sasaki
–
Webtechcon
2011
26
27. Zwischenfazit:
Metadaten
setzen
sich
durch
• Wenn
es
die
richbge
Mischung
gibt
– Metadatenproduzenten
– Metadatenkonsumenten
– Tools
die
beide
unterstützen
– Tolle
(=
besser
als
bisher)
Anwendungen
Triw
zu
für
Dosenproduzenten,
Bibliotheken
und
das
Web
...
Sasaki
–
Webtechcon
2011
27
28. Überblick
• Metadaten:
Warum?
• Geschichte
• Metadaten
im
Web
• Metadaten
und
Websearch
• Metadaten
und
Sprachtechnologie
• Fazit
Sasaki
–
Webtechcon
2011
28
29. Metadaten
und
Web
Search:
zunächst
ein
trauriges
Kapitel
...
Metadaten
Volltext-‐
rausschmeißen
index
Suchanfrage
Sasaki
–
Webtechcon
2011
29
31. Eine
(Miss?)erfolgsstory:
Webverzeichnisse
• =
(Bibliotheks)katalog
des
Web
– Beispiel
„Open
Directory
Project“
• Kribk
– Hierarchische
Struktur
–
das
(soziale)
Netz
ist
ein
Graph!
– Wem
gehört
das?
– Wer
trägt
bei?
• Dieses
Jahr
geschlossen:
„Google
Directory“
Sasaki
–
Webtechcon
2011
31
34. W3C
„Ontology
for
Media
Resources“:
Mapping
macht
das
Leben
leichter
Sasaki
–
Webtechcon
2011
34
35. W3C
„Ontology
for
Media
Resources“:
Mapping
macht
das
Leben
leichter
Mapping
Definibon:
hkp://www.w3.org/TR/mediaont-‐10/
API
zur
übergreifenden
Abfrage:
hkp://www.w3.org/TR/mediaont-‐api-‐1.0/
Sasaki
–
Webtechcon
2011
35
36. Web
Search
ohne
Metadaten:
Suche
nach
„Bank“
Sasaki
–
Webtechcon
2011
36
37. Zwischenfazit
(Wdh.):
Metadaten
setzen
sich
durch
• Wenn
es
die
richbge
Mischung
gibt
– Metadatenproduzenten
– Metadatenkonsumenten
– Tools
die
beide
unterstützen
– Tolle
(=
besser
als
bisher)
Anwendungen
Sasaki
–
Webtechcon
2011
37
38. Zwischenfazit
(Wdh.):
Metadaten
setzen
sich
durch
• Wenn
es
die
richbge
Mischung
gibt
– Metadatenproduzenten:
Webdeveloper,
CMS
(z.B.
Drupal)
– Metadatenkonsumenten:
Suchmaschinen
– Tools
die
beide
unterstützen:
Rich
Snippets
Tesbng
Tool
– Tolle
(=
besser
als
bisher)
Anwendungen:
Die
„richbge“
Bank
finden
Sasaki
–
Webtechcon
2011
38
39. schema.org
• Vokabular
von
Metadaten
• Von
Bing,
Google,
Yahoo!
„verstanden“
• Kann
das
„Bank“
Problem
lösen
Sasaki
–
Webtechcon
2011
39
43. schema.org
Ein
Vokabular
Schreibweise
Schreibweise
RDFa
Microdata
Brücke
zum
Semanbc
Web
Sasaki
–
Webtechcon
2011
43
44. schema.org
Ein
Vokabular
Schreibweise
Schreibweise
RDFa
Microdata
Brücke
zum
Auf
Semanbc
Web
schema.org
verwendet
Sasaki
–
Webtechcon
2011
44
45. schema.org
Ein
entscheidend
Vokabular
Schreibweise
Schreibweise
RDFa
Microdata
Brücke
zum
Auf
Semanbc
Web
schema.org
verwendet
Sasaki
–
Webtechcon
2011
45
47. Überblick
• Metadaten:
Warum?
• Geschichte
• Metadaten
im
Web
• Metadaten
und
Websearch
• Metadaten
und
Sprachtechnologie
• Fazit
Sasaki
–
Webtechcon
2011
47
48. Metadatenlücke
in
der
maschinellen
Übersetzung
(vgl.
wtc
2010)
• Eingabe
aus
www.postbank.de
„Ob
Postbank
direkt,
Online-‐Banking,
Online-‐Brokerage
oder
myBHW.
Die
häufigsten
Fragen
zu
unseren
Transakbonssystemen
finden
Sie
an
dieser
Stelle.“
• Ausgabe
via
online
MT
system
“Whether
Postbank
direct,
online
banking,
online
brokerage
or
myBHW.
Frequently
asked
quesbons
about
our
transacbon
systems
can
be
found
at
this
locabon.”
Sasaki
–
Webtechcon
2011
48
49. Metadatenlücke
in
der
maschinellen
Übersetzung
(vgl.
wtc
2010)
• Eingabe
aus
www.postbank.de
Terminologie
„Ob
Postbank
direkt,
Online-‐Banking,
wurde
Online-‐Brokerage
oder
myBHW.
Die
fälschlicherweise
häufigsten
Fragen
zu
unseren
Transakbonssystemen
finden
Sie
an
übersetzt
–
dieser
Stelle.“
warum?
• Ausgabe
via
online
MT
system
“Whether
Postbank
direct,
online
banking,
online
brokerage
or
myBHW.
Frequently
asked
quesbons
about
our
transacbon
systems
can
be
found
at
this
locabon.”
Sasaki
–
Webtechcon
2011
49
50. Prozess:
vom
„Deep
Web“
zum
„Surface
Web“
• Eingabe
aus
dem
„Deep
Web“:
Terminology
„Ob
<term>Postbank
direkt</term>,
(=
metadata)
…
<term>Online-‐Banking</term>,
<term>Online-‐Brokerage</term>
…“
Publikabons-‐
prozess
• Ausgabe
im
Web:
„Ob
<em>Postbank
direkt</em>,
…
ist
verloren
<em>Online-‐Banking</em>,
<em>Online-‐Brokerage</em>
…“
im
Web
L
Sasaki
–
Webtechcon
2011
50
51. Zukün_ige
W3C
Arbeitsgruppe
„MLW-‐LT“:
Metadatenlücken
schließen
• DFKI
• Insbtut
Jozef
Stefan
• Trinity
College
Dublin
• University
of
Limerick
• Dublin
City
University
• Cocomore
• Moravia
• Linguaserve
• Univ.
of
Econ.
Prague
• VistaTEC
• Microso_
• Lucy
So_ware
• Enlaso
• Alchemy
So_ware
W3C
als
Ort
der
Standardisierung
Sasaki
–
Webtechcon
2011
51
52. Zukün_ige
W3C
Arbeitsgruppe
„MLW-‐LT“:
Metadatenlücken
schließen
• DFKI
• Insbtut
Jozef
Stefan
• Trinity
College
Dublin
• University
of
Limerick
• Dublin
City
University
• Cocomore
• Moravia
• Linguaserve
• Univ.
of
Econ.
Prague
• VistaTEC
• Microso_
• Lucy
So_ware
• Enlaso
• Alchemy
So_ware
W3C
als
Ort
der
Standardisierung
Sasaki
–
Webtechcon
2011
52
53. Zwischenfazit
(Wdh.):
Metadaten
setzen
sich
durch
• Wenn
es
die
richbge
Mischung
gibt
– Metadatenproduzenten
– Metadatenkonsumenten
– Tools
die
beide
unterstützen
– Tolle
(=
besser
als
bisher)
Anwendungen
Sasaki
–
Webtechcon
2011
53
54. Zwischenfazit
(Wdh.):
Metadaten
setzen
sich
durch
• Wenn
es
die
richbge
Mischung
gibt
– Metadatenproduzenten:
Lokalisierungsfirmen,
Webdeveloper,
CMS
Provider,
...
– Metadatenkonsumenten:
MT
Tools,
Lokalisierungsfirmen
– Tools
die
beide
unterstützen:
Online
MT
Tools
– Tolle
(=
besser
als
bisher)
Anwendungen:
Bessere
Sprachtechnologie
Sasaki
–
Webtechcon
2011
54
55. Überblick
• Metadaten:
Warum?
• Geschichte
• Metadaten
im
Web
• Metadaten
und
Websearch
• Metadaten
und
Sprachtechnologie
• Fazit
Sasaki
–
Webtechcon
2011
55
56. Fazit
=
Zwischenfazit:
Metadaten
setzen
sich
durch
• Wenn
es
die
richbge
Mischung
gibt
– Metadatenproduzenten
– Metadatenkonsumenten
– Tools
die
beide
unterstützen
– Tolle
(=
besser
als
bisher)
Anwendungen
Sasaki
–
Webtechcon
2011
56
57. Warum
Metadaten?
Ein
Plädoyer
und
mehr
…
Felix
Sasaki
DFKI
/
FH
Potsdam
felix.sasaki@dIi.de
Sasaki
–
Webtechcon
2011
57