Enabling Collaboration on Semiformal Mathematical Knowledge by Semantic Web I...
Web-2.0-Forschung der KWARC-Gruppe
1. Web-2.0-Forschung der KWARC-Gruppe
3. Web Montag Bremen
Christoph Lange, Matthias Bröcheler
International University Bremen
(Jacobs University Bremen ab Frühjahr 2007)
27. November 2006
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 1 / 18
2. Inhalt
1 KWARC@IUB
2 Grundlagen
Semantic Web
OMDoc
3 Projekte
Was kann man mit OMDoc machen?
Wo kriegt man die Daten her?
4 Ausblick
5 Quellen
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 2 / 18
3. KWARC@IUB
Wir und unsere Interessen
http://kwarc.eecs.iu-bremen.de
Arbeitsgruppe um Prof. Michael Kohlhase an der
International University Bremen und am DFKI
(Deutsches Forschungszentrum für künstliche Intelligenz)
1 Professor, 1 Dozent, 5 Doktoranden, 2 Master-Studenten,
≈ 5 Bachelor-Studenten
Interessen:
KWARC = „Knowledge Adaptation and Reasoning for Content“?
Semantik von Dokumentstrukturen mit formaler Logik untersuchen
Mathematisches Wissen verwalten
Mehrwertdienste auf Wissenssammlungen
E-Learning, soziale Software, Communities of Practice
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 3 / 18
4. KWARC@IUB
Wir und unsere Interessen
http://kwarc.eecs.iu-bremen.de
Arbeitsgruppe um Prof. Michael Kohlhase an der
International University Bremen und am DFKI
(Deutsches Forschungszentrum für künstliche Intelligenz)
1 Professor, 1 Dozent, 5 Doktoranden, 2 Master-Studenten,
≈ 5 Bachelor-Studenten
Interessen:
KWARC = „Knowledge Adaptation and Reasoning for Content“?
Semantik von Dokumentstrukturen mit formaler Logik untersuchen
Mathematisches Wissen verwalten
Mehrwertdienste auf Wissenssammlungen
E-Learning, soziale Software, Communities of Practice
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 3 / 18
5. Grundlagen Semantic Web
Semantic Web für Web-2.0-Kenner
Wissenschaft hinter einem Teil des Web 2.0 (Folksonomien,
Mikroformaten, Webservice-Beschreibung, intelligente
Suchmaschinen)
„Schwache Künstliche Intelligenz“ (Leuf): Metadaten
dranschreiben („annotieren“), bis es die Maschine verstehen kann
Statt Ad-Hoc-Tagging: einheitliches Vokabular („Ontologien“)
verwenden
Statt Hacks und Mashups: Logisches Schlussfolgern auf
Wissensdatenbank
⇒ Allgemeiner, flexibler, skalierbarer, zukunftssicherer als Web 2.0
. . . aber (noch) wenige nicht-akademische Software
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 4 / 18
6. Grundlagen Semantic Web
Semantic Web für Web-2.0-Kenner
Wissenschaft hinter einem Teil des Web 2.0 (Folksonomien,
Mikroformaten, Webservice-Beschreibung, intelligente
Suchmaschinen)
„Schwache Künstliche Intelligenz“ (Leuf): Metadaten
dranschreiben („annotieren“), bis es die Maschine verstehen kann
Statt Ad-Hoc-Tagging: einheitliches Vokabular („Ontologien“)
verwenden
Statt Hacks und Mashups: Logisches Schlussfolgern auf
Wissensdatenbank
⇒ Allgemeiner, flexibler, skalierbarer, zukunftssicherer als Web 2.0
. . . aber (noch) wenige nicht-akademische Software
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 4 / 18
7. Grundlagen Semantic Web
Semantic Web für Web-2.0-Kenner
Wissenschaft hinter einem Teil des Web 2.0 (Folksonomien,
Mikroformaten, Webservice-Beschreibung, intelligente
Suchmaschinen)
„Schwache Künstliche Intelligenz“ (Leuf): Metadaten
dranschreiben („annotieren“), bis es die Maschine verstehen kann
Statt Ad-Hoc-Tagging: einheitliches Vokabular („Ontologien“)
verwenden
Statt Hacks und Mashups: Logisches Schlussfolgern auf
Wissensdatenbank
⇒ Allgemeiner, flexibler, skalierbarer, zukunftssicherer als Web 2.0
. . . aber (noch) wenige nicht-akademische Software
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 4 / 18
8. Grundlagen Semantic Web
Semantic Web braucht Web 2.0
Semantic Web deckt nicht das ganze Web 2.0 ab
Semantische Software muss nicht sozial sein (kann aber)
nicht an bestimmte Software-Umgebung gebunden; alles kann
semantisch erweitert werden: Wiki, Blog, aber auch Desktop
sagt nichts über Benutzerschnittstelle (z.B. Ajax)
⇒ Web 2.0 liefert die ideale Benutzerschnittstelle und die Community fürs
Semantic Web
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 5 / 18
9. Grundlagen OMDoc
Unsere Grundlage: das Datenformat OMDoc
Mathematik ist stark strukturiert und können wir gut, also probieren wir
unsere Ideen zuerst daran aus
Open Mathematical Documents: „semantisches MathML“ auch für
größere Strukturen als Formeln
Wir betten Formeln in Kontext ein („Theorien“), um ihnen
Bedeutung zu geben: Definition/Satz/Beweis/Beispiel,
Abhängigkeiten zwischen Theorien
Von grober Strukturierung bis zu exakter Formalisierung
Wenn man das macht, können es Maschinen besser verstehen
⇒ viele Anwendungen im Bereich E-Learning, Datenaustausch,
automatisches Beweisen, Suchen, . . .
Ziel: Ergebnisse von Mathematik auf andere Gebiete übertragen
Anwendungen in Physik, Geowissenschaften, Autoindustrie und
Rechtswesen geplant
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 6 / 18
10. Grundlagen OMDoc
Unsere Grundlage: das Datenformat OMDoc
Mathematik ist stark strukturiert und können wir gut, also probieren wir
unsere Ideen zuerst daran aus
Open Mathematical Documents: „semantisches MathML“ auch für
größere Strukturen als Formeln
Wir betten Formeln in Kontext ein („Theorien“), um ihnen
Bedeutung zu geben: Definition/Satz/Beweis/Beispiel,
Abhängigkeiten zwischen Theorien
Von grober Strukturierung bis zu exakter Formalisierung
Wenn man das macht, können es Maschinen besser verstehen
⇒ viele Anwendungen im Bereich E-Learning, Datenaustausch,
automatisches Beweisen, Suchen, . . .
Ziel: Ergebnisse von Mathematik auf andere Gebiete übertragen
Anwendungen in Physik, Geowissenschaften, Autoindustrie und
Rechtswesen geplant
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 6 / 18
11. Grundlagen OMDoc
Unsere Grundlage: das Datenformat OMDoc
Mathematik ist stark strukturiert und können wir gut, also probieren wir
unsere Ideen zuerst daran aus
Open Mathematical Documents: „semantisches MathML“ auch für
größere Strukturen als Formeln
Wir betten Formeln in Kontext ein („Theorien“), um ihnen
Bedeutung zu geben: Definition/Satz/Beweis/Beispiel,
Abhängigkeiten zwischen Theorien
Von grober Strukturierung bis zu exakter Formalisierung
Wenn man das macht, können es Maschinen besser verstehen
⇒ viele Anwendungen im Bereich E-Learning, Datenaustausch,
automatisches Beweisen, Suchen, . . .
Ziel: Ergebnisse von Mathematik auf andere Gebiete übertragen
Anwendungen in Physik, Geowissenschaften, Autoindustrie und
Rechtswesen geplant
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 6 / 18
12. Projekte Was kann man mit OMDoc machen?
MathWebSearch: Suche nach mathematischen Formeln
http://search.mathweb.org
eine OMDoc-Anwendung für kleine Strukturen (= Formeln)
a · (b + c) kann dasselbe sein wie (x + y ) · z (Umbenennung von
Symbolen, Reihenfolge)
MathWebSearch crawlt und indiziert mathematische Datenquellen
Suchanfrage ist Formel mit Platzhaltern ((?+?)·?), System kennt
Eigenschaften der Operatoren
Benutzerschnittstelle: Anfrage in XML-Sprache eingeben oder über
grafischen Formeleditor
Webservice-API für andere Anwendungen
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 7 / 18
13. Projekte Was kann man mit OMDoc machen?
MathWebSearch: Suche nach mathematischen Formeln
http://search.mathweb.org
eine OMDoc-Anwendung für kleine Strukturen (= Formeln)
a · (b + c) kann dasselbe sein wie (x + y ) · z (Umbenennung von
Symbolen, Reihenfolge)
MathWebSearch crawlt und indiziert mathematische Datenquellen
Suchanfrage ist Formel mit Platzhaltern ((?+?)·?), System kennt
Eigenschaften der Operatoren
Benutzerschnittstelle: Anfrage in XML-Sprache eingeben oder über
grafischen Formeleditor
Webservice-API für andere Anwendungen
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 7 / 18
14. Projekte Was kann man mit OMDoc machen?
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 8 / 18
15. Projekte Was kann man mit OMDoc machen?
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 9 / 18
16. Projekte Was kann man mit OMDoc machen?
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 10 / 18
17. Projekte Was kann man mit OMDoc machen?
Locutor: Management of Change
eine OMDoc-Anwendung für große Strukturen
Viele Systeme können Dokumente verwalten, aber Abhängigkeiten
zwischen diesen?
Lehrbücher und Vorträge bestehen aus Abschnitts-Bausteinen, . . .
. . . die untereinander mehr oder wenig starke Abhängigkeiten haben –
nicht nur in der Mathematik
Eine Änderung einer Begriffsdefinition kann alle
Dokumente/Abschnitte nutzlos machen, die diesen Begriff verwenden!
Wenn Michael Dokument A ändert, wie wirkt sich das auf Dokument
B aus (. . . welches Matthias morgen bearbeiten will)?
Unterscheide Semantik-Änderung von Korrektur eines Tippfehlers
Je mehr strukturelle Semantik, desto bessere Assistenz
Ziel: Locutor als Dienst, nutzbar in Versionsverwaltung (z.B.
Subversion) oder Wiki
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 11 / 18
18. Projekte Was kann man mit OMDoc machen?
Locutor: Management of Change
eine OMDoc-Anwendung für große Strukturen
Viele Systeme können Dokumente verwalten, aber Abhängigkeiten
zwischen diesen?
Lehrbücher und Vorträge bestehen aus Abschnitts-Bausteinen, . . .
. . . die untereinander mehr oder wenig starke Abhängigkeiten haben –
nicht nur in der Mathematik
Eine Änderung einer Begriffsdefinition kann alle
Dokumente/Abschnitte nutzlos machen, die diesen Begriff verwenden!
Wenn Michael Dokument A ändert, wie wirkt sich das auf Dokument
B aus (. . . welches Matthias morgen bearbeiten will)?
Unterscheide Semantik-Änderung von Korrektur eines Tippfehlers
Je mehr strukturelle Semantik, desto bessere Assistenz
Ziel: Locutor als Dienst, nutzbar in Versionsverwaltung (z.B.
Subversion) oder Wiki
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 11 / 18
19. Projekte Was kann man mit OMDoc machen?
Locutor: Management of Change
eine OMDoc-Anwendung für große Strukturen
Viele Systeme können Dokumente verwalten, aber Abhängigkeiten
zwischen diesen?
Lehrbücher und Vorträge bestehen aus Abschnitts-Bausteinen, . . .
. . . die untereinander mehr oder wenig starke Abhängigkeiten haben –
nicht nur in der Mathematik
Eine Änderung einer Begriffsdefinition kann alle
Dokumente/Abschnitte nutzlos machen, die diesen Begriff verwenden!
Wenn Michael Dokument A ändert, wie wirkt sich das auf Dokument
B aus (. . . welches Matthias morgen bearbeiten will)?
Unterscheide Semantik-Änderung von Korrektur eines Tippfehlers
Je mehr strukturelle Semantik, desto bessere Assistenz
Ziel: Locutor als Dienst, nutzbar in Versionsverwaltung (z.B.
Subversion) oder Wiki
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 11 / 18
20. Projekte Wo kriegt man die Daten her?
arXMLiv: Annotation wissenschaftlicher Artikel
Automatisierte Gewinnung von OMDoc-Daten im großen Stil
arXiv: Server mit über 400.000 vorveröffentlichten wissenschaftlichen
Artikeln
Nicht semantisch, Suche im Volltext oder nach Kategorien
A
arXMLiv: automatische Konvertierung der arXiv-Dokumente von LTEX
zu strukturiertem (oder besser noch: semantisch annotiertem) XML
. . . damit sie für MathWebSearch & Co. nutzbar werden
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 12 / 18
21. Projekte Wo kriegt man die Daten her?
arXMLiv: Annotation wissenschaftlicher Artikel
Automatisierte Gewinnung von OMDoc-Daten im großen Stil
arXiv: Server mit über 400.000 vorveröffentlichten wissenschaftlichen
Artikeln
Nicht semantisch, Suche im Volltext oder nach Kategorien
A
arXMLiv: automatische Konvertierung der arXiv-Dokumente von LTEX
zu strukturiertem (oder besser noch: semantisch annotiertem) XML
. . . damit sie für MathWebSearch & Co. nutzbar werden
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 12 / 18
22. Projekte Wo kriegt man die Daten her?
SWiM: Semantisches Wiki für Mathematik
Community erstellt und bearbeitet (OMDoc-)Wissen
Semantisches Wiki = Wiki mit Semantic-Web-Erweiterungen
Seite beschreibt genau ein „Konzept“ oder „Ding“ (z.B. den 3.
Webmontag in Bremen)
Link stellt eine bestimmte Art von Beziehung dar (z.B. „nimmt an
Veranstaltung teil“)
Wurde schon Wikipedia-tauglich implementiert (Sem. MediaWiki)
OMDoc-Dokumente auf Wiki-Seiten zuschneiden, Links (z.B.
„Beispiel erklärt Satz“) explizit darstellen (in Begriffen einer
Ontologie) und navigierbar machen Mehrwertdienst
Bisher Prototyp (mit Demo), noch viel zu tun:
Zerstörung von Abhängigkeiten verhindern (Management of Change)
Social Tagging: Wie schwierig finden Leser ein Beispiel?
Benutzerschnittstelle: Weg vom nackten XML, Auto-Completion
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 13 / 18
23. Projekte Wo kriegt man die Daten her?
SWiM: Semantisches Wiki für Mathematik
Community erstellt und bearbeitet (OMDoc-)Wissen
Semantisches Wiki = Wiki mit Semantic-Web-Erweiterungen
Seite beschreibt genau ein „Konzept“ oder „Ding“ (z.B. den 3.
Webmontag in Bremen)
Link stellt eine bestimmte Art von Beziehung dar (z.B. „nimmt an
Veranstaltung teil“)
Wurde schon Wikipedia-tauglich implementiert (Sem. MediaWiki)
OMDoc-Dokumente auf Wiki-Seiten zuschneiden, Links (z.B.
„Beispiel erklärt Satz“) explizit darstellen (in Begriffen einer
Ontologie) und navigierbar machen Mehrwertdienst
Bisher Prototyp (mit Demo), noch viel zu tun:
Zerstörung von Abhängigkeiten verhindern (Management of Change)
Social Tagging: Wie schwierig finden Leser ein Beispiel?
Benutzerschnittstelle: Weg vom nackten XML, Auto-Completion
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 13 / 18
24. Projekte Wo kriegt man die Daten her?
SWiM: Semantisches Wiki für Mathematik
Community erstellt und bearbeitet (OMDoc-)Wissen
Semantisches Wiki = Wiki mit Semantic-Web-Erweiterungen
Seite beschreibt genau ein „Konzept“ oder „Ding“ (z.B. den 3.
Webmontag in Bremen)
Link stellt eine bestimmte Art von Beziehung dar (z.B. „nimmt an
Veranstaltung teil“)
Wurde schon Wikipedia-tauglich implementiert (Sem. MediaWiki)
OMDoc-Dokumente auf Wiki-Seiten zuschneiden, Links (z.B.
„Beispiel erklärt Satz“) explizit darstellen (in Begriffen einer
Ontologie) und navigierbar machen Mehrwertdienst
Bisher Prototyp (mit Demo), noch viel zu tun:
Zerstörung von Abhängigkeiten verhindern (Management of Change)
Social Tagging: Wie schwierig finden Leser ein Beispiel?
Benutzerschnittstelle: Weg vom nackten XML, Auto-Completion
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 13 / 18
25. Projekte Wo kriegt man die Daten her?
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 14 / 18
26. Projekte Wo kriegt man die Daten her?
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 15 / 18
27. Projekte Wo kriegt man die Daten her?
CPoint: Semantische Dokumente im Office
Einzelanwender schreibt OMDoc in vertrauter Arbeitsumgebung
OMDoc-Editor als PowerPoint-Plugin (invasiver Editor)
Strukturelle Semantik für Anwender: Keine spitzen Klammern mehr
schreiben!
Migrationspfad: Annotation bereits vorhandener Kursfolien, Export
ins Semantic Web möglich
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 16 / 18
28. Ausblick
KWARC und die Web-2.0-Community
Wir bieten: Semantic Web, Ontologien, formale Logik: solide Grundlagen
für ein besseres Web 2.0 – wenn sie wirklich angewendet
werden!
Wir suchen: Industriekooperationen, Wünsche der Anwender
(Einzelanwender und Communities), Ideen für
Benutzerschnittstellen
Vielen Dank!
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 17 / 18
29. Quellen
Quellen
Semantic Web G. Antoniou, F. v. Harmelen: A Semantic Web Primer
(Buch, 2004)
B. Leuf: The Semantic Web: Crafting Infrastructures for
Agency (Buch, 2006)
OMDoc M. Kohlhase: OMDoc: An Open Markup Format for
Mathematical Documents (Buch, 2006)
MathWebSearch M. Kohlhase, I. Șucan: A Search Engine for
Mathematical Formulae (Konferenzbeitrag, 2006)
Locutor N. Müller: An Ontology-Driven Management of Change
(Konferenzbeitrag, 2006)
SWiM Ch. Lange: A Semantic Wiki for Mathematical Knowledge
Management (Diplomarbeit, 2006; Poster)
CPoint A. Kohlhase: CPoint – ein invasiver, semantischer Editor für
wiederverwendaren Content in MS PowerPoint
(Konferenzbeitrag, 2006)
Ch. Lange/M. Bröcheler (IU Bremen) Web-2.0-Forschung der KWARC-Gruppe 27. November 2006 18 / 18