Présentation de Lukas Rosenthaler (Image und Media Lab, Uni. Basel): "Rete Fontium - Ein neues web-basiertes Forschungswerkzeug für die Geisteswissenschaften", présentée lors du colloque infoclio.ch à Berne le 16 septembre 2010.
"Rete Fontium" ist eine Web-2.0 Plattform, welche Werkzeuge zur wissenschaftlichen Bearbeitung von Digitalisaten und digitalen Quellen anbietet. Mit dem primären Werkzeug können beliebige Bild- und Textelemente miteinander verglichen, verknüpft und mit Annotationen versehen werden. Die dadurch entstehenden vernetzten Informationen können sowohl für eigene Publikationen als auch für weitere Forschung oder für die Lehre verwendet werden. ReteFontium baut dabei auf einer erweiterten Implementation des vom World Wide Web Consortiums (W3C) für das "semantic web" vorgeschlagenen Datenmodells (Resource Description Frameworkl) auf und erlaubt damit eine flexible, Quellen-zentrierte Datenmodellierung, mit der auch Quellen anderer Datenanbieter wie z.B. e-codices etc. eingebunden werden können. Damit wird in einer neuartigen Weise eine erweiterte Nutzung von online zur Verfügung gestellten Digitalisaten für Forschung und Lehre ermöglicht."
LAKO Kreativpreis_2024_Startnummer_02_(LFS_LA).pdf
L. Rosenthaler (Image und Media Lab, Uni. Basel) - Rete Fontium - Ein neues web-basiertes Forschungswerkzeug für die Geisteswissenschaften
1. Rete Fontium
System for Annotation and Linkage
of
Sources in Arts and Humanities
Ein Forschungswerkzeug für digitale Quellen
1
Thursday, September 16, 2010
2. Rete Fontium
SALSAH
System for Annotation and Linkage
of
Sources in Arts and Humanities
Ein Forschungswerkzeug für digitale Quellen
1
Thursday, September 16, 2010
3. Ausgangslage
• Viele “Quellen” sind heute digital
verfügbar
•keine Möglichkeiten zur
Interaktion
•“nur” passive Betrachtung
2
Thursday, September 16, 2010
4. Unbefriedigende Situation:
•keine Möglichkeiten zur
Digitalisate enden in “Daten-Silos”
Interaktion:
- Kommentieren (Annotation)
- Verknüpfung (Linkage)
- Kollaboration
3
Thursday, September 16, 2010
5. Was wäre notwendig?
• Werkzeug zur wissenschaftlichen Bearbeitung von
Digitalisaten und digitalen Quellen
• Vernetzung von internen und externen Quellen durch “rich
links”
• Annotationen von Quellen und Digitalisaten
(Kommentare, Bemerkungen etc.)
• Kollaboration: sharing / Experten-WiKi
• Transkriptionshilfe
4
Thursday, September 16, 2010
6. Lösungsvorschlag: SALSAH
• eine Rich Internet Application mit folgenden Eigenschaften:
- Web 2.5 (geht weiter als kollaborative Applikationen, da
Teile des semantischen Webs unterstützt werden können
[z.B. Ontologien])
- Unterstützt gleichzeitig mehrere (viele)
Forschungsprojekte ( Synergien)
- Daten können “privat” oder gemeinsam genutzt werden
(feingliedrige Rechteverwaltung für Sichtung, Annotation,
Metadaten [Ändern und hinzufügen] und neue Quellen)
- Quellen können von externen “Quellen-Provider”
stammen (z.B. e-codices, DDS etc.)
5
Thursday, September 16, 2010
7. Architektur von SALSAH
Server Webbrowser
JavaScript/
jQuery
PHP/
Apache Internet
HTML5
MySQL
Internet
Webservices
Repository for
Extended RDF- Data
digital
Database Data provider 3
representations
Data provider 2
provider 1
6
Thursday, September 16, 2010
9. Resource Description
Framework (RDF)
• Daten werden als “Triplet” aus Subjekt,
Prädikat und Objekt dargestellt
Dieses Buch hat den Titel “Das Narrenschiff”
Dieses Buch hat den Autor “Sebstian Brant”
Dieses Buch hat die Transkription narrenschiff.xml
8
Thursday, September 16, 2010
10. RDF-Informationstripel
http://www.fruehdrucke.ch/narrenschiff.rb Subjekt
hat einen Titel mit dem Prädikat
Wert “Das Narrenschiff” Objekt
http://www.salsah.org/narrenschiff.php
http://www.fruehdrucke.ch/predicates/title
http://www.salsah.org/predicates/transcription
http://www.salsah.org/predicates/author
Das Narrenschiff
http://www.salsah.org/
transcription/narrenschiff.xml
Sebastian Brant
9
Thursday, September 16, 2010
11. Kompliziertes Beispiel
Gemälde
ist ein
Heilanstalt Waldau Autor Adolf Wöli
Beschreibung ...
Scan ...
Beschreibung
zeigt auf
Scan#14088 Pfad woeli/images/highres/14088.tif
ist ein Roman
Link#47121 zeigt auf Robert Walser Autor Der Räuber
Beschreibung Beschreibung ...
Seite von
Anfang 1929 begab sich Walser, der
schon seit einiger Zeit von 74
Angstzuständen und Halluzinationen Mikrogramm-#
geplagt wurde, nach einem Scan#12456 Pfad mikrogramme/images/highres/12456.tif
geistigen Zusammenbruch ...
Beschreibung
Teil von ...
ROI#14377 Position [24,136] [511,384]
Beschreibung
...
10
Thursday, September 16, 2010
12. RDF-Standardregeln
• Subjekt und Prädikat müssen global
eindeutig identifiziert sein (URI)
• Objektwerte sind entweder Text oder
ein Verweis auf ein Subjekt (Verknüpfung)
• RDF ist unabhängig von der
Darstellungsform:
- XML
- Notation3
- ...
11
Thursday, September 16, 2010
13. Vor-/Nachteile RDF
+ geeignet zur Modellierung vernetzter
Strukturen
+ grosse Flexibilität und Anpassungsfähigkeit
(keine Tabellen mit vordefinierten Felder)
• keine Regeln für Metadaten (Prädikate)
- wenig Werkzeuge vorhanden
- komplexe, neue Technologie
- Objektwerte sind immer Zeichenketten
(oder Verknüpfungen als URL/URI)
12
Thursday, September 16, 2010
14. Schlussfolgerung
• RDF wäre gut, wenn es
- strukturierte Daten erlauben würde (wie
z.B. Datum mit Genauigkeit, Kalender etc.)
- Mechanismen für Benutzerrechte etc. hätte
- bessere Charakterisierung digitaler Objekte
(nicht nur URL)
in der Praxis ist “pures” RDF nicht
anwendbar!
13
Thursday, September 16, 2010
15. Lösung: Erweiterung des
Konzeptes von RDF
• strukturierte Daten erlauben
• Regeln für Subjekte und Prädikate
- Subjekt-Klassen mit
vordefinierten Prädikaten
- einfache Datentypen für Prädikate
• Semantische Information
14
Thursday, September 16, 2010
16. Regeln:
• welche Prädikate sollte das Subjekt wie
Subjekt:
-
oft haben können/dürfen/müssen
(1 mal, 0 mal, 1-n mal, 0-n mal)
- sollte ein “digitales Äquilvalent” (Digitalisat)
existent sein?
• welchen Datentyp soll das Prädikat haben
Prädikat:
-
Text/Zahl/Datum/Verknüpfung/Zeit
15
Thursday, September 16, 2010
22. Design-Prinzipien
• Das GUI entscheidet, ob die Applikation zu
Erfolg wird oder nicht!
- Der Computer soll sich den Benutzern
(=GeisteswissenschftlerInnen) und deren
Arbeitsweise anpassen, und nicht umgekehrt!
- Intuitive Benutzerführung
bekannte Paradigmen verwenden
Fenster-Technik und Desktop-Metapher
20
Thursday, September 16, 2010
23. Merkmale der SALSAH-Oberfläche
• Fenster & Schreibtisch-Metapher im Web-
Browser
- direkter Online-Vergleich verschiedener
Digitalisate/Metadatensätze
• Bildbetrachter mit intuitivem Zoom & Pan
- Detailansichten etc.
• Spezielle Viewer für Verbundobjekte (z.B.
Bücher)
21
Thursday, September 16, 2010
25. Besonderheiten (“Schmanckerl”)
• Lokale digitale Bilder: JPEG2000 ohne
Qualitätsverlust (“lossless compression”)
• on-the-fly Rendering als JPEG mit variabler
Auflösung und Qualität
23
Thursday, September 16, 2010
26. Probleme:
•Die (☹☠☢@☤)-ten Webrowser
• schnelle Entwicklung der
Technologie (instabile “Standards”)
•Mangelhafte Werkzeuge
(JS, HTML5 etc.)
24
Thursday, September 16, 2010
27. Fazit: SALSAH ist
• ein Werkzeug (Tool-provider, nicht Data-
provider) zur wiss. Forschung mit digitalen
Quellen (annotation & linkage)
• Die Quellen können extern (oder intern)
gehalten werden (Webservices [SOAP])
• Erleichtert und fördert die Kollaboration
zwischen Forschenden und
Forschungsprojekten
• kann in der forschungsnahen Lehre eingesetzt
werden (Seminare)
25
Thursday, September 16, 2010
28. Projekte, die mit SALSAH arbeiten werden:
• Basler Frühdrucke (Kunsthist. Seminar Uni Basel, Prof. B.
Schellewald)
• e-codices (Uni Fribourg / Stiftsbibliothek St. Gallen, Prof.
C. Flüeler)
• Anton Webern Gesamtausgabe (Musikwiss. Institut Uni
Basel, Prof. M. Schmidt)
• Mikrofilmarchiv des Musikwiss. Institut (Mittelalter)
• Photoarchiv der Gesellschaft für Volkskunde, Seminar
für. Volkskunde/Europäische. Ethnologie (Prof. W.
Leimgruber)
• Potentiell: Homer Multitext Project, Center for Hellenic
Studies, Washington DC (Harvard)
26
Thursday, September 16, 2010