Teams working on complex and innovative projects require fast and easy access to a wide variety of heterogeneous data. IBM's Watson Explorer aka VIVISIMO has been used to collect and semantically enrich relevant text corpora to support an international project team
2. Themen
Anforderungen aus Sicht des Projektteams
Heterogene Quellen für Projektmaterialien
Vorgehensweise mit Watson Explorer
Erfahrungen
Vorteile der Vorgehensweise
Geplante Erweiterungen
24. April 2014
3. Anforderungen aus Sicht eines kollaborativen Projekts
Heterogene Daten nach Inhalten durchsuchen können
Unterschiedliche Quellen, dynamisch erweiterbar
Annotation und Extraktion von Inhalten
Nutzung bestehender Tags
Automatische Extraktion von
Lokationen, Personen, Organisationen, etc.
Suchunterstützung durch Verwendung von multilingualen
Thesauri
Annotation & Kommentare zu Inhalten von Mitarbeitern
Ergebnisse durch Clusterbildung leichter zugängig
machen.
4. Quellen für Dokumente
Sammlung von relevanten Web-Links
Web-links von ähnlichen Projekten & Stakeholdern
Eigene Fileserver der Projektpartner
PDF’s, Word, EXCEL, Images, … mit Projektbezug
Projektrelevante gemeinsame Dokumente des Teams
FTP Server des Projekts
Mail box für projektrelevante e-Mails
Mailbox mit projektrelevanter Korrespondenz
ZOTERO Sammlung
Annotierte Dokumente zu relevanten Themen
5. Umsetzung der Anforderungen mit Watson Explorer
„Projekt“ anlegen
Quellen (Sources, “Search Collections”) definieren & beschreiben
Passende „Converter“ (pdf, word, …) je „Search Collection“
auswählen
eigene schreiben (ZOTERO/RDF)
Extraktion von Konzepten (Personen, Organisationen, Orte, …) je
„Search Collection“ einstellen
„AQL Converter“ (in BigInsights erstellt) konfigurieren
Wörterbücher & Thesauri erstellen und „Search Collections“ zuordnen
Index aufbauen; „Converter“ testen
Benutzeroberfläche anpassen
11. Zusammenfassende Erkenntnisse
Notwendige Ergänzungen
Verbesserung der sprachabhängigen und quellenabhängigen Extraktion von
Begriffen durch eigene Routinen (Big Insights)
Hauptnutzen
In relativ kurzer Zeit mit vertretbaren Aufwand einsetzbar
Unstrukturierte Textcorpora werden automatisch indiziert & annotiert
Suchergebnisse nach unterschiedlichen Gesichtspunkten darstellbar
Nutzung von Thesauri & Linguistischen Methoden bei der erleichtern die Suche
Kommentare, manuelle Tags unterstützen die Zusammenarbeit im Team
Vielzahl vorgefertigter und in der Praxis verwendbarer „Converter“
Patentiertes & performantes Indizierungsverfahren
Einfache & trotzdem vielfältige Möglichkeiten der Anpassung & Integration
Watson Explorer als Plattform der Wahl