www.shi-gmbh.com
In der Präsentation wird die auf Apache Solr basierende Suchplattform LucidWorks Search vorgestellt. Es wird darüber hinaus auf das ergänzende Produkt Smartlogic Semaphore für die Realisierung intelligenter Suche mittels Taxonomien, Ontologien und automatischer Content Klassifikation eingegangen.
Jax 2012 - Apache Solr as Enterprise Search Platform
Überblick über die Suchplattform LucidWorks Search 2.1
1. Überblick über die Suchplattform
LucidWorks Search 2.1
Augsburg, 13. November 2012
2. Kurzvorstellung SHI
Seit 1994
Softwaredienstleister mit Schwerpunkt auf Search- und
dokumentenzentrischen Anwendungen
25 Mitarbeiter
Homogenes Portfolio: Open Source, Web Applikationen, Suchtechnologie &
Content Management
Komplettes Dienstleistungsprogramm: Beratung, Schulung, Entwicklung &
Support
Starke Partner
Seite 2
3. LucidWorks Search (LWS) – Was ist das?
Search
LIBRARY SERVER PLATTFORM
+
Schnell (sub second) Connectoren für zahlreiche
Datenquellen & -formate
Skalierbar: Clustering, Sharding, …
LDAP / AD
Fehlertolerante Suche: Wildcard, Fuzzy,
Synonyme, Stemming, Autosuggest, …. Admin Oberfläche
Konfigurierbares Ranking Rapid Prototyping
Placements Log Auswertung
Navigationshilfen: Facetten, more like this, did Click Scoring Engine
you mean, … Alerting Service
…. Business Rules Engine
Erweitertes API
Schnellere Entwicklung
Migration Tools
7x24 SLA Support
Seite 3
4. Auf den folgenden Folien erfolgt die Vorstellung der Suchplattform
LucidWorks Search 2.1 aus der Sicht der Businessanwender.
Seite 4
5. LWS: Main Dashboard
Das „Main Dashboard“ zeigt alle relevanten Informationen zu dem Suchservice an: Speicherbedarf,
Performance der Suchanfragen, Performance der Indexierung, indexierte Datenquellen u.s.w.
Performance Anzeige
Zeigt die Anzahl der Suchanfrage pro
Sekunde (QPS) an.
Anlage neuer Datencollectionen
Das nicht-technische Personal kann
sehr bequem neue Datenquellen (z. B.
Webseiten) zum Indexieren anlegen.
Der Umweg über die IT-Abteilung bleibt
somit erpart.
Angelegte Collectionen
In der tabellarischen Ansicht sind alle
derzeit konfigurierten Collectionen
dargestellt. Eine Collection kann aus
einer oder mehreren Datenquellen (z.
B. Webseiten, Dateisystemen, etc.)
bestehen. In der Darstellung sind
darüber hinaus Informationen wie z. B.
Anzahl Dokumente in der jeweiligen
Collection, letzte Akualisierung, u.s.w.
Speicherbedarf
angegeben.
Zeigt den Speicherbedarf für den Suchindex an.
Seite 5
6. LWS: Collectionen
In dieser Ansicht erhält man den Überblick über eine bestimmte Collection. Darüber hinaus können
hier Datenquellen (Data Sources) der jeweiligen Collection verwaltet werden.
Verwaltung
Das Verwaltungsmenü enthält
unterschiedliche Operationen zur
Steuerung der Collection.
Datails
Der Bereich mit den Details der
Collections enhält neben dem
Speicherverbrauch auch weitere
wertvolle Informationen wie z. B. die
Aktualität des Index.
Die populärsten Suchanfragen
Stellt den Trend der Suchanfragen dar.
Übersicht der Datenquellen
In der tabellarischen Übersicht sind alle
konfigurierten Datenquellen samt ihrer
jeweiligen Aktualität dargestellt.
Darüber hinaus kann man hier den
Crawl-Vorgang manuell starten.
Seite 6
7. LWS: Datenquellen
In dieser Darstellung erhält man detaillierte Informationen zu einer bestimmten Datenquelle. Darüber
hinaus können hier Einstellungen geändert und Operationen (wie z. B. Start des Crawln-Vorgangs)
durchgeführt werden.
Verwaltung der Datenquelle
Hier können Einstellung der jeweiligen
Datenquelle bequem vorgenommen
werden.
Einstellungen
Die derzeit gültigen Einstellungen kann
man auf einen Blick sehen.
Historie
In der tabellarischen Darstellung kann
man die Historie der Indexierung für die
jeweilige Datenquelle nachvollziehen.
Seite 7
8. LWS: Datenquelle anlegen
LWS unterstützt eine Vielzahl unterschiedlicher Datenquellen, die indexiert werden können. So z. B.
auch Webseiten, Dateisysteme, Document Management Systeme (Alfresco, OpenText,
Documentum, …) u. v. m.
Datenquellen
Aus der Liste können bequem
Datenquellen ausgewählt und für die
Suche konfiguriert werden. Hierzu ist in
den meisten Fällen keine speziellen
technischen Kenntnisse notwendig.
Übersicht der Datenquellen
In der tabellarischen Ansicht sieht man
alle angelegten Datenquellen der
jeweiligen Collection.
Seite 8
9. LWS: Webseite als Datenquelle
LWS ist mit einem leistungsstarken Crawler für Webseiten ausgestattet. Die Anlage einer Webseiten-
Datenquelle ist sehr einfach und kann durch nicht-technisches Personal durchgeführt werden.
Seite 9
10. LWS: Stopwortlisten
Stopwörter werden nicht indexiert. LWS bietet eine sehr bequeme Möglichkeit, die Stopwortlisten zu
verwalten. Die Bereitstellung der Stopwörter kann automatisiert z. B. auch aus Fremdsystemen
erfolgen.
Seite 10
11. LWS: Synonyme
Synonyme sorgen dafür, dass Benutzer auch mit Alternativbegriffen das richtige Ergebnis finden. In
dieser Ansicht können Fachbereiche Synonyme bequem verwalten. Die Bereitstellung der
Synonyme können automatisiert z. B. auch aus Fremdsystemen erfolgen.
Seite 11
12. LWS: Suchfeatures
Ob Facetten, Auto-suggest (Type-ahead), Nutzung der Synonyme u. v. m. verwendet werden sollen,
kann in der folgenden Übersicht eingestellt werden.
Seite 12
13. LWS: Suche
Den indexierten Datenbestand kann man sofort testen. Je nach Konfiugration können hier neben der
Qualität der Suchergebnisse solche Funktionen wie z. B. Auto-suggest, Facetten, Meinten Sie…?,
ähnliche Dokumente, u. s. w. sofort getestet werden.
Auto-suggest
Beim Tippen werden vorhandene
Begriffe angezeigt.
Ergebnisliste
Mit Alert-Funktion, Facetten, ähnliche
Dokument, etc.
Seite 13
14. LWS: Berechtigungen
In LWS können Rechte für das Finden und Lesen von Dokumenten pro Collection bequem verwaltet
werden. Die Rechteverwaltung kann sowohl Gruppen-basiert wie auch ACL-basiert (Access Control
List wie sie z. B. bei Freigabeverzeichnissen vorhanden sind) geschehen.
Seite 14
15. LWS: Zeitplan für das Indexieren
In LWS können Zeitpläne für das Indexieren pro Collection bequem verwaltet werden. Die Einstellung
eines Zeitplans ist immer dann sinnvoll, wenn Datenquellen periodisch und automatisch indexiert
werden sollen.
Seite 15
16. Kombiniert mit der semantischen Technologieplattform Smartlogic Semaphore
können dank automatischer Klassifikation insbesondere von unstrukturierten Inhalten
intelligente Suchlösungen realisiert werden, die Mitarbeiter beim Suchen entlasten!
Seite 16
17. Semaphore: Intelligente Suche dank Klassifikation
Dank extrahierter /Metadaten können Suchen
mit intelligentem Auto-Suggest, Topics und
Facetten realisiert werden.
Vorteil: Mitarbeiter finden relevante
Informationen – anders als bei Google - im
Bruchteil einer Sekunde!
Seite 17