1. Alternativen zur
Google Search Appliance
Veit Schiele
cusy GmbH, Berlin
Chemnitzer Linux-Tage | 12.03.2017
de.slideshare.net/cusyio/cusy-gsa-alternativen
2. Veit Schiele
• Gründer und Geschäftsführer
der Cusy GmbH, einer
datenschutzkonformen Entwicklungs-
und Betriebsplattform
• Enge Zusammenarbeit mit der
Gesellschaft für Datenschutz und
Datensicherheit e.V. (GDD)
you + me + cusy
3. Agenda
• So long Google Search Appliance
• Alternative Search Appliances
• Third-party hosted services
• Self-hosted services
• Zusammenfassung und Diskussion
4. So long Google Search Appliances
So long Google Search Appliance
Diese wird bis 2018
schrittweise eingestellt1
• Google verkauft keine GSA-
Hardware mehr
• Kunden mit bestehender
Hardware können noch
Lizenzverlängerungen kaufen
• Diese laufen jedoch spätestens
2018 aus
1
Fortune: So Long Google Search Appliance
6. Alternative Search Appliances
Alternative Search Appliances
Pros und Cons
+ Einfach und schnell bereitgestellt
+ Geringe Wartungs- und Pflegeaufwände
- Keine Redundanz, kein Backup
- Häufig sind Konfigurationsänderungen
nur produktiv zu testen
- Monitoring der Lizenzauslastung erforderlich
8. Third-party hosted services
Third-party hosted services
Pros und Cons
+ Einfach und schnell bereitgestellt für öffentlich
zugängliche Informationen
+ Keine Wartungs- und Pflegeaufwände
- Einbindung von internen Services, Dateisystemen etc.
schwierig bis unmöglich
- Monitoring der Lizenzauslastung erforderlich
10. Self-hosted services
Self-hosted services
Pros und Cons
+ Einbindung von internen Services, Dateisystemen etc.
möglich
- Erhöhte Aufwände in Installation, Konfiguration und
Pflege
- Erweiterbar, wenn auch meist mit erheblichem
Aufwand
11. Self-hosted services
1. Suchmaschine auf Basis
von Apache Lucene
1. Elasticsearch
2. Solr
Search Appliances bestehen im Wesentlichen aus zwei
Komponenten:
12. Self-hosted services
2. Crawler
Hierfür bieten sich z.B.
folgende Lösungen an:
1. Scrapy
1. scrapy-elasticsearch
2. Apache Nutch
3. Elasticsearch River Web
Search Appliances bestehen im Wesentlichen aus zwei
Komponenten:
13. Anbindung von Drittsystemen
Self-hosted services: Enhancements
z.B. mit Apache ManifoldCF
• Microsoft Sharepoint
• EMC Documentum
• DropBox
• RSS-Feeds
• E-Mail
…
14. Anbindung von Drittsystemen
Self-hosted services: Enhancements
oder für Elasticsearch 5.2
• FS Crawler
• IMAP/POP3/Mail importer
• …
• s.a. Elasticsearch Plugins
and Integrations
16. Completeness of Vision
AbilitytoExecute
As of August 2015
Challangers
Niche Players
Leaders
Visionaries
LucidworksLucidworks
Expert System
Recommind
BA Insight
IBM
IHS
Coveo
Sinequa
HP
Mindbreeze
Google
Dassault Systèmes
Attivio
Lexmark
Squiz
Positionierung
Gartner. Magic Quadrant
17. What we can do for you
What we can do for you
• demnächst datenschutzkonformes Hosting
auf der Cusy-Plattform
• Installation, Wartung und Pflege
auf euren Maschinen
• Beratung, Anpassung und individuelle
Weiterentwicklung