Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

Suche ein effizientes Mittel zur Datenintegration

160 vues

Publié le

Diese Folien zeigen, wie wir Open Source Technologien einsetzen um intelligente Suchen auf heterogenen Daten aufbauen und damit ein leichtgewichtige Datenintegration erreichen.

Publié dans : Internet
  • Ich kann eine Website empfehlen. Er hat mir wirklich geholfen. ⇒ www.WritersHilfe.com ⇐ Zufrieden und beeindruckt.
       Répondre 
    Voulez-vous vraiment ?  Oui  Non
    Votre message apparaîtra ici
  • Soyez le premier à aimer ceci

Suche ein effizientes Mittel zur Datenintegration

  1. 1. PasDas Summit 2016 Thomas Kurz 2016/10/04 Passau, Deutschland Suche – ein effizientes Mittel zur Datenintegration
  2. 2. Redlink wurde 2013 gegündet und hat seinen Sitz in , Österreich.SALZBURG SuchlösungenTextanalyse Apps Daten verstehen Daten organisieren Daten nutzen
  3. 3. Kunden & Partner
  4. 4. 04/36 "We are drowning in information and starved for knowledge." John Naisbitt Suche als effizienter, zentraler Zugang zu Informationen und Daten • Digitale Inhalte sind immer und überall abrufbar • Inhalte sind oft unstrukturiert • Information sind über Personen, Systeme und Dokumente verteilt
  5. 5. Suche als Informationsteleskop Contextualisierte Suchen erlauben unterschiedliche (spezielle) Blickwinkel auf Daten.
  6. 6. Was verstehen wir heute unter Suche und wo geht die Reise hin ? Wo und wie kann Suchtechnology die integrierte Sicht auf Daten verbessern ? Wie kann man das mit Open Source Software umsetzen ? Roadmap
  7. 7. Suche – State of the Art and beyond
  8. 8. Andrei Broder, Distinguished Scientist @Google,World Wide Web Conference, May 2015
  9. 9. Basic Information Retrieval
  10. 10. Basic Information Retrieval • Fulltext Search • Boolean Operators • FieldTypes / Processing • Weighting, Scoring Add-ons: • Synonyms / ControlledVocabularies • Spellchecking • Complex Functions (grouping, joining) • Boosting • Facetting • Filtering
  11. 11. Question Answering and Information Supply Retrieval
  12. 12. Question Answering and Information Supply Retrieval
  13. 13. Question Answering and Information Supply Retrieval
  14. 14. Question Answering and Information Supply Retrieval • Curated Information Resources (Knowledge Graph) • Information / Data Aggregation • Question Patterns / Natural Language Processing • Answering Patterns / InformationTemplates • Speech toText Components • Multilinguality • Personalisation
  15. 15. Assistance
  16. 16. Goal Completion New appointment in Calendar Book a Flight Book a Hotel Set Alarm Clock Call aTaxi Book aTable for Lunch Alert delays Buy a present
  17. 17. Eine integrierte Sicht auf Daten und Informationen
  18. 18. Mike leitet einen Copy Shop mit 5 festen Mitarbeitern und 10 studentischen Aushilfen. Er benutzt ein CRM System zur Kunden- verwaltung, Email zur Kommunikation, ein Erfassungs- und Abrechnungssystem für seine Aufträge und ein Filesharing System zur Datenverwaltung. Beispiel 1: Mike's Copy Shop
  19. 19. Beispiel 1: Mike's Copy Shop John Doe erkundigt sich nach einem Auftrag.
  20. 20. Beispiel 1: Mike's Copy Shop Jane verschafft sich eine Kunden-Überblick.
  21. 21. Beispiel 1: Mike's Copy Shop Ziel: integrierte Suche durch Datenverknüpfung • Sammeln der Daten (inkl. Zugriffsrechte) • Integration der verschiedenen Daten durchVerlinkung (z.B. über Entitäten) mittel genormter Schemen • Aggregation gleicher Daten aus verschiedenen Applikationen (Matching) • Evtl. Metadaten erheben (z.B. pagerank) • Zentraler, effizienter Zugriff durch Indizierung 02/36
  22. 22. Beispiel 1I: Smart Customer Support Die Deutsche Bahn betreibt mit dem "Reisebuddy" einen Concierge Service rund um dasThema Reise.Anfragen werden vom Kunden per SMS/Messenger gestellt und von Servicemitarbeitern bearbeitet. Diese nutzen für die benötigten Informationen interne und externe Quellsysteme. 02/36
  23. 23. Beispiel 1I: Smart Customer Support 02/36
  24. 24. Beispiel 1I: Smart Customer Support 02/36
  25. 25. Beispiel 1I: Smart Customer Support 02/36
  26. 26. Beispiel 1I: Smart Customer Support Ziel: integrierte Suche durch Klassifizierung und Verteilung auf eine Menge von Endpunkten • Klassifizieren der Anfrage (z.B. Reiseanfrage) • Extraktion such-relevanter Entitäten (Information Units) • Aufbau der Anfrage • Evtl.Aggregation und Gewichtung • Generieren der Antwort
  27. 27. Lösungen mit Open Source Software
  28. 28. Semantic Content Management 01/02 The Redlink Basic Components Semantic Content Management 15/36
  29. 29. • Qualität der Software steigt • Qualität der Dokumentation steigt • Manpower kann drastisch steigen • Offene Libraries steigern Qualität und senken Entwicklungskosten • Produkt wird besser wahrgenommen • Marketing Kosten können sinken • Geringeren Einfluss auf Roadmap und Entwicklungsziele • keine SLAs bei Fremdsoftware • Verlust von Kontrolle und Einzigartigkeit • Keine Garantie (die Community bestimmt) • Overhead (Community Building, Licensing, usw.) • evtl. Einschränkungen durch Lizenzrechte Warum Open Source ? Pros Cons
  30. 30. Semantic Content Management 16/36 • Read-Write Linked Data • Triple Store mitVersionierung und Reasoning • SPARQL und LDPath Anfragesupport • Transparentes Linked Data Caching The Open Platform for Linked Data http://marmotta.apache.org/
  31. 31. 17/36 • Framework für Semantic Enhancement • Natural Language Processing und Entity Recognition • Mehrsprachigkeit • Klassifikation und Sentiment Analyse http://stanbol.apache.org TheToolbox for Semantic Lifting
  32. 32. Semantic Content Management 18/36 • Apache Lucene basiertes Suchframework • Mehrsprachigkeit • Hoch skalierbar (Solr cloud) und ultra schnell • Hoch konfigurierbar http://lucene.apache.org/solr/ The highgly scalable Search Server
  33. 33. Semantic Content Management 18/36 Andere Komponenten ApacheTinkerPop™ ...
  34. 34. Beispiel 1: Mike's Copy Shop
  35. 35. Beispiel 1: Mike's Copy Shop
  36. 36. Beispiel 1I: Smart Customer Support Enitity Extraction Classification Query Specific Models • Attribute • Vokabulare • Negation • Contextual Entities
  37. 37. Take aways Suche bietet heute mehr als klassisches Information Retrieval. Suche ist ein gutes Mittel um eine integrierte Sicht auf Daten zu erhalten. Natürlichsprachliche Eingabe ist State of the Art. Open Source Software kann viele notwendige Schritte sehr gut abdecken.
  38. 38. are you ready to make sense of your data? thomas.kurz@redlink.co Vielen Dank für die Aufmerksamkeit !

×