Monitoring: Der Fokus liegt beim Zuhören und die Darstellung der Ergebnisse in Dashboard, die visuelles Prüfen der Ergebnisse und das Vordringen zu den Daten (Drill down) ermöglichen. Typischerweise erlauben sie das „Grundverständnis“ von Stimmungen über die Zuordnung von Keywords wie z.B. „gut“, „gross“ oder „schrecklich.
Textanalyse: Auf allen Plattformen aufbauend, ermöglichen sie das Verstehen der Bedeutungen hinter den Daten. Mit der Computerlinguistik (NLP) werden die Fakten, Meinungen und Stimmungen in den unterschiedlichsten Kanälen erklärt. Mit tiefergehen-den Reports und Visualisierungen erlaubt solche Lösung Vergleiche über längere Zeiträume und zeigt bislang unbekannte Korrelationen auf.
Luxid® strukturiert managt und nutzt den unstrukturierten Inhalt
Die patentierte und preisgekrönte, auf Computerlinguistik basierende Plattform Luxid® zur inhaltlichen Anreicherung ist die skalierbare Lösung zur Erkennung und Extraktion relevanter und im Fliesstext versteckter Informationsabschnitte und deren Anreicherung mit Metadaten.
Die Plattform Luxid® deckt die Information-Assets auf und optimiert deren Management, Verteilung, Zugang und Analyse.
Luxid® Annotation Factory mit ihren Funktionalitäten dient als das Pipeline für die Anwendung der Computerlinguistik:
Extraktion von Metadaten, Topics, Entitäten und Beziehungen aus dem Text
Kategorisierung von Dokumenten und deren Clustering
Extraktion-Engine für Syntax, Statistik, Taxonomie, Regeldefinition usw.
Luxid® Skill Cartridge Library für Vertiefungen in unterschiedliche Anwendungen bzw. Bereiche, wie z.B. Opinion Mining, Marketing, Medizin Biologie, Pharma usw.
Luxid® Content Enrichment Studio für kundenspezifische Anpassungen der bestehenden bzw. Entwicklung von gänzlich neuen Anwendungen.
2. 1. Die Erkennung von Chancen und Risiken
2. Das Strukturieren des Unstrukturierten – ein Beispiel
3. Beschreibung der Module
scopeKM
Knowledge Management
Agenda
3. scopeKM
Knowledge Management
Die heutigen Herausforderungen
Dezentralisierte Daten Limitierte Analyse * Stovepiped Information
• Stovepiped Information: "Information, die ein spezifisches Problem mit einem begrenzten Fokus beschreibt und die nicht leicht
für andere Systeme anwendbar ist." (DOE, USA, 1999)
5. scopeKM
Knowledge Management
Monitoring vs. Textanalyse
Charakteristika der marktgängigen Lösungen
€Monitoring: Der Fokus liegt beim Zuhören und die Darstellung der Ergebnisse in
Dashboard, die visuelles Prüfen der Ergebnisse und das Vordringen zu den Daten (Drill
down) ermöglichen. Typischerweise erlauben sie das „Grundverständnis“ von Stimmungen
über die Zuordnung von Keywords wie z.B. „gut“, „gross“ oder „schrecklich.
€Textanalyse: Auf allen Plattformen aufbauend, ermöglichen sie das Verstehen der
Bedeutungen hinter den Daten. Mit der Computerlinguistik (NLP) werden die Fakten,
Meinungen und Stimmungen in den unterschiedlichsten Kanälen erklärt. Mit tiefergehen-
den Reports und Visualisierungen erlaubt solche Lösung Vergleiche über längere Zeiträume
und zeigt bislang unbekannte Korrelationen auf.
6. scopeKM
Knowledge Management
Die drei Hauptbereiche der
Analyse
€ Jede weitere Schicht der sozialen Analyse liefert höheres Wissen und höhere
Werte für das Unternehmen.
€ Dashboards
€ ZuhörenBetrachten
€ Korrelationen
€ Analyse der Stimmung und Meinung
Verstehen
€ Umsetzbare Erkenntnisse identifizieren
€ Risk Management sicherstellen
Agieren
Wert
8. scopeKM
Knowledge Management
Forschung
Communities
Eigenschaften der Webseiten
Produktbewertungen
Blogs
Verständnis
Twitter
Facebook
Produktbewertungen
Produktentwicklung
Forums
Umfragen
Web-Analysen
Online-Feedback
Support
Call Center
CRM-System
Umfragen
Social Media
Upsell
Social Media-Konversationen
Umfragen
Customer Support-Feedback
Transaktionsdaten
Reklamationen
Marktforschung
Umfragen
Auswertungen aus den Äusserungen
E-Mails
Chancen auf jedem Touchpoint
9. 1. Die Erkennung von Chancen und Risiken
2. Das Strukturieren des Unstrukturierten – ein Beispiel
3. Beschreibung der Module
scopeKM
Knowledge Management
Agenda
10. scopeKM
Knowledge Management
Die Lösung Luxid®
15.08.2014 10
€ Die patentierte und preisgekrönte, auf Computerlinguistik basierende
Plattform Luxid® zur inhaltlichen Anreicherung ist die skalierbare
Lösung zur Erkennung und Extraktion relevanter und im Fliesstext
versteckter Informationsabschnitte und deren Anreicherung mit Metadaten.
€ Die Plattform Luxid® deckt die Information-Assets auf und optimiert deren
Management, Verteilung, Zugang und Analyse.
€Luxid® strukturiert managt und nutzt den unstrukturierten
Inhalt
11. scopeKM
Knowledge Management
Die drei Schlüsselbereiche der
Lösung
15.08.2014 11
Luxid® Annotation Factory mit ihren Funktionalit€ten dient als
Pipeline f•r die Anwendung der Computerlinguistik:
‚ Extraktion von Metadaten, Topics, Entit€ten und
Beziehungen aus dem Text
‚ Kategorisierung von Dokumenten und deren Clustering
‚ Extraktion-Engine f•r Syntax, Statistik, Taxonomie,
Regeldefinition usw.
Luxid® Skill Cartridge Library f•r Vertiefungen in unterschied-
liche Anwendungen bzw. Bereiche, wie z.B. Opinion Mining,
Marketing, Medizin Biologie, Pharma usw.
Luxid® Content Enrichment Studio f•r kundenspezifische
Anpassungen der bestehenden bzw. Entwicklung von g€nzlich neuen
Anwendungen.
12. scopeKM
Knowledge Management
Mit dem NLP (Computerlinguistik) werden verschiedene sprachliche Repräsentationsebenen
sequentiell bearbeitet:
€ Tokenisierung. Die Buchstabenkette wird in Wörter, Sätze etc. segmentiert.
€ Morphologische Analyse. Die innere Struktur der Wörter wird betr. Bedeutung und
Funktion analysiert, um die grammatikalischen Information zu extrahieren und um die
Wörter im Text auf Grundformen zurückzuführen.
€ Syntaxanalyse. Die Wörter jedes Satzes werden auf ihre strukturelle Funktion
im Satz hin analysiert. Der Output zeigt die Wortarten für jedes Wort des
Satzes, die Struktur des die Worte beinhaltenden Ausdrucks, Kategorie des Verbs, usw.
€ Semantische Analyse. Den Sätzen bzw. ihren Teilen wird in einer Vielzahl von
verschiedenen Einzelschritten Bedeutung zugeordnet.
Die Grundlage – NLP Natural
Language Processing
€Die Fakten, Meinungen und Stimmungen in den Äusserungen zu verstehen
erfordert Verständnis des natürlich gesprochenen/geschriebenen Textes.
14. scopeKM
Knowledge Management
Automatische Extraktion der
Metadaten
On May 10th Microsoft bought Skype for $8 Billion.
Terms
Num ProperPrep Verb Proper Prep U NProp Card
CompanyPrep Action Company Prep Monetary Expr.Date
Entities
Relations
Acquisition
Purchaser Microsoft
Target Skype
Amount $8 billion
Date May 10th
On May 10th Microsoft bought Skype for $8 Billion.
Roles
Attributes
16. scopeKM
Knowledge Management
Anreicherung mit Metadaten
HTC Strikes Back Against Apple – Wall Street Journal - NIRAJ SHETH
May 13th 2010 - HTC Corp., the maker of several phones that run on Google Inc.'s Android
platform, filed a complaint against Apple Inc. alleging patent infringement, a move that
follows an intellectual-property suit that the iPhone maker filed against HTC two months
ago.
HTC's complaint with the U.S. International Trade Commission alleges that Apple has
violated five patents held by the Taiwan-based electronics manufacturer and asks the
trade court to stop Apple from selling the iPhone, the iPad and iPod in the U.S.
Apple in March filed complaints with the ITC, and in a federal court in Delaware, outlining
a total of 20 patents related to touch-screen technology and mobile computing that it
alleges HTC infringed. In its filing, HTC cites patents related to power consumption in
smartphones and how cellphones dial contacts from an address book. Some of the
patents cited by Apple in its suit also relate to power usage, but it wasn't immediately
clear how similar those claims are to HTC's.
"We are taking this action against Apple to protect our intellectual property, our industry
partners, and most importantly our customers that use HTC phones," HTC's North
American vice president, Jason Mackenzie, said in a written statement.
In another sign of the growing legal pressure on Google and its Android partners, HTC
recently announced a licensing deal with Microsoft Corp., which said it believes that HTC's
Android phones infringes on a range of Microsoft patents including user interfaces.
The share of Android-based smartphones in the U.S. grew to 28% in the first quarter,
according to research firm NPD, for the first time edging out the iPhone's 21% share.
filed complaints with the ITCfiled complaints with the ITC
filed a complaint against Apple Inc. alleging patent infringementfiled a complaint against Apple Inc. alleging patent infringement
Beziehungen:
Court CaseCourt Case
ITCITC
recently announced a licensing deal withrecently announced a licensing deal with
HTCHTC
LicensingLicensing
American vice presidentAmerican vice president
‘s North‘s NorthHTCHTC
HRHR
HTCHTC
AppleApple
GoogleGoogle
US International Trade CommissionUS International Trade Commission
Microsoft CorpMicrosoft Corp
iPhoneiPhone iPadiPad iPodiPod
Jason MackenzieJason Mackenzie
NIRAJ SHETHNIRAJ SHETH
AndroidAndroid
smartphonessmartphones cellphonescellphones
user interfacesuser interfaces
power usagepower usage
HTCHTC AppleApple GoogleGoogle
Microsoft Corp.Microsoft Corp. NPDNPD
Gesellschaften:
US International Trade CommissionUS International Trade Commission
Organizationen:
Personen:
Niraj ShethNiraj Sheth
iPhoneiPhone iPadiPad iPodiPod
Produkte:
Technologien:
AndroidAndroid smartphonessmartphones
powerpowerusageusage useruser interfacesinterfaces
The share of Android-based smartphones in the U.S. grew to 28% in the first quarterThe share of Android-based smartphones in the U.S. grew to 28% in the first quarter
Market ShareMarket Share
Jason MackenzieJason Mackenzie
NPDNPD
AppleApple
17. 1. Die Erkennung von Chancen und Risiken
2. Das Strukturieren des Unstrukturierten – ein Beispiel
3. Beschreibung der Module
scopeKM
Knowledge Management
Agenda
19. scopeKM
Knowledge Management
Skill Cartridge® Library
15.08.2014 19
News
Categories
People
Companies
Locations
Business
Relationships
TM360°
Competitive
Intelligence
IPTC
Chemical
Entities
Recognition
Biological
Entities
Relationships
Medical
Entities
Relationships
BER
MER
CER
Military
Political
Strategic
Events
Opinions
Sentiment
Opinion
Mining
RTF
STF
…
20. scopeKM
Knowledge Management
Skill Cartridges® (1)
15.08.2014 20
Taxonomy-based
Skill Cartridges®
Business Rules based
Skill Cartridges®
Machine-Learning
Skill Cartridges®
Categorization
Skill Cartridges®
Semantic Rules based
Skill Cartridges®
Statistics-based
Skill Cartridges®
€ Regelbasierte Skill Cartridges®, wie z.B. TM360
‚ Eingebettete linguistische Modellierung oder Regeln, z.B. f•r Personen,
Kombination von Faktoren
o Eigennamen (Wortarten-Analyse)
o Bekannte Vornamen, Titel, usw. (Treiber)
o Grossbuchstaben
o Kontext (automatisches Lernen)
o Begriffserkl€rungen
21. scopeKM
Knowledge Management
15.08.2014 21
Taxonomy-based
Skill Cartridges®
Business Rules based
Skill Cartridges®
Machine-Learning
Skill Cartridges®
Categorization
Skill Cartridges®
Semantic Rules based
Skill Cartridges®
Statistics-based
Skill Cartridges®
Skill Cartridges® (2)
€ Statistik-basierte Skill Cartridges®
‚ Extraktion relevanter Begriffe aus jeder Dokumentenart
‚ Basis: Referenz-/ Training-Corpus
‚ Ergebnis: Quantitative Analyse … tf/idf *(Term frequency/inverse
document frequency)
* Beurteilung der Relevanz von Termen in Dokumenten einer Dokumentensammlung beim
Information Retrieval. Beispiel: Der Begriff †Philosophie‡ kann h€ufig genannt werden, und die
Frequenz ist €hnlich hoch im Referenzcorpus. Der Begriff ˆnorwegische Philosophie‡ wird
h„here Relevanz bekommen, trotz wenig h€ufiger Erscheinung.
22. scopeKM
Knowledge Management
15.08.2014 22
Taxonomy-based
Skill Cartridges®
Business Rules based
Skill Cartridges®
Machine-Learning
Skill Cartridges®
Categorization
Skill Cartridges®
Semantic Rules based
Skill Cartridges®
Statistics-based
Skill Cartridges®
€ Kategorisierung Skill Cartridges®, wie z.B. IPTC
‚ Themen bestimmen, basierend auf einem Set von Subjekten
‚ Automatische Erstellung und Optimierung von Skill Cartridge‰ mit
Luxid‰ Category Workbench
‚ Wiederverwendung existierender Assets: der Inhalt manuell klassifiziert
‚ Sicherstellung von Produktivit€t und Konsistenz
Skill Cartridges® (3)
23. scopeKM
Knowledge Management
15.08.2014 23
Taxonomy-based
Skill Cartridges®
Business Rules based
Skill Cartridges®
Machine-Learning
Skill Cartridges®
Categorization
Skill Cartridges®
Semantic Rules based
Skill Cartridges®
Statistics-based
Skill Cartridges®
€ Taxonomie-basierte Skill Cartridges®
‚ Smart Taxonomy Facilitator (STF) -Technologie
o Automatische Erweiterung von Varianten mit Fuzzy Term Matching
o Reduktion des Unsch€rferauschens mit Relevance Scoring
‚ Schnelle und Effiziente Erstellung von Skill Cartridges‰
‚ Effiziente Wiederverwendung existierender Assets (Thesaurus,
Taxonomie)
‚ Unterst•tzung von RDF/SKOS (W3C-Standards)
‚ Ausgangspunkt zur semantischen Anreicherung der Inhalte.
Skill Cartridges® (4)
24. scopeKM
Knowledge Management
15.08.2014 24
€ Business Rules-based Skill Cartridges®
‚ Kundenspezisches Reasoning einfach in den Anreicherungsprozess der
Inhalte integrierbar
‚ Kenntnisse der Computerlinguistik nicht erforderlich
‚ Verf•gbarkeit von Schnittstellen auf einen Klick.
Skill Cartridges® (5)
Taxonomy-based
Skill Cartridges®
Business Rules based
Skill Cartridges®
Machine-Learning
Skill Cartridges®
Categorization
Skill Cartridges®
Semantic Rules based
Skill Cartridges®
Statistics-based
Skill Cartridges®
25. scopeKM
Knowledge Management
15.08.2014 25
Taxonomy-based
Skill Cartridges®
Business Rules based
Skill Cartridges®
Machine-Learning
Skill Cartridges®
Categorization
Skill Cartridges®
Semantic Rules based
Skill Cartridges®
Term-based
Skill Cartridges®
€ Machine-Learning Skill Cartridges®
‚ Einfache Erfassung & Anwendung kundenspezifischer Annotationen im
Anreicherungsprozess der Inhalte
‚ Effiziente Wiederverwendung des annotierten CorpusŠ
‚ Nur rudiment€re Kenntnisse der Computerlinguistik erforderlich.
Skill Cartridges® (6)
26. scopeKM
Knowledge Management
15.08.2014 26
Content Enrichment Studio
Taxonomy-based
Skill Cartridge®
Development
Knowledge
Editor
Semantic Rules based
Skill Cartridge®
Development
Skill Cartridge®
Builder
Categorization Skill
Cartridge®
Development & Quality
Control
Categorization
Workbench
Quality Control
Annotation
Workbench