SlideShare une entreprise Scribd logo
1  sur  20
SQLDay 2018
Stream Analytics i Machine Learning – czy to
dobrze dobrana para na współczesne wyzwania?
Barbara Leśniarek
Kamil Słomka
SQLDay 2018
Prelegenci
Barbara Leśniarek
Kamil Słomka
• Konsultant, architekt i team leader z ponad 7-letnim
doświadczeniem w obszarach Business Intelligence i integracji
danych
• Od początku kariery związany z technologiami wokół platformy
danych Microsoft
• Zawodowe zainteresowania: Big Data, Machine Learning i Cloud
• Konsultant obszaru data science z ponad 8-letnim
doświadczeniem w obszarze modelowania, data mining i ML
• Lider zespołu zajmującego się zaawansowaną analizą danych,
ekspert w obszarze analytical fraud detection
• Zawodowe zainteresowania: Applied data science and statistics
in Business Intelligence solutions
SQLDay 2018
Agenda
• Scenariusz biznesowy, czyli jakie wyzwanie podejmujemy
• Architektura rozwiązania i wykorzystane narzędzia:
– Stream Analytics
– Machine Learning Studio
– Power BI
• DEMO – real challenge!
• Podsumowanie - co warto zapamiętać
• Co dalej… czyli inne potencjalne zastosowania
SQLDay 2018
Cel biznesowy: Badamy aktywność użytkowników w kanale elektronicznym - ich opinie
na temat naszej firmy w czasie rzeczywistym
Dane: Posty ze strony www / portalu social media dotyczące naszej firmy
Metoda: Analizujemy wydźwięk emocjonalny postów i identyfikujemy anomalie
w wielkości ruchu użytkowników
Wyzwania:
1. Obsługa strumienia danych
2. Machine learning (Text mining + Detekcja anomalii)
3. Raportowanie w czasie bliskim rzeczywistemu
Rozwiązanie: ?
Scenariusz
SQLDay 2018
Analiza danych strumieniowych w Azure
SQLDay 2018
• Silnik przetwarzania zdarzeń
• Definiowany i rozliczany per job
Azure Stream Analytics
• Wejścia: Blob storage, Event Hub, IoT Hub
• Transformacja danych:
•Język zapytań bazujący na SQL
•Funkcje: JavaScript i Azure Machine Learning
•
• Wyjścia: Blob/Table storage, Event Hub, SQL DB, Service Bus, Power BI, Data
Lake Store, Azure Function, Cosmos DB
SQLDay 2018
Architektura rozwiązania
.NET application
Power BI
Machine
Learning
Stream
Analytics
Blob storage
(input)
Blob storage
(output)
SQLDay 2018
Azure Machine Learning
Jak to wygląda u nas ...
SQLDay 2018
Schemat rozwiązania w Azure : Krok 1 : Sentiment
... any limitations ??
SQLDay 2018
Schemat rozwiązania w Azure : Krok 2 : Anomaly
SQLDay 2018
Schemat rozwiązania w Azure : Krok 2 : Anomaly
... any problems ?
SQLDay 2018
Anomaly detection API
SQLDay 2018
DEMO
Sample demo
SQLDay 2018
Za pomocą platformy Azure stworzyliśmy rozwiązanie, które:
• Analizuje strumień danych tekstowych – opinie klientów o firmie przekazywane
w kanale elektronicznym
• Wykorzystuje metody uczenia maszynowego do zbadania wydźwięku tych opinii
• Agreguje statystyki ruchu i wykorzystuje kolejny model zaawansowanej analityki
do wyszukiwania ich anomalii
• Wyniki pośrednie (niezagregowane) zapisuje na blob storage do plików csv,
umożliwiając ich dalszą, szczegółową analizę
• Wyniki zagregowane, wielkość ruchu i anomalie, są prezentowane w czasie
rzeczywistym na raporcie Power BI
Podsumowanie, czyli co warto zapamiętać
SQLDay 2018
Zalety zastosowanego podejścia
• To działa! Możliwość wykorzystania rozbudowanych modeli predykcyjnych
dla danych strumieniowych i raportowanie w trybie on-line przy minimalnych
nakładzie prac programistycznych
• Integracja usług Stream Analytics, Machine Learning, Power BI jest łatwa i szybka
• Rozwiązanie zrealizowane w całości w architekturze PaaS
• Prosty model rozliczeń
• Rozwiązanie Stream Analytics możemy tworzyć i rozwijać za pomocą Visual Studio
(ale nie bez problemów)
SQLDay 2018
Ograniczenia i napotkane problemy
• Brak możliwości testowania zapytań (transformacji) wykorzystujących funkcje
Machine Learning
• Brak możliwości wykorzystania funkcji ML w przypadku uruchamiania Stream
Analytics lokalnie z poziomu Visual Studio
• Brak możliwości debugowania rozwiązania i inne niedoskonałości narzędzi
deweloperskich
• Brak możliwości jakichkolwiek edycji Data Setu (pola wyliczane, ręczne usunięcie
starych danych) w Power BI po bezpośrednim załadowaniu danych z Stream
Analytics
SQLDay 2018
Co dalej… czyli potencjalne zastosowania
• Analiza danych social media, for, czatów…
• Badanie nastrojów
• Badanie skuteczności kampanii marketingowych
• Wykrywanie anomalii (awarii)
• Predictive maintenance – zakłady produkcyjne, centra danych itp.
• Analiza kursów giełdowych
• Analiza danych clickstream
• Scoringi on-line masowych zdarzeń
• Analiza rozmów telefonicznych (np. BOK)
SQLDay 2018
Bibliografia
• Omówienie usługi Azure Stream Analytics
https://docs.microsoft.com/en-us/azure/stream-analytics/stream-analytics-introduction
• Przykład integracji Azure Stream Analytics z Azure Machine Learning
https://docs.microsoft.com/en-us/azure/stream-analytics/stream-analytics-machine-learning-integration-
tutorial
• Omówienie pracy z Azure Stream Analytics w Visual Studio
https://docs.microsoft.com/pl-pl/azure/stream-analytics/stream-analytics-tools-for-visual-studio
• Implementacja wykrywania anomalii w Azure Stream Analytics bez wykorzystania Azure Machine
Learning
https://docs.microsoft.com/pl-pl/azure/stream-analytics/stream-analytics-machine-learning-anomaly-
detection
• Algorytm zaimplementowany w AML do detekcji anomalii
https://www.mo-data.com/anomaly-detection-using-machine-learning-to-detect-abnormalities-in-time-
series-data
SQLDay 2018
Dziękujemy za uwagę 
Pytania?
Kontakt:
Barbara Leśniarek Kamil Słomka
Barbara.Lesniarek@elitmind.com Kamil.Slomka@elitmind.com
SQLDay 2018
GOLD SPONSORS
SILVER SPONSORS
BRONZE SPONSOR
STRATEGIC PARTNER

Contenu connexe

Similaire à Elitmind @ SQLDay2018: Stream Analytics i Machine Learning – czy to dobrze dobrana para na współczesne wyzwania? - B. Leśniarek/K.Słomka

20181004 Hubert Kobierzewski - Jakość danych w organizacji
20181004 Hubert Kobierzewski - Jakość danych w organizacji20181004 Hubert Kobierzewski - Jakość danych w organizacji
20181004 Hubert Kobierzewski - Jakość danych w organizacjiHubert Kobierzewski
 
20160405 Cloud Community Poznań - Cloud Analytics on Azure
20160405  Cloud Community Poznań - Cloud Analytics on Azure20160405  Cloud Community Poznań - Cloud Analytics on Azure
20160405 Cloud Community Poznań - Cloud Analytics on AzureŁukasz Grala
 
Divante - Mała książeczka sukcesów - część 2
Divante - Mała książeczka sukcesów - część 2Divante - Mała książeczka sukcesów - część 2
Divante - Mała książeczka sukcesów - część 2Divante
 
Tajniki współpracy z (trudnym) klientem
Tajniki współpracy z (trudnym) klientemTajniki współpracy z (trudnym) klientem
Tajniki współpracy z (trudnym) klientemKatarzyna Mrowca
 
SQLDAY2022-AdrianChodkowski-10BledowPowerBI.pdf
SQLDAY2022-AdrianChodkowski-10BledowPowerBI.pdfSQLDAY2022-AdrianChodkowski-10BledowPowerBI.pdf
SQLDAY2022-AdrianChodkowski-10BledowPowerBI.pdfSeeQuality.net
 
Koprowski t certyfikacja_a_kariera_it_infomeet
Koprowski t certyfikacja_a_kariera_it_infomeetKoprowski t certyfikacja_a_kariera_it_infomeet
Koprowski t certyfikacja_a_kariera_it_infomeetmagda3695
 
Klasyfikacja wymagań jako sposób zarządzania nimi
Klasyfikacja wymagań jako sposób zarządzania nimiKlasyfikacja wymagań jako sposób zarządzania nimi
Klasyfikacja wymagań jako sposób zarządzania nimiJaroslaw Zelinski
 
Elitmind @ 113. Spotkanie Data Community, Warszawa - Business Intelligence w ...
Elitmind @ 113. Spotkanie Data Community, Warszawa - Business Intelligence w ...Elitmind @ 113. Spotkanie Data Community, Warszawa - Business Intelligence w ...
Elitmind @ 113. Spotkanie Data Community, Warszawa - Business Intelligence w ...Elitmind
 
Analityk w świecie automatyzacji i robotyzacji biznesu
Analityk w świecie automatyzacji i robotyzacji biznesuAnalityk w świecie automatyzacji i robotyzacji biznesu
Analityk w świecie automatyzacji i robotyzacji biznesuAndrzej Sobczak
 
Wykorzystanie Google Data Studio w raportowaniu i wizualizacji danych - Mateu...
Wykorzystanie Google Data Studio w raportowaniu i wizualizacji danych - Mateu...Wykorzystanie Google Data Studio w raportowaniu i wizualizacji danych - Mateu...
Wykorzystanie Google Data Studio w raportowaniu i wizualizacji danych - Mateu...Mateusz Muryjas
 
Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)
Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)
Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)byteLAKE
 
Wprowadzenie do modelowania danych w PowerPivot
Wprowadzenie do modelowania danych w PowerPivotWprowadzenie do modelowania danych w PowerPivot
Wprowadzenie do modelowania danych w PowerPivotKamil Nowinski
 
Wyklad inauguracyjny
Wyklad inauguracyjnyWyklad inauguracyjny
Wyklad inauguracyjnyRadoslaw Kita
 
Case study eCommerce od OEX Divante
Case study eCommerce od OEX DivanteCase study eCommerce od OEX Divante
Case study eCommerce od OEX DivanteDivante
 
Automatyzacja w praktyce. Praktyka automatyzacji
Automatyzacja w praktyce. Praktyka automatyzacjiAutomatyzacja w praktyce. Praktyka automatyzacji
Automatyzacja w praktyce. Praktyka automatyzacjiRadoslaw Smilgin
 
Militaria.pl - case study
Militaria.pl - case studyMilitaria.pl - case study
Militaria.pl - case studySymetria
 
Divante - Mała książeczka sukcesów
Divante - Mała książeczka sukcesówDivante - Mała książeczka sukcesów
Divante - Mała książeczka sukcesówDivante
 
Łukasz Grala - BI w Sql 2008
Łukasz Grala - BI w Sql 2008Łukasz Grala - BI w Sql 2008
Łukasz Grala - BI w Sql 2008nexik
 

Similaire à Elitmind @ SQLDay2018: Stream Analytics i Machine Learning – czy to dobrze dobrana para na współczesne wyzwania? - B. Leśniarek/K.Słomka (20)

20181004 Hubert Kobierzewski - Jakość danych w organizacji
20181004 Hubert Kobierzewski - Jakość danych w organizacji20181004 Hubert Kobierzewski - Jakość danych w organizacji
20181004 Hubert Kobierzewski - Jakość danych w organizacji
 
20160405 Cloud Community Poznań - Cloud Analytics on Azure
20160405  Cloud Community Poznań - Cloud Analytics on Azure20160405  Cloud Community Poznań - Cloud Analytics on Azure
20160405 Cloud Community Poznań - Cloud Analytics on Azure
 
Zwinny_Analityk_SIW_Panel
Zwinny_Analityk_SIW_PanelZwinny_Analityk_SIW_Panel
Zwinny_Analityk_SIW_Panel
 
Divante - Mała książeczka sukcesów - część 2
Divante - Mała książeczka sukcesów - część 2Divante - Mała książeczka sukcesów - część 2
Divante - Mała książeczka sukcesów - część 2
 
Tajniki współpracy z (trudnym) klientem
Tajniki współpracy z (trudnym) klientemTajniki współpracy z (trudnym) klientem
Tajniki współpracy z (trudnym) klientem
 
SQLDAY2022-AdrianChodkowski-10BledowPowerBI.pdf
SQLDAY2022-AdrianChodkowski-10BledowPowerBI.pdfSQLDAY2022-AdrianChodkowski-10BledowPowerBI.pdf
SQLDAY2022-AdrianChodkowski-10BledowPowerBI.pdf
 
Koprowski t certyfikacja_a_kariera_it_infomeet
Koprowski t certyfikacja_a_kariera_it_infomeetKoprowski t certyfikacja_a_kariera_it_infomeet
Koprowski t certyfikacja_a_kariera_it_infomeet
 
Klasyfikacja wymagań jako sposób zarządzania nimi
Klasyfikacja wymagań jako sposób zarządzania nimiKlasyfikacja wymagań jako sposób zarządzania nimi
Klasyfikacja wymagań jako sposób zarządzania nimi
 
Elitmind @ 113. Spotkanie Data Community, Warszawa - Business Intelligence w ...
Elitmind @ 113. Spotkanie Data Community, Warszawa - Business Intelligence w ...Elitmind @ 113. Spotkanie Data Community, Warszawa - Business Intelligence w ...
Elitmind @ 113. Spotkanie Data Community, Warszawa - Business Intelligence w ...
 
Analityk w świecie automatyzacji i robotyzacji biznesu
Analityk w świecie automatyzacji i robotyzacji biznesuAnalityk w świecie automatyzacji i robotyzacji biznesu
Analityk w świecie automatyzacji i robotyzacji biznesu
 
Wykorzystanie Google Data Studio w raportowaniu i wizualizacji danych - Mateu...
Wykorzystanie Google Data Studio w raportowaniu i wizualizacji danych - Mateu...Wykorzystanie Google Data Studio w raportowaniu i wizualizacji danych - Mateu...
Wykorzystanie Google Data Studio w raportowaniu i wizualizacji danych - Mateu...
 
Agile reporting
Agile reportingAgile reporting
Agile reporting
 
Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)
Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)
Automatyczny Monitoring Jakości w Fabryce (Sztuczna Inteligencja, byteLAKE)
 
Wprowadzenie do modelowania danych w PowerPivot
Wprowadzenie do modelowania danych w PowerPivotWprowadzenie do modelowania danych w PowerPivot
Wprowadzenie do modelowania danych w PowerPivot
 
Wyklad inauguracyjny
Wyklad inauguracyjnyWyklad inauguracyjny
Wyklad inauguracyjny
 
Case study eCommerce od OEX Divante
Case study eCommerce od OEX DivanteCase study eCommerce od OEX Divante
Case study eCommerce od OEX Divante
 
Automatyzacja w praktyce. Praktyka automatyzacji
Automatyzacja w praktyce. Praktyka automatyzacjiAutomatyzacja w praktyce. Praktyka automatyzacji
Automatyzacja w praktyce. Praktyka automatyzacji
 
Militaria.pl - case study
Militaria.pl - case studyMilitaria.pl - case study
Militaria.pl - case study
 
Divante - Mała książeczka sukcesów
Divante - Mała książeczka sukcesówDivante - Mała książeczka sukcesów
Divante - Mała książeczka sukcesów
 
Łukasz Grala - BI w Sql 2008
Łukasz Grala - BI w Sql 2008Łukasz Grala - BI w Sql 2008
Łukasz Grala - BI w Sql 2008
 

Elitmind @ SQLDay2018: Stream Analytics i Machine Learning – czy to dobrze dobrana para na współczesne wyzwania? - B. Leśniarek/K.Słomka

  • 1. SQLDay 2018 Stream Analytics i Machine Learning – czy to dobrze dobrana para na współczesne wyzwania? Barbara Leśniarek Kamil Słomka
  • 2. SQLDay 2018 Prelegenci Barbara Leśniarek Kamil Słomka • Konsultant, architekt i team leader z ponad 7-letnim doświadczeniem w obszarach Business Intelligence i integracji danych • Od początku kariery związany z technologiami wokół platformy danych Microsoft • Zawodowe zainteresowania: Big Data, Machine Learning i Cloud • Konsultant obszaru data science z ponad 8-letnim doświadczeniem w obszarze modelowania, data mining i ML • Lider zespołu zajmującego się zaawansowaną analizą danych, ekspert w obszarze analytical fraud detection • Zawodowe zainteresowania: Applied data science and statistics in Business Intelligence solutions
  • 3. SQLDay 2018 Agenda • Scenariusz biznesowy, czyli jakie wyzwanie podejmujemy • Architektura rozwiązania i wykorzystane narzędzia: – Stream Analytics – Machine Learning Studio – Power BI • DEMO – real challenge! • Podsumowanie - co warto zapamiętać • Co dalej… czyli inne potencjalne zastosowania
  • 4. SQLDay 2018 Cel biznesowy: Badamy aktywność użytkowników w kanale elektronicznym - ich opinie na temat naszej firmy w czasie rzeczywistym Dane: Posty ze strony www / portalu social media dotyczące naszej firmy Metoda: Analizujemy wydźwięk emocjonalny postów i identyfikujemy anomalie w wielkości ruchu użytkowników Wyzwania: 1. Obsługa strumienia danych 2. Machine learning (Text mining + Detekcja anomalii) 3. Raportowanie w czasie bliskim rzeczywistemu Rozwiązanie: ? Scenariusz
  • 5. SQLDay 2018 Analiza danych strumieniowych w Azure
  • 6. SQLDay 2018 • Silnik przetwarzania zdarzeń • Definiowany i rozliczany per job Azure Stream Analytics • Wejścia: Blob storage, Event Hub, IoT Hub • Transformacja danych: •Język zapytań bazujący na SQL •Funkcje: JavaScript i Azure Machine Learning • • Wyjścia: Blob/Table storage, Event Hub, SQL DB, Service Bus, Power BI, Data Lake Store, Azure Function, Cosmos DB
  • 7. SQLDay 2018 Architektura rozwiązania .NET application Power BI Machine Learning Stream Analytics Blob storage (input) Blob storage (output)
  • 8. SQLDay 2018 Azure Machine Learning Jak to wygląda u nas ...
  • 9. SQLDay 2018 Schemat rozwiązania w Azure : Krok 1 : Sentiment ... any limitations ??
  • 10. SQLDay 2018 Schemat rozwiązania w Azure : Krok 2 : Anomaly
  • 11. SQLDay 2018 Schemat rozwiązania w Azure : Krok 2 : Anomaly ... any problems ?
  • 14. SQLDay 2018 Za pomocą platformy Azure stworzyliśmy rozwiązanie, które: • Analizuje strumień danych tekstowych – opinie klientów o firmie przekazywane w kanale elektronicznym • Wykorzystuje metody uczenia maszynowego do zbadania wydźwięku tych opinii • Agreguje statystyki ruchu i wykorzystuje kolejny model zaawansowanej analityki do wyszukiwania ich anomalii • Wyniki pośrednie (niezagregowane) zapisuje na blob storage do plików csv, umożliwiając ich dalszą, szczegółową analizę • Wyniki zagregowane, wielkość ruchu i anomalie, są prezentowane w czasie rzeczywistym na raporcie Power BI Podsumowanie, czyli co warto zapamiętać
  • 15. SQLDay 2018 Zalety zastosowanego podejścia • To działa! Możliwość wykorzystania rozbudowanych modeli predykcyjnych dla danych strumieniowych i raportowanie w trybie on-line przy minimalnych nakładzie prac programistycznych • Integracja usług Stream Analytics, Machine Learning, Power BI jest łatwa i szybka • Rozwiązanie zrealizowane w całości w architekturze PaaS • Prosty model rozliczeń • Rozwiązanie Stream Analytics możemy tworzyć i rozwijać za pomocą Visual Studio (ale nie bez problemów)
  • 16. SQLDay 2018 Ograniczenia i napotkane problemy • Brak możliwości testowania zapytań (transformacji) wykorzystujących funkcje Machine Learning • Brak możliwości wykorzystania funkcji ML w przypadku uruchamiania Stream Analytics lokalnie z poziomu Visual Studio • Brak możliwości debugowania rozwiązania i inne niedoskonałości narzędzi deweloperskich • Brak możliwości jakichkolwiek edycji Data Setu (pola wyliczane, ręczne usunięcie starych danych) w Power BI po bezpośrednim załadowaniu danych z Stream Analytics
  • 17. SQLDay 2018 Co dalej… czyli potencjalne zastosowania • Analiza danych social media, for, czatów… • Badanie nastrojów • Badanie skuteczności kampanii marketingowych • Wykrywanie anomalii (awarii) • Predictive maintenance – zakłady produkcyjne, centra danych itp. • Analiza kursów giełdowych • Analiza danych clickstream • Scoringi on-line masowych zdarzeń • Analiza rozmów telefonicznych (np. BOK)
  • 18. SQLDay 2018 Bibliografia • Omówienie usługi Azure Stream Analytics https://docs.microsoft.com/en-us/azure/stream-analytics/stream-analytics-introduction • Przykład integracji Azure Stream Analytics z Azure Machine Learning https://docs.microsoft.com/en-us/azure/stream-analytics/stream-analytics-machine-learning-integration- tutorial • Omówienie pracy z Azure Stream Analytics w Visual Studio https://docs.microsoft.com/pl-pl/azure/stream-analytics/stream-analytics-tools-for-visual-studio • Implementacja wykrywania anomalii w Azure Stream Analytics bez wykorzystania Azure Machine Learning https://docs.microsoft.com/pl-pl/azure/stream-analytics/stream-analytics-machine-learning-anomaly- detection • Algorytm zaimplementowany w AML do detekcji anomalii https://www.mo-data.com/anomaly-detection-using-machine-learning-to-detect-abnormalities-in-time- series-data
  • 19. SQLDay 2018 Dziękujemy za uwagę  Pytania? Kontakt: Barbara Leśniarek Kamil Słomka Barbara.Lesniarek@elitmind.com Kamil.Slomka@elitmind.com
  • 20. SQLDay 2018 GOLD SPONSORS SILVER SPONSORS BRONZE SPONSOR STRATEGIC PARTNER

Notes de l'éditeur

  1. STREAM ANALITYCS QUERY LANGUAGE
  2. Przygotowanie danych Budowa modeli Pakiet R, Python