SlideShare une entreprise Scribd logo
1  sur  30
Télécharger pour lire hors ligne
Federated Learning: Budowanie modeli
uczenia maszynowego bez wglądu w
rozproszone dane
Autorzy:
Rafał Wojdan
AI & NLP Day 2020 1
Scentralizowane uczenie (Centralised learning)
2
https://ekkono.ai/wp-content/uploads/2020/06/SWP_Federated_Lear
ning_Ekkono_Solutions_May_2020.pdf
Rośnie rynek IoT i Mobile
3
Wyzwania dla scentralizowanego
uczenia
● Łączność (Connectivity)
● Przepustowość łącza (Bandwidth)
● Opóźnienie (Latency)
● Prywatność (Privacy)
Zdecentralizowane uczenie (decentralised
learning)
4
https://ekkono.ai/wp-content/uploads/2020/06/SWP_Federated_Lear
ning_Ekkono_Solutions_May_2020.pdf
Brak
generalizacji
Federated Learning (Od 2019)
5
https://medium.com/accenture-the-dock/instilling-responsible-and-reliable-ai-development-with-federated-learning-d23c366c5efd
FL - korzyści
6
Mniejsze wymagania sprzętowe:
● Łączność (Connectivity)
● Przepustowość łącza (Bandwidth)
Predykcja w czasie rzeczywistym
● Opóźnienie (Latency)
Uczenie bez wglądu do danych
● Prywatność (Privacy)
Globalny model
● Generalizacja
Algorytmy update modelu w FL
7
● Federated Averaging
(FedAvg)
● Federated Stochastic
Gradient Descent
(FedSGD)
● Federated Learning
with Matched
Averaging (FedMA)
https://arxiv.org/pdf/1602.05629.pdf
Uśrednianie modelu (FedAvg) vs uśrednianie
gradientu (FedSGD)
8
https://arxiv.org/pdf/1602.05629.pdf
Porównanie:
● FedSGD gwarantuje zbieżność
● FedAvg lżejszy komunikacyjnie (mniej
update’ów modelu globalnego)
Przykład CIFAR-10
Liczba update’ów dająca 82% dokładności
(Accuracy):
● FedSGD 6 600
● FedAvg 630
FedAvg 10x mniej rund niż
FedSGD
Nowe hiperparametry
9
Hiperparametry:
C - część klientów, którzy uczestniczą w uczeniu w każdej rundzie
E - liczba iteracji treningowych u każdego klienta na lokalnym zbiorze
B - rozmiar lokalnego mini-batcha
Więcej: https://arxiv.org/pdf/1602.05629.pdf
Wyzwania techniczne dla Federated Learning
10
● Komunikacja
○ Liczba aktualizacji modelu globalnego
○ Przesłanie nowego modelu globalnego na urządzenia lokalne
● Zmienny udział lokalnych urządzeń
○ Część urządzeń dostępnych do update’u
○ Ograniczenia sprzętowe lokalnych urządzeń
○ Odłączenie od sieci FL
● Ochrona prywatności
Zabezpieczone agregowanie
11
https://federated.withgoogle.com/#about
Wyzwania MLowe dla Federated Learning
12
● Inference attack
● Model poisoning
● Prywatność danych (Memorization)
● Heterogeniczność danych
Model poisoning
13
https://medium.com/datadriveninvestor/an-overview-of-federated-learning-8a1a62b0600d
https://arxiv.org/pdf/1808.04866.pdf
GBoard
14
Wzrost o 26%
Poprawa CTR
o 10%
GBoard - predykcja następnego
słowa
https://arxiv.org/pdf/1811.03604.pdf
Memorization
15
https://www.pdl.cmu.edu/SDI/2019/slides/2019-09
-05Federated%20Learning.pdf
A co jeśli model
językowy będzie za
dobry?
Differential privacy
16
https://medium.com/georgian-impact-blog/a-brief-introduction-t
o-differential-privacy-eacf8722283b
https://www.accessnow.org/understanding-differential-privacy-
matters-digital-rights/
Kwerenda: Liczba bad credit rating
Różne architektury i business case’y
17
https://www.arxiv-vanity.com/papers/1902.04885/
Problem dobry do zastosowania Federated
Learning
18
1) Dane ze źródła lepsza niż dane
przybliżone (proxy data) dostępne
centralnie
2) Wymóg prywatności
3) Dostępność etykiet - są
generowane w ramach procesu np.
przez użytkowników
Your problem and FL have liked each other
PROBLEM FEDERATED
LEARNING
Czemu korzystamy z FL w Sotrender?
19
Nasze wyzwania:
● Zróżnicowanie rozkładów w czasie
● Zróżnicowanie rozkładów pomiędzy klientami
● Zróżnicowany rozmiar danych
● Małe dane per klient
Separacja danych FB
Nie korzystamy z danych mobile.
Nie korzystamy z danych edge device.
Ale…
Jak szpitale musimy zachować
prywatność danych klientów.
Rozwiązania open source
20
● Xgboost https://github.com/mc2-project/secure-xgboost
● TFF - Tensorflow Federated
● PySyft dla PyTorcha
● IBM differential privacy
https://github.com/IBM/differential-privacy-library
Dziękuję za uwagę!
21
Problem
22
https://www.pdl.cmu.edu/SDI/2019/slides/2019-09-05Federated%20Learning.pdf Coraz
więcej danych on the edge, rośnie prywatność. Ale co z analizami i ML.
Trochę historii 2014 -2019, trzy rozwiązania
Różnice między tradycyjnym rozproszonym
uczeniem, a Federated Learning
23
https://www.pdl.cmu.edu/SDI/2019/slides/2019-09-05Fede
rated%20Learning.pdf
Korzyści
24
Benefits
Here are some primary benefits of federated machine learning:
● FL enables devices like mobile phones to collaboratively learn a shared prediction model while keeping the training
data on the device instead of requiring the data to be uploaded and stored on a central server.
● Moves model training to the edge, namely devices such as smartphones, tablets, IoT, or even “organizations” like
hospitals that are required to operate under strict privacy constraints. Having personal data remain local is a strong
security benefit.
● Makes real-time prediction possible, since prediction happens on the device itself. FL reduces the time lag that
occurs due to transmitting raw data back to a central server and then shipping the results back to the device.
● Since the models reside on the device, the prediction process works even when there is no internet connectivity.
● FL reduces the amount of hardware infrastructure required. FL uses minimal hardware and what is available in
mobile devices is more than enough to run the FL models.
Wyzwania dla Federated Learning
25
Challenges
● There are a number of core challenges associated with FL. First, communication is a critical bottleneck in FL networks
where data generated on each device remain local. In order to train a model using data generated by the devices in the
network, it is necessary to develop communication-efficient methods that reduce the total number of communication
rounds, and also iteratively send small model updates as part of the training process, as opposed to sending the entire
data set.
● Additionally, FL methods must: anticipate low levels of device participation, i.e. only a small fraction of the devices being
active at once; tolerate variability in hardware that affects storage, computational, and communication capabilities of
each device in a federated network; and be able to handle dropped devices in the network.
● Finally, FL helps to protect data generated on a device by sharing model updates such as gradient data instead of raw
data. But communicating model updates throughout the training process can still reveal sensitive information, either to a
third party, or to the central server.
Model memorization
26
Understanding and mitigating the risks of model memorization is an active area of research. Techniques to measure memorization
are explored, e.g. in the 2018 paper The Secret Sharer: Measuring Unintended Neural Network Memorization & Extracting Secrets.
Memorization risk can be mitigated by pre-filtering rare or sensitive information before training. More sophisticated mitigation
techniques include differentially private model training as explored, for example, in the 2018 paper Learning Differentially Private
Recurrent Language Models, which shows how to learn model weights that are not too dependent on any one device’s data. For more
information on differential privacy, the canonical textbook “The Algorithmic Foundations of Differential Privacy” by Cynthia Dwork and
Aaron Roth is available from NOW publishers and online.
https://federated.withgoogle.com/#about
Wyzwania dla Federated Learning
27
Tutaj są 3 fajne: ML, komunikacja i privacy
https://medium.com/accenture-the-dock/instilling-responsi
ble-and-reliable-ai-development-with-federated-learning-d
23c366c5efd
● Wyzwania dla FL https://medium.com/datadriveninvestor/an-overview-of-federated-learning-8a1a62b0600d
1. Inference attack - pozyskanie informacji o specyficznych userach -> rozwiązanie to differential privacy
https://medium.com/georgian-impact-blog/a-brief-introduction-to-differential-privacy-eacf8722283b
2. Model poisoning
Wyzwania ML dla Federated Learning
28
1. Problemy ML - moim zdaniem
1. Rozkład danych
2. Ile epoch uczenia lokalnie
3. Ogólnie hiperparameters tuning
4. Wagi udziału każdego klienta
https://www.pdl.cmu.edu/SDI/2019/slides/2019-09-05Federated%20Learning.pdf kilka ciekawych przykładów nie tylko ML
Differential privacy
29
https://towardsdatascience.com/ai-differential-privacy-and-
federated-learning-523146d46b85
Super przykład z kartą kredytową
https://www.pdl.cmu.edu/SDI/2019/slides/2019-09-05Fede
rated%20Learning.pdf
Przykłady użycia
30
https://www.pdl.cmu.edu/SDI/2019/
slides/2019-09-05Federated%20Le
arning.pdf dużo fajnych z Google’a

Contenu connexe

Similaire à Federated Learning: Budowanie modeli uczenia maszynowego bez wglądu w rozproszone dane

PUBLIC RELATIONS — NARZĘDZIA JEDNOSTRONNEGO KOMUNIKOWANIA I DIALOGU W INTERNECIE
PUBLIC RELATIONS — NARZĘDZIA JEDNOSTRONNEGO KOMUNIKOWANIA I DIALOGU W INTERNECIEPUBLIC RELATIONS — NARZĘDZIA JEDNOSTRONNEGO KOMUNIKOWANIA I DIALOGU W INTERNECIE
PUBLIC RELATIONS — NARZĘDZIA JEDNOSTRONNEGO KOMUNIKOWANIA I DIALOGU W INTERNECIEDariusz Tworzydło
 
10. Analizowanie potrzeb klienta i projektowanie struktury baz danych
10. Analizowanie potrzeb klienta i projektowanie struktury baz danych10. Analizowanie potrzeb klienta i projektowanie struktury baz danych
10. Analizowanie potrzeb klienta i projektowanie struktury baz danychkalaxq
 
Chmura publiczna w Polsce. Śniadanie prasowe.
Chmura publiczna w Polsce. Śniadanie prasowe.Chmura publiczna w Polsce. Śniadanie prasowe.
Chmura publiczna w Polsce. Śniadanie prasowe.Deloitte Polska
 
Jak transferować wiedzę?
Jak transferować wiedzę?Jak transferować wiedzę?
Jak transferować wiedzę?Sektor 3.0
 
Narzedzia technologiczne, ktore umozliwiaja zachowanie wiedzy w organizacji
Narzedzia technologiczne, ktore umozliwiaja zachowanie wiedzy w organizacjiNarzedzia technologiczne, ktore umozliwiaja zachowanie wiedzy w organizacji
Narzedzia technologiczne, ktore umozliwiaja zachowanie wiedzy w organizacjiTomasz Karwatka
 
Raport Deloitte i Gazeta.pl o bezpieczeństwie: polski aspekt Global Security ...
Raport Deloitte i Gazeta.pl o bezpieczeństwie: polski aspekt Global Security ...Raport Deloitte i Gazeta.pl o bezpieczeństwie: polski aspekt Global Security ...
Raport Deloitte i Gazeta.pl o bezpieczeństwie: polski aspekt Global Security ...Rafal
 
Bezpieczeństwo w polskim Internecie 2009
Bezpieczeństwo w polskim Internecie 2009Bezpieczeństwo w polskim Internecie 2009
Bezpieczeństwo w polskim Internecie 2009Wojciech Boczoń
 
43. Instalowanie i konfigurowanie sieci
43. Instalowanie i konfigurowanie sieci43. Instalowanie i konfigurowanie sieci
43. Instalowanie i konfigurowanie sieciLukas Pobocha
 
Technik.teleinformatyk 312[02] z3.04_u
Technik.teleinformatyk 312[02] z3.04_uTechnik.teleinformatyk 312[02] z3.04_u
Technik.teleinformatyk 312[02] z3.04_uRzeźnik Sebastian
 
[techrisk2019] Czas, błędy, wnioski i ryzyko technologiczne
[techrisk2019] Czas, błędy, wnioski i ryzyko technologiczne[techrisk2019] Czas, błędy, wnioski i ryzyko technologiczne
[techrisk2019] Czas, błędy, wnioski i ryzyko technologiczneArtur Marek Maciąg
 
Technik.mechatronik 311[50] z1.05_u
Technik.mechatronik 311[50] z1.05_uTechnik.mechatronik 311[50] z1.05_u
Technik.mechatronik 311[50] z1.05_uKubaSroka
 
Technologie non-profit | Fundacja TechSoup
Technologie non-profit | Fundacja TechSoupTechnologie non-profit | Fundacja TechSoup
Technologie non-profit | Fundacja TechSoupAdam Gieniusz
 
Raport Interaktywnie.com: Domeny, hosting i chmura
Raport Interaktywnie.com: Domeny, hosting i chmuraRaport Interaktywnie.com: Domeny, hosting i chmura
Raport Interaktywnie.com: Domeny, hosting i chmuraAnna Piekart
 
Cloud computing we współpracy firm logistycznych
Cloud computing we współpracy firm logistycznychCloud computing we współpracy firm logistycznych
Cloud computing we współpracy firm logistycznychArkadiusz Kawa
 

Similaire à Federated Learning: Budowanie modeli uczenia maszynowego bez wglądu w rozproszone dane (20)

O1.03
O1.03O1.03
O1.03
 
PUBLIC RELATIONS — NARZĘDZIA JEDNOSTRONNEGO KOMUNIKOWANIA I DIALOGU W INTERNECIE
PUBLIC RELATIONS — NARZĘDZIA JEDNOSTRONNEGO KOMUNIKOWANIA I DIALOGU W INTERNECIEPUBLIC RELATIONS — NARZĘDZIA JEDNOSTRONNEGO KOMUNIKOWANIA I DIALOGU W INTERNECIE
PUBLIC RELATIONS — NARZĘDZIA JEDNOSTRONNEGO KOMUNIKOWANIA I DIALOGU W INTERNECIE
 
10. Analizowanie potrzeb klienta i projektowanie struktury baz danych
10. Analizowanie potrzeb klienta i projektowanie struktury baz danych10. Analizowanie potrzeb klienta i projektowanie struktury baz danych
10. Analizowanie potrzeb klienta i projektowanie struktury baz danych
 
Chmura publiczna w Polsce. Śniadanie prasowe.
Chmura publiczna w Polsce. Śniadanie prasowe.Chmura publiczna w Polsce. Śniadanie prasowe.
Chmura publiczna w Polsce. Śniadanie prasowe.
 
Jak transferować wiedzę?
Jak transferować wiedzę?Jak transferować wiedzę?
Jak transferować wiedzę?
 
Narzedzia technologiczne, ktore umozliwiaja zachowanie wiedzy w organizacji
Narzedzia technologiczne, ktore umozliwiaja zachowanie wiedzy w organizacjiNarzedzia technologiczne, ktore umozliwiaja zachowanie wiedzy w organizacji
Narzedzia technologiczne, ktore umozliwiaja zachowanie wiedzy w organizacji
 
Ireneusz_Tarnowski
Ireneusz_TarnowskiIreneusz_Tarnowski
Ireneusz_Tarnowski
 
M3j3
M3j3M3j3
M3j3
 
M3j3
M3j3M3j3
M3j3
 
Raport Deloitte i Gazeta.pl o bezpieczeństwie: polski aspekt Global Security ...
Raport Deloitte i Gazeta.pl o bezpieczeństwie: polski aspekt Global Security ...Raport Deloitte i Gazeta.pl o bezpieczeństwie: polski aspekt Global Security ...
Raport Deloitte i Gazeta.pl o bezpieczeństwie: polski aspekt Global Security ...
 
Bezpieczeństwo w polskim Internecie 2009
Bezpieczeństwo w polskim Internecie 2009Bezpieczeństwo w polskim Internecie 2009
Bezpieczeństwo w polskim Internecie 2009
 
43. Instalowanie i konfigurowanie sieci
43. Instalowanie i konfigurowanie sieci43. Instalowanie i konfigurowanie sieci
43. Instalowanie i konfigurowanie sieci
 
Technik.teleinformatyk 312[02] z3.04_u
Technik.teleinformatyk 312[02] z3.04_uTechnik.teleinformatyk 312[02] z3.04_u
Technik.teleinformatyk 312[02] z3.04_u
 
[techrisk2019] Czas, błędy, wnioski i ryzyko technologiczne
[techrisk2019] Czas, błędy, wnioski i ryzyko technologiczne[techrisk2019] Czas, błędy, wnioski i ryzyko technologiczne
[techrisk2019] Czas, błędy, wnioski i ryzyko technologiczne
 
Technik.mechatronik 311[50] z1.05_u
Technik.mechatronik 311[50] z1.05_uTechnik.mechatronik 311[50] z1.05_u
Technik.mechatronik 311[50] z1.05_u
 
Technologie non-profit | Fundacja TechSoup
Technologie non-profit | Fundacja TechSoupTechnologie non-profit | Fundacja TechSoup
Technologie non-profit | Fundacja TechSoup
 
M4j3
M4j3M4j3
M4j3
 
M4j3
M4j3M4j3
M4j3
 
Raport Interaktywnie.com: Domeny, hosting i chmura
Raport Interaktywnie.com: Domeny, hosting i chmuraRaport Interaktywnie.com: Domeny, hosting i chmura
Raport Interaktywnie.com: Domeny, hosting i chmura
 
Cloud computing we współpracy firm logistycznych
Cloud computing we współpracy firm logistycznychCloud computing we współpracy firm logistycznych
Cloud computing we współpracy firm logistycznych
 

Plus de Sotrender

Topic modeling - nie tylko LDA w Gensim
Topic modeling - nie tylko LDA w GensimTopic modeling - nie tylko LDA w Gensim
Topic modeling - nie tylko LDA w GensimSotrender
 
Facebook Audience Insights – czyli czym interesują się polscy użytkownicy Fac...
Facebook Audience Insights – czyli czym interesują się polscy użytkownicy Fac...Facebook Audience Insights – czyli czym interesują się polscy użytkownicy Fac...
Facebook Audience Insights – czyli czym interesują się polscy użytkownicy Fac...Sotrender
 
Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...
Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...
Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...Sotrender
 
Rozpoznawanie treści obrazów na kreacjach reklam na Facebooku z wykorzystanie...
Rozpoznawanie treści obrazów na kreacjach reklam na Facebooku z wykorzystanie...Rozpoznawanie treści obrazów na kreacjach reklam na Facebooku z wykorzystanie...
Rozpoznawanie treści obrazów na kreacjach reklam na Facebooku z wykorzystanie...Sotrender
 
Predykcja efektywności działań marketingowych w serwisie Facebook
Predykcja efektywności działań marketingowych w serwisie FacebookPredykcja efektywności działań marketingowych w serwisie Facebook
Predykcja efektywności działań marketingowych w serwisie FacebookSotrender
 
Trenowanie i wdrażanie modeli uczenia maszynowego z wykorzystaniem Google Clo...
Trenowanie i wdrażanie modeli uczenia maszynowego z wykorzystaniem Google Clo...Trenowanie i wdrażanie modeli uczenia maszynowego z wykorzystaniem Google Clo...
Trenowanie i wdrażanie modeli uczenia maszynowego z wykorzystaniem Google Clo...Sotrender
 
Wykrywanie mowy nienawiści w języku polskim
Wykrywanie mowy nienawiści w języku polskimWykrywanie mowy nienawiści w języku polskim
Wykrywanie mowy nienawiści w języku polskimSotrender
 
Prawdziwe oblicze tekstu, czyli jak rozmawiamy w sieci [WDI 2019]
Prawdziwe oblicze tekstu, czyli jak rozmawiamy w sieci [WDI 2019]Prawdziwe oblicze tekstu, czyli jak rozmawiamy w sieci [WDI 2019]
Prawdziwe oblicze tekstu, czyli jak rozmawiamy w sieci [WDI 2019]Sotrender
 
Ślady cyfrowe - sposoby na analizowanie aktywności internautów i działań rekl...
Ślady cyfrowe - sposoby na analizowanie aktywności internautów i działań rekl...Ślady cyfrowe - sposoby na analizowanie aktywności internautów i działań rekl...
Ślady cyfrowe - sposoby na analizowanie aktywności internautów i działań rekl...Sotrender
 
Bajki robotów? Machine Learning in Digital Marketing | Konferencja In Digital...
Bajki robotów? Machine Learning in Digital Marketing | Konferencja In Digital...Bajki robotów? Machine Learning in Digital Marketing | Konferencja In Digital...
Bajki robotów? Machine Learning in Digital Marketing | Konferencja In Digital...Sotrender
 
Sztuczna inteligencja w marketingu | Infoshare 2019
Sztuczna inteligencja w marketingu | Infoshare 2019Sztuczna inteligencja w marketingu | Infoshare 2019
Sztuczna inteligencja w marketingu | Infoshare 2019Sotrender
 
Pragmatic Machine Learning in Business
Pragmatic Machine Learning in BusinessPragmatic Machine Learning in Business
Pragmatic Machine Learning in BusinessSotrender
 
Wykorzystanie Big Data i cyfrowego śladu w naukach psychologicznych i społecz...
Wykorzystanie Big Data i cyfrowego śladu w naukach psychologicznych i społecz...Wykorzystanie Big Data i cyfrowego śladu w naukach psychologicznych i społecz...
Wykorzystanie Big Data i cyfrowego śladu w naukach psychologicznych i społecz...Sotrender
 
Jak wykorzystać social media w badaniach i jak przełożyć to na decyzje związa...
Jak wykorzystać social media w badaniach i jak przełożyć to na decyzje związa...Jak wykorzystać social media w badaniach i jak przełożyć to na decyzje związa...
Jak wykorzystać social media w badaniach i jak przełożyć to na decyzje związa...Sotrender
 
Obsługa klienta w social media
Obsługa klienta w social mediaObsługa klienta w social media
Obsługa klienta w social mediaSotrender
 
Jakimi wartościami kieruje się Twoja grupa docelowa? [Listonic Case Study]
Jakimi wartościami kieruje się Twoja grupa docelowa? [Listonic Case Study]Jakimi wartościami kieruje się Twoja grupa docelowa? [Listonic Case Study]
Jakimi wartościami kieruje się Twoja grupa docelowa? [Listonic Case Study]Sotrender
 
Każde pokolenie ma swój czas? Różnice generacyjne a dane z mediów społecznośc...
Każde pokolenie ma swój czas? Różnice generacyjne a dane z mediów społecznośc...Każde pokolenie ma swój czas? Różnice generacyjne a dane z mediów społecznośc...
Każde pokolenie ma swój czas? Różnice generacyjne a dane z mediów społecznośc...Sotrender
 
Poszerzanie pola walki - czyli z kim tak naprawdę konkurujecie?
Poszerzanie pola walki - czyli z kim tak naprawdę konkurujecie? Poszerzanie pola walki - czyli z kim tak naprawdę konkurujecie?
Poszerzanie pola walki - czyli z kim tak naprawdę konkurujecie? Sotrender
 
Mallkołaj rozdaje prezenty - Case Study z akcji Mall.pl i Los Videos
Mallkołaj rozdaje prezenty - Case Study z akcji Mall.pl i Los VideosMallkołaj rozdaje prezenty - Case Study z akcji Mall.pl i Los Videos
Mallkołaj rozdaje prezenty - Case Study z akcji Mall.pl i Los VideosSotrender
 
Kilka praktycznych sposobów na wykorzystanie danych z social media w marketingu
Kilka praktycznych sposobów na wykorzystanie danych z social media w marketinguKilka praktycznych sposobów na wykorzystanie danych z social media w marketingu
Kilka praktycznych sposobów na wykorzystanie danych z social media w marketinguSotrender
 

Plus de Sotrender (20)

Topic modeling - nie tylko LDA w Gensim
Topic modeling - nie tylko LDA w GensimTopic modeling - nie tylko LDA w Gensim
Topic modeling - nie tylko LDA w Gensim
 
Facebook Audience Insights – czyli czym interesują się polscy użytkownicy Fac...
Facebook Audience Insights – czyli czym interesują się polscy użytkownicy Fac...Facebook Audience Insights – czyli czym interesują się polscy użytkownicy Fac...
Facebook Audience Insights – czyli czym interesują się polscy użytkownicy Fac...
 
Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...
Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...
Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...
 
Rozpoznawanie treści obrazów na kreacjach reklam na Facebooku z wykorzystanie...
Rozpoznawanie treści obrazów na kreacjach reklam na Facebooku z wykorzystanie...Rozpoznawanie treści obrazów na kreacjach reklam na Facebooku z wykorzystanie...
Rozpoznawanie treści obrazów na kreacjach reklam na Facebooku z wykorzystanie...
 
Predykcja efektywności działań marketingowych w serwisie Facebook
Predykcja efektywności działań marketingowych w serwisie FacebookPredykcja efektywności działań marketingowych w serwisie Facebook
Predykcja efektywności działań marketingowych w serwisie Facebook
 
Trenowanie i wdrażanie modeli uczenia maszynowego z wykorzystaniem Google Clo...
Trenowanie i wdrażanie modeli uczenia maszynowego z wykorzystaniem Google Clo...Trenowanie i wdrażanie modeli uczenia maszynowego z wykorzystaniem Google Clo...
Trenowanie i wdrażanie modeli uczenia maszynowego z wykorzystaniem Google Clo...
 
Wykrywanie mowy nienawiści w języku polskim
Wykrywanie mowy nienawiści w języku polskimWykrywanie mowy nienawiści w języku polskim
Wykrywanie mowy nienawiści w języku polskim
 
Prawdziwe oblicze tekstu, czyli jak rozmawiamy w sieci [WDI 2019]
Prawdziwe oblicze tekstu, czyli jak rozmawiamy w sieci [WDI 2019]Prawdziwe oblicze tekstu, czyli jak rozmawiamy w sieci [WDI 2019]
Prawdziwe oblicze tekstu, czyli jak rozmawiamy w sieci [WDI 2019]
 
Ślady cyfrowe - sposoby na analizowanie aktywności internautów i działań rekl...
Ślady cyfrowe - sposoby na analizowanie aktywności internautów i działań rekl...Ślady cyfrowe - sposoby na analizowanie aktywności internautów i działań rekl...
Ślady cyfrowe - sposoby na analizowanie aktywności internautów i działań rekl...
 
Bajki robotów? Machine Learning in Digital Marketing | Konferencja In Digital...
Bajki robotów? Machine Learning in Digital Marketing | Konferencja In Digital...Bajki robotów? Machine Learning in Digital Marketing | Konferencja In Digital...
Bajki robotów? Machine Learning in Digital Marketing | Konferencja In Digital...
 
Sztuczna inteligencja w marketingu | Infoshare 2019
Sztuczna inteligencja w marketingu | Infoshare 2019Sztuczna inteligencja w marketingu | Infoshare 2019
Sztuczna inteligencja w marketingu | Infoshare 2019
 
Pragmatic Machine Learning in Business
Pragmatic Machine Learning in BusinessPragmatic Machine Learning in Business
Pragmatic Machine Learning in Business
 
Wykorzystanie Big Data i cyfrowego śladu w naukach psychologicznych i społecz...
Wykorzystanie Big Data i cyfrowego śladu w naukach psychologicznych i społecz...Wykorzystanie Big Data i cyfrowego śladu w naukach psychologicznych i społecz...
Wykorzystanie Big Data i cyfrowego śladu w naukach psychologicznych i społecz...
 
Jak wykorzystać social media w badaniach i jak przełożyć to na decyzje związa...
Jak wykorzystać social media w badaniach i jak przełożyć to na decyzje związa...Jak wykorzystać social media w badaniach i jak przełożyć to na decyzje związa...
Jak wykorzystać social media w badaniach i jak przełożyć to na decyzje związa...
 
Obsługa klienta w social media
Obsługa klienta w social mediaObsługa klienta w social media
Obsługa klienta w social media
 
Jakimi wartościami kieruje się Twoja grupa docelowa? [Listonic Case Study]
Jakimi wartościami kieruje się Twoja grupa docelowa? [Listonic Case Study]Jakimi wartościami kieruje się Twoja grupa docelowa? [Listonic Case Study]
Jakimi wartościami kieruje się Twoja grupa docelowa? [Listonic Case Study]
 
Każde pokolenie ma swój czas? Różnice generacyjne a dane z mediów społecznośc...
Każde pokolenie ma swój czas? Różnice generacyjne a dane z mediów społecznośc...Każde pokolenie ma swój czas? Różnice generacyjne a dane z mediów społecznośc...
Każde pokolenie ma swój czas? Różnice generacyjne a dane z mediów społecznośc...
 
Poszerzanie pola walki - czyli z kim tak naprawdę konkurujecie?
Poszerzanie pola walki - czyli z kim tak naprawdę konkurujecie? Poszerzanie pola walki - czyli z kim tak naprawdę konkurujecie?
Poszerzanie pola walki - czyli z kim tak naprawdę konkurujecie?
 
Mallkołaj rozdaje prezenty - Case Study z akcji Mall.pl i Los Videos
Mallkołaj rozdaje prezenty - Case Study z akcji Mall.pl i Los VideosMallkołaj rozdaje prezenty - Case Study z akcji Mall.pl i Los Videos
Mallkołaj rozdaje prezenty - Case Study z akcji Mall.pl i Los Videos
 
Kilka praktycznych sposobów na wykorzystanie danych z social media w marketingu
Kilka praktycznych sposobów na wykorzystanie danych z social media w marketinguKilka praktycznych sposobów na wykorzystanie danych z social media w marketingu
Kilka praktycznych sposobów na wykorzystanie danych z social media w marketingu
 

Federated Learning: Budowanie modeli uczenia maszynowego bez wglądu w rozproszone dane

  • 1. Federated Learning: Budowanie modeli uczenia maszynowego bez wglądu w rozproszone dane Autorzy: Rafał Wojdan AI & NLP Day 2020 1
  • 2. Scentralizowane uczenie (Centralised learning) 2 https://ekkono.ai/wp-content/uploads/2020/06/SWP_Federated_Lear ning_Ekkono_Solutions_May_2020.pdf
  • 3. Rośnie rynek IoT i Mobile 3 Wyzwania dla scentralizowanego uczenia ● Łączność (Connectivity) ● Przepustowość łącza (Bandwidth) ● Opóźnienie (Latency) ● Prywatność (Privacy)
  • 5. Federated Learning (Od 2019) 5 https://medium.com/accenture-the-dock/instilling-responsible-and-reliable-ai-development-with-federated-learning-d23c366c5efd
  • 6. FL - korzyści 6 Mniejsze wymagania sprzętowe: ● Łączność (Connectivity) ● Przepustowość łącza (Bandwidth) Predykcja w czasie rzeczywistym ● Opóźnienie (Latency) Uczenie bez wglądu do danych ● Prywatność (Privacy) Globalny model ● Generalizacja
  • 7. Algorytmy update modelu w FL 7 ● Federated Averaging (FedAvg) ● Federated Stochastic Gradient Descent (FedSGD) ● Federated Learning with Matched Averaging (FedMA) https://arxiv.org/pdf/1602.05629.pdf
  • 8. Uśrednianie modelu (FedAvg) vs uśrednianie gradientu (FedSGD) 8 https://arxiv.org/pdf/1602.05629.pdf Porównanie: ● FedSGD gwarantuje zbieżność ● FedAvg lżejszy komunikacyjnie (mniej update’ów modelu globalnego) Przykład CIFAR-10 Liczba update’ów dająca 82% dokładności (Accuracy): ● FedSGD 6 600 ● FedAvg 630 FedAvg 10x mniej rund niż FedSGD
  • 9. Nowe hiperparametry 9 Hiperparametry: C - część klientów, którzy uczestniczą w uczeniu w każdej rundzie E - liczba iteracji treningowych u każdego klienta na lokalnym zbiorze B - rozmiar lokalnego mini-batcha Więcej: https://arxiv.org/pdf/1602.05629.pdf
  • 10. Wyzwania techniczne dla Federated Learning 10 ● Komunikacja ○ Liczba aktualizacji modelu globalnego ○ Przesłanie nowego modelu globalnego na urządzenia lokalne ● Zmienny udział lokalnych urządzeń ○ Część urządzeń dostępnych do update’u ○ Ograniczenia sprzętowe lokalnych urządzeń ○ Odłączenie od sieci FL ● Ochrona prywatności
  • 12. Wyzwania MLowe dla Federated Learning 12 ● Inference attack ● Model poisoning ● Prywatność danych (Memorization) ● Heterogeniczność danych
  • 14. GBoard 14 Wzrost o 26% Poprawa CTR o 10% GBoard - predykcja następnego słowa https://arxiv.org/pdf/1811.03604.pdf
  • 17. Różne architektury i business case’y 17 https://www.arxiv-vanity.com/papers/1902.04885/
  • 18. Problem dobry do zastosowania Federated Learning 18 1) Dane ze źródła lepsza niż dane przybliżone (proxy data) dostępne centralnie 2) Wymóg prywatności 3) Dostępność etykiet - są generowane w ramach procesu np. przez użytkowników Your problem and FL have liked each other PROBLEM FEDERATED LEARNING
  • 19. Czemu korzystamy z FL w Sotrender? 19 Nasze wyzwania: ● Zróżnicowanie rozkładów w czasie ● Zróżnicowanie rozkładów pomiędzy klientami ● Zróżnicowany rozmiar danych ● Małe dane per klient Separacja danych FB Nie korzystamy z danych mobile. Nie korzystamy z danych edge device. Ale… Jak szpitale musimy zachować prywatność danych klientów.
  • 20. Rozwiązania open source 20 ● Xgboost https://github.com/mc2-project/secure-xgboost ● TFF - Tensorflow Federated ● PySyft dla PyTorcha ● IBM differential privacy https://github.com/IBM/differential-privacy-library
  • 22. Problem 22 https://www.pdl.cmu.edu/SDI/2019/slides/2019-09-05Federated%20Learning.pdf Coraz więcej danych on the edge, rośnie prywatność. Ale co z analizami i ML. Trochę historii 2014 -2019, trzy rozwiązania
  • 23. Różnice między tradycyjnym rozproszonym uczeniem, a Federated Learning 23 https://www.pdl.cmu.edu/SDI/2019/slides/2019-09-05Fede rated%20Learning.pdf
  • 24. Korzyści 24 Benefits Here are some primary benefits of federated machine learning: ● FL enables devices like mobile phones to collaboratively learn a shared prediction model while keeping the training data on the device instead of requiring the data to be uploaded and stored on a central server. ● Moves model training to the edge, namely devices such as smartphones, tablets, IoT, or even “organizations” like hospitals that are required to operate under strict privacy constraints. Having personal data remain local is a strong security benefit. ● Makes real-time prediction possible, since prediction happens on the device itself. FL reduces the time lag that occurs due to transmitting raw data back to a central server and then shipping the results back to the device. ● Since the models reside on the device, the prediction process works even when there is no internet connectivity. ● FL reduces the amount of hardware infrastructure required. FL uses minimal hardware and what is available in mobile devices is more than enough to run the FL models.
  • 25. Wyzwania dla Federated Learning 25 Challenges ● There are a number of core challenges associated with FL. First, communication is a critical bottleneck in FL networks where data generated on each device remain local. In order to train a model using data generated by the devices in the network, it is necessary to develop communication-efficient methods that reduce the total number of communication rounds, and also iteratively send small model updates as part of the training process, as opposed to sending the entire data set. ● Additionally, FL methods must: anticipate low levels of device participation, i.e. only a small fraction of the devices being active at once; tolerate variability in hardware that affects storage, computational, and communication capabilities of each device in a federated network; and be able to handle dropped devices in the network. ● Finally, FL helps to protect data generated on a device by sharing model updates such as gradient data instead of raw data. But communicating model updates throughout the training process can still reveal sensitive information, either to a third party, or to the central server.
  • 26. Model memorization 26 Understanding and mitigating the risks of model memorization is an active area of research. Techniques to measure memorization are explored, e.g. in the 2018 paper The Secret Sharer: Measuring Unintended Neural Network Memorization & Extracting Secrets. Memorization risk can be mitigated by pre-filtering rare or sensitive information before training. More sophisticated mitigation techniques include differentially private model training as explored, for example, in the 2018 paper Learning Differentially Private Recurrent Language Models, which shows how to learn model weights that are not too dependent on any one device’s data. For more information on differential privacy, the canonical textbook “The Algorithmic Foundations of Differential Privacy” by Cynthia Dwork and Aaron Roth is available from NOW publishers and online. https://federated.withgoogle.com/#about
  • 27. Wyzwania dla Federated Learning 27 Tutaj są 3 fajne: ML, komunikacja i privacy https://medium.com/accenture-the-dock/instilling-responsi ble-and-reliable-ai-development-with-federated-learning-d 23c366c5efd ● Wyzwania dla FL https://medium.com/datadriveninvestor/an-overview-of-federated-learning-8a1a62b0600d 1. Inference attack - pozyskanie informacji o specyficznych userach -> rozwiązanie to differential privacy https://medium.com/georgian-impact-blog/a-brief-introduction-to-differential-privacy-eacf8722283b 2. Model poisoning
  • 28. Wyzwania ML dla Federated Learning 28 1. Problemy ML - moim zdaniem 1. Rozkład danych 2. Ile epoch uczenia lokalnie 3. Ogólnie hiperparameters tuning 4. Wagi udziału każdego klienta https://www.pdl.cmu.edu/SDI/2019/slides/2019-09-05Federated%20Learning.pdf kilka ciekawych przykładów nie tylko ML
  • 29. Differential privacy 29 https://towardsdatascience.com/ai-differential-privacy-and- federated-learning-523146d46b85 Super przykład z kartą kredytową https://www.pdl.cmu.edu/SDI/2019/slides/2019-09-05Fede rated%20Learning.pdf