SlideShare une entreprise Scribd logo
1  sur  112
Télécharger pour lire hors ligne
Grzegorz Gwardys, Daniel Grzywczak
Wizualizacja danych
wysoko-wymiarowych,
czyli nie tylko
trenowaniem sieci
człowiek żyje
Dziękujemy za przybycie !
2
https://i.ytimg.com/vi/HXZt-IlClhs/maxresdefault.jpg
Jak widzimy wykład
3
▸ Wizualizacja Demo
▸ Cechy wysoko-wymiarowe
▸ T-SNE
Agenda
4
Cechy wysoko-wymiarowe
Różne podejścia
5
3 Etapy
Dane
6
Cechy Wizualizacja
▸ Obrazy
▸ Audio
▸ LBP
▸ MFCC
▸ PCA
▸ T-SNE
Ekstrakcja cech
Dane
7
Cechy Wizualizacja
▸ Obrazy
▸ Audio
▸ Tekst
▸ LBP
▸ MFCC
▸ Tf-IDF
▸ PCA
▸ T-SNE
▸
8
Po co nam cechy ?
Trochę o sztucznej inteligencji
9
https://en.wikipedia.org/wiki/Waymo#/media/File:Google_driverless_car_at_intersection.gk.jpg
https://pl.wikipedia.org/wiki/Deep_Blue#/media/File:Deep_Blue.jpg
http://i.wp.pl/a/f/jpeg/27201/hal-9000-odyseja-kosmiczna-2001-kadr-robot-oko-490.jpeg
▸ 1968 - 2001: Odyseja Kosmiczna ▸ 1997 - Deep Blue ▸ 2015 - Waymo.
Trochę o sztucznej inteligencji
Paradoks Moraveca:
10
Reprezentacja danych
11
http://3.bp.blogspot.com/-VvKAXKyrsNY/U5Ngtv21IAI/AAAAAAAAFoQ/GWrfGfA2r
50/s1600/moving+in+right+direction.gif
12
13
© Urszula Gwardys
14
Po co nam cechy ?
Po co nam cechy ?
15
Po co nam cechy ?
16
Ja człowiek rozpoznaje obrazy ?
17
Ja człowiek rozpoznaje obrazy ?
18
Ja człowiek rozpoznaje obrazy ?
19
https://lionstalkscience.files.wordpress.com/2015/03/color_differences.j
pg
Niektóre cechy obrazowe
▸ Dominant Color Descriptor
▸ Local Binary Patterns
▸ Scale-Invariant Feature Transform
20
Dominant Color Descriptor
Kolor dominujący
▸ wartość (przestrzeń LUV)
▸ procent zajmowanej powierzchni
▸ wariancja
21
https://lionstalkscience.files.wordpress.com/2015/03/color_differences.j
pg
Dominant Color Descriptor
22
https://datasciencelab.wordpress.com/2013/12/12/clustering-with-k-mea
ns-in-python/
http://sipl.technion.ac.il/Info/Teaching_Projects_1-1-10_e.shtml
Local Binary Patterns
23
http://bytefish.de/blog/local_binary_patterns/
http://www.springer.com/cda/content/document/cda_downloaddocumen
t/9780857297471-c2.pdf?SGWID=0-0-45-1153741-p174122174
http://liris.cnrs.fr/Documents/Liris-5004.pdf
Local Binary Patterns
24
http://docs.opencv.org/2.4/_images/lbp_yale.jpg
Scale-Invariant Feature Transform
25
Scale-Invariant Feature Transform
26
Scale-Invariant Feature Transform
27
Niektóre cechy muzyczne
▸ Zero-Crossing Rate
▸ Short-Time Fourier Transform
▸ Mel Frequency Cepstrum Coefficient
28
Zero-Crossing Rate
29
http://www.ifs.tuwien.ac.at/~schindler/lectures/MIR_Feature_Extraction.html
Short-Time Fourier Transform
30
http://isites.harvard.edu/fs/docs/icb.topic541812.files/lec12_spr09.pdf
Short-Time Fourier Transform
31
Short-Time Fourier Transform
32
http://docs.opencv.org/2.4/_images/lbp_yale.jpg
Short-Time Fourier Transform
33
http://paulbourke.net/miscellaneous/dft/dft0.gif
Short-Time Fourier Transform
34
Mel Frequency Cepstrum Coefficient
▸ STFT
▸ Obliczanie mocy
▸ Obliczenie odpowiedzi dla filtrów
zestawu filtrów mel (zwykle 26)
▸ Obliczanie DCT dla logarytmu dla
każdego filtru
35
Mel-Frequency Cepstrum Coefficient
36
http://practicalcryptography.com/media/miscellaneous/files/10_filt_melfb
.png
https://pl.wikipedia.org/wiki/Mel_(skala)#/media/File:Mel-Hz_plot.svg
Mel-Frequency Cepstrum Coefficient
37
Wszystko ?
38
Cechy wyuczone
Czyli ty się ucz, a ja idę na piwo
39
Cechy szyte na miarę
40
Sieci Neuronowe
41
Sieci neuronowe
42
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
43
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
44
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
45
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
46
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
47
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
48
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
49
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
50
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
51
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
52
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
53
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
54
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
55
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
56
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
57
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
Sieci neuronowe
58
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
59
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
60
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Sieci neuronowe
61
http://galaxy.agh.edu.pl/~vlsi/AI/backp_t/backprop.html
Konwolucyjne sieci neuronowe
62
http://grzegorzgwardys.ml/
Filtry konwolucyjne - splot
63
https://community.arm.com/cfs-file/__key/communityserver-blogs-components-weblogfil
es/00-00-00-20-66/4786.conv.png
Filtry konwolucyjne - splot
64
Filtry konwolucyjne - splot
65
Konwolucyjne sieci neuronowe
66
https://ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets/
Konwolucyjne sieci neuronowe
67
https://image.slidesharecdn.com/bdm-aprimerondeeplearning-160919151642/95/big-data-malaysia-a-primer-on-deep-learning-23-638.jpg
Cechy na miarę - słabe strony
68
Czy możemy nauczonych
cech użyć dla innych
danych ?
https://imgflip.com/s/meme/Question-Rage-Face.jpg
AlexNet
69
Wyszukiwanie obrazów dla na innych danych
70
Rozpoznawanie gatunku muzyki
71
Word2vec
72
https://blog.acolyer.org/2016/04/21/the-amazing-power-of-word-v
ectors/
http://arxiv.org/pdf/1411.2738v3.pdf
Word2vec
73
https://www.tensorflow.org/tutorials/word2vec
Cechy ukryte w systemach rekomendacyjnych
74
5 5 4 1 1
4 4 5 00 ?
0 ? 2 5 5
Cechy ukryte w systemach rekomendacyjnych
75
użytkownicy(m)
przedmioty (n)
R
macierz ocen
=
użytkownicy(m)
cechy (r)
VT
macierz cech
przedmiotów
cechy(r)
przedmioty(n)
U
macierz cech
użytkownika
k
k
Cechy Grzegorza i Star Wars
76
~
.9
.9
.4
.5
.7
.9
.8
.7
.7
.9
5 5 4 1 1 .7 .8 .3 .8 .6 .7 .7 .9 .5 .6
T-SNE
Od intuicji do szczegółów
Metoda Gradientu Prostego
78
https://alykhantejani.github.io/images/gradient_descent_line_graph.gif
Dla regresji liniowej
79
Dygresja
80
81
https://cdn.meme.am/cache/instances/folder304/500x/63137304.jpg
PCA
82
http://weigend.com/files/teaching/stanford/2008/stanford2008.wikispaces.com/file/view/pca_example.gif
Czy PCA odpowiada na właściwe pytanie ?
83
https://skybluetrades.net/blog/posts/2011/10/30/machine-learning/test-swiss-roll.png
Stochastic Neighbour Embedding
84
yi
yj
xi
xj
Tak chcę !
85
Dywergencja Kullbacka-Leiblera
▸ Duże pij
modelowane przez małe qij
▸ Małe pij
modelowane przez duże qij
86
▸ Duże pij
modelowane przez małe qij
▸ Małe pij
modelowane przez duże qij
87
Dywergencja Kullbacka-Leiblera
SNE - wizualizacja mnist
88
http://www.uta.fi/sis/mtt/mtts1-dimensionality_reduction/drv_lecture10.pdf
SNE - wizualizacja mnist
89
http://www.uta.fi/sis/mtt/mtts1-dimensionality_reduction/drv_lecture10.pdf
A chcielibyśmy ...
90
https://indico.io/blog/wp-content/uploads/2015/08/mnist.jpg
Problem Tłumu
91
http://www.todayifoundout.com/wp-content/uploads/2014/11/crowd.jpg
Problem Tłumu
92
Skoro chcemy zachować odległość między
bliższymi punktami z wyższej przestrzeni ...
Problem Tłumu
93
Skoro chcemy zachować odległość między
bliższymi punktami z wyższej przestrzeni ...
To mniej “podobne punkty”, w niższej
przestrzeni będą od siebie bardzo daleko.
William Sealy Gosset
94
http://vignette3.wikia.nocookie.net/beer/images/9/92/Guinness.jpg/revision/latest?cb=20130322204725 https://en.wikipedia.org
t-SNE
95
Wysoki wymiar: Niski wymiar:
Interpretacja gradientu
96
D
G
F
E H
B
A
C
sprężynka
Interpretacja gradientu
97
D
G
F
E H
B
A
C
sprężynka
ściskanie/rozciąganie
http://www.artandsciencegraphics.com/wp-content/uploads/Compressing-Spring.gif
Interpretacja gradientu
98
D
G
F
E H
B
A
C
sprężynka
ściskanie/rozciąganie
Suma po wszystkim ...
A gdy dane są duże ?
99
3x
D
G
F
E H
B
A
C
▸ Dlatego algorytm Barnes-Hut
▹ 1986 w Nature
▹ O(n log n)
▹ NASA/STI Keywords:
Computational Astrophysics ...
A gdy dane są duże ?
100
3x
D
G
F
E H
B
A
C
A C DB E F G H
● Wystarczająco mały kawałek przestrzeni ?
● Wystarczająco odległy od punktu ?
t-sne - największy problem
101
http://distill.pub/2016/misread-tsne/
102
https://indico.io/blog/wp-content/uploads/2015/08/mnist.jpg
Przykłady wizualizacji
Przykłady wizualizacji
103
https://image.slidesharecdn.com/talkdatasciencemeetup-130125042944-phpapp01/95/talk-data-sciencemeetup-13-638.jpg
Przykłady wizualizacji
104
https://deeplearning4j.org/img/faces_tsne.jpg
Przykłady wizualizacji
105
http://www.frontiersin.org/files/Articles/181674/fninf-10-00009-HTML/image_m/fninf-10-00009-g008.jpg
Przykłady wizualizacji
106
http://nlp.yvespeirsman.be/images/glove-word-embeddings-crime-and-punishment.png
Przykłady wizualizacji
107
http://opensource.datacratic.com/mtlpy50/my_redditmap.png
Kodzik t-sne
108
https://www.youtube.com/watch?v=yQsOFWqpjkE
Kodzik t-sne
109
https://www.youtube.com/watch?v=yQsOFWqpjkE
O czym sobie nie powiedzieliśmy
110
https://image.slidesharecdn.com/dimensionalityreduction-140129163722-phpapp02/95/visualization-using-tsne-2-638.jpg
111
Pytania?
Kontakt:
grzegorz.gwardys@promity.pl,
d.grzywczak@ire.pw.edu.pl
grzegorzgwardys.ml
Dziękujemy!
Cz ii tt_tsne_21022017_public

Contenu connexe

Similaire à Cz ii tt_tsne_21022017_public

Shall we play a game? PL version
Shall we play a game? PL versionShall we play a game? PL version
Shall we play a game? PL versionMaciej Lasyk
 
[Quality Meetup #9] TestOps, QAOps - czy ktoś taki istnieje? - Aleksandra Kor...
[Quality Meetup #9] TestOps, QAOps - czy ktoś taki istnieje? - Aleksandra Kor...[Quality Meetup #9] TestOps, QAOps - czy ktoś taki istnieje? - Aleksandra Kor...
[Quality Meetup #9] TestOps, QAOps - czy ktoś taki istnieje? - Aleksandra Kor...Future Processing
 
Produkcja aplikacji internetowych
Produkcja aplikacji internetowychProdukcja aplikacji internetowych
Produkcja aplikacji internetowychTomasz Borowski
 
Machine learning and Big Data (lecture in Polish)
Machine learning and Big Data (lecture in Polish)Machine learning and Big Data (lecture in Polish)
Machine learning and Big Data (lecture in Polish)Michal Iwanowski
 
Praktyczne code reviews - PHPConPl
Praktyczne code reviews - PHPConPlPraktyczne code reviews - PHPConPl
Praktyczne code reviews - PHPConPlSebastian Marek
 
Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...
Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...
Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...Sotrender
 
Jak nadążyć za światem front-endu - WordPress Training Day
Jak nadążyć za światem front-endu - WordPress Training DayJak nadążyć za światem front-endu - WordPress Training Day
Jak nadążyć za światem front-endu - WordPress Training DayTomasz Dziuda
 
#MTC2017: Aplikacje "kupujemy" wzrokiem. Dlaczego motion design ratuje UX? - ...
#MTC2017: Aplikacje "kupujemy" wzrokiem. Dlaczego motion design ratuje UX? - ...#MTC2017: Aplikacje "kupujemy" wzrokiem. Dlaczego motion design ratuje UX? - ...
#MTC2017: Aplikacje "kupujemy" wzrokiem. Dlaczego motion design ratuje UX? - ...Mobile Trends
 
Jak nadążyć za światem front-endu?
Jak nadążyć za światem front-endu?Jak nadążyć za światem front-endu?
Jak nadążyć za światem front-endu?Tomasz Dziuda
 
Extjs & netzke
Extjs & netzkeExtjs & netzke
Extjs & netzkeGaldoMedia
 
Framework w architekturze SOA
Framework w architekturze SOAFramework w architekturze SOA
Framework w architekturze SOA3camp
 
Machine learning vs big data od pomysłu do produkcji - Bartłomiej Twardowsk...
Machine learning vs big data   od pomysłu do produkcji - Bartłomiej Twardowsk...Machine learning vs big data   od pomysłu do produkcji - Bartłomiej Twardowsk...
Machine learning vs big data od pomysłu do produkcji - Bartłomiej Twardowsk...Evention
 
Django od developerki po produkcję (linux)
Django od developerki po produkcję (linux)Django od developerki po produkcję (linux)
Django od developerki po produkcję (linux)Marcin Grzybowski
 
Architektura współczesnych gier video
Architektura współczesnych gier videoArchitektura współczesnych gier video
Architektura współczesnych gier videoAdam Sawicki
 
Word up warszawa 2015
Word up warszawa 2015Word up warszawa 2015
Word up warszawa 2015Tomasz Dziuda
 

Similaire à Cz ii tt_tsne_21022017_public (20)

BlackHat Analytics
BlackHat AnalyticsBlackHat Analytics
BlackHat Analytics
 
Shall we play a game? PL version
Shall we play a game? PL versionShall we play a game? PL version
Shall we play a game? PL version
 
[Quality Meetup #9] TestOps, QAOps - czy ktoś taki istnieje? - Aleksandra Kor...
[Quality Meetup #9] TestOps, QAOps - czy ktoś taki istnieje? - Aleksandra Kor...[Quality Meetup #9] TestOps, QAOps - czy ktoś taki istnieje? - Aleksandra Kor...
[Quality Meetup #9] TestOps, QAOps - czy ktoś taki istnieje? - Aleksandra Kor...
 
Produkcja aplikacji internetowych
Produkcja aplikacji internetowychProdukcja aplikacji internetowych
Produkcja aplikacji internetowych
 
Machine learning and Big Data (lecture in Polish)
Machine learning and Big Data (lecture in Polish)Machine learning and Big Data (lecture in Polish)
Machine learning and Big Data (lecture in Polish)
 
Praktyczne code reviews - PHPConPl
Praktyczne code reviews - PHPConPlPraktyczne code reviews - PHPConPl
Praktyczne code reviews - PHPConPl
 
Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...
Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...
Human-in-the-loop (HILT) machine learning i augmentacja danych, czyli jak zbu...
 
Jak nadążyć za światem front-endu - WordPress Training Day
Jak nadążyć za światem front-endu - WordPress Training DayJak nadążyć za światem front-endu - WordPress Training Day
Jak nadążyć za światem front-endu - WordPress Training Day
 
#MTC2017: Aplikacje "kupujemy" wzrokiem. Dlaczego motion design ratuje UX? - ...
#MTC2017: Aplikacje "kupujemy" wzrokiem. Dlaczego motion design ratuje UX? - ...#MTC2017: Aplikacje "kupujemy" wzrokiem. Dlaczego motion design ratuje UX? - ...
#MTC2017: Aplikacje "kupujemy" wzrokiem. Dlaczego motion design ratuje UX? - ...
 
Jak nadążyć za światem front-endu?
Jak nadążyć za światem front-endu?Jak nadążyć za światem front-endu?
Jak nadążyć za światem front-endu?
 
Extjs & netzke
Extjs & netzkeExtjs & netzke
Extjs & netzke
 
Framework w architekturze SOA
Framework w architekturze SOAFramework w architekturze SOA
Framework w architekturze SOA
 
Machine learning vs big data od pomysłu do produkcji - Bartłomiej Twardowsk...
Machine learning vs big data   od pomysłu do produkcji - Bartłomiej Twardowsk...Machine learning vs big data   od pomysłu do produkcji - Bartłomiej Twardowsk...
Machine learning vs big data od pomysłu do produkcji - Bartłomiej Twardowsk...
 
Html5 i css3
Html5 i css3Html5 i css3
Html5 i css3
 
Iron Python I Dlr
Iron Python I DlrIron Python I Dlr
Iron Python I Dlr
 
Django od developerki po produkcję (linux)
Django od developerki po produkcję (linux)Django od developerki po produkcję (linux)
Django od developerki po produkcję (linux)
 
Wstęp do profilowania aplikacji
Wstęp do profilowania aplikacjiWstęp do profilowania aplikacji
Wstęp do profilowania aplikacji
 
JavaEE + OSGi
JavaEE + OSGiJavaEE + OSGi
JavaEE + OSGi
 
Architektura współczesnych gier video
Architektura współczesnych gier videoArchitektura współczesnych gier video
Architektura współczesnych gier video
 
Word up warszawa 2015
Word up warszawa 2015Word up warszawa 2015
Word up warszawa 2015
 

Cz ii tt_tsne_21022017_public