Роман Иманкулов, компания Doist.io.
Доклад об анализе данных и посвящен преимущественно тем, кто хочет попробовать, но не знает с чего начать. О том, кому это вообще надо, где брать данные, какие инструменты есть в распоряжении начинающего python-аналитика и какую пользу для себя из всего можно извлечь на старте.
Найти видео презентации можно здесь: http://habrahabr.ru/company/wargaming/
1. Python для анализа данных
Для тех, кто хочет попробовать,
но не знает, с чего начать
Роман Иманкулов / @rdotpy
Minsk Python Meetup, январь 2014
2. Python для анализа данных
Data Science
●
Программирование.
●
Математическая статистика.
●
Прикладная область
3. Python для анализа данных
Data Scientist – человек, который
разбирается в статистике лучше любого
программиста, и который разбирается в
создании программ лучше любого
статистика.
Josh Wills, Director of Data Science at Cloudera
4. Python для анализа данных
Data Scientist – человек, который
разбирается в статистике хуже любого
статистика, и который разбирается в
создании программ хуже любого
программиста.
Will Cukierski, Data Scientist at Kaggle
5. Python для анализа данных
Зачем?
●
Optimization at the Obama campaign: a/b
testing.
Как заработать $690 млн за 20 месяцев и
увеличить конверсию более чем вдвое
http://kylerush.net/blog/optimization-at-the-obama-campaign-ab-testing/
6. Python для анализа данных
Зачем?
●
Как я покупал квартиру
Как, работая в Wargaming, и используя R и
линейные регрессии, за полдня увеличить
свою квартиру на 20%
http://habrahabr.ru/post/148782/
7. Python для анализа данных
Зачем?
●
Математик взломал сайт знакомств и
нашел девушку своей мечты
http://habrahabr.ru/post/210198/
10. Экосистема Python
scipy
●
Функции для работы с векторными данными
numpy
–
сluster: кластерный анализ
–
fftpack: преобразование Фурье
–
interpolate: интерполяция данных
–
signal: обработка сигналов ...