SlideShare une entreprise Scribd logo
1  sur  18
Télécharger pour lire hors ligne
Python для анализа данных

Для тех, кто хочет попробовать,
но не знает, с чего начать
Роман Иманкулов / @rdotpy
Minsk Python Meetup, январь 2014
Python для анализа данных
Data Science

●

Программирование.

●

Математическая статистика.

●

Прикладная область
Python для анализа данных
Data Scientist – человек, который
разбирается в статистике лучше любого
программиста, и который разбирается в
создании программ лучше любого
статистика.
Josh Wills, Director of Data Science at Cloudera
Python для анализа данных
Data Scientist – человек, который
разбирается в статистике хуже любого
статистика, и который разбирается в
создании программ хуже любого
программиста.
Will Cukierski, Data Scientist at Kaggle
Python для анализа данных
Зачем?
●

Optimization at the Obama campaign: a/b
testing.
Как заработать $690 млн за 20 месяцев и
увеличить конверсию более чем вдвое
http://kylerush.net/blog/optimization-at-the-obama-campaign-ab-testing/
Python для анализа данных
Зачем?
●

Как я покупал квартиру
Как, работая в Wargaming, и используя R и
линейные регрессии, за полдня увеличить
свою квартиру на 20%
http://habrahabr.ru/post/148782/
Python для анализа данных
Зачем?
●

Математик взломал сайт знакомств и
нашел девушку своей мечты
http://habrahabr.ru/post/210198/
Экосистема Python для анализа данных
Экосистема Python
numpy
●

●
●

объект ndarray для быстрой работы с
массивами
векторные операции для работы ними
случайные величины с различными
распределениями
Экосистема Python
scipy
●

Функции для работы с векторными данными
numpy
–

сluster: кластерный анализ

–

fftpack: преобразование Фурье

–

interpolate: интерполяция данных

–

signal: обработка сигналов ...
Экосистема Python
matplotlib и matplotlib.pyplot
Визуализация данных
Экосистема Python
pandas
pandas.DataFrame – удобный объект для
работы с табличными данными и
визуализации их.
Экосистема Python
Scikit-learn
●

Supervised learning (обучение с учителем):
–

●

линейные регрессии, классификация KNN, support vector
machines, деревья решений

Unsupervised learning (обучение без учителя):
–

Кластеризация

●

Кросс-валидация

●

Препроцессинг данных и куча всего еще
Экосистема Python

IPython и IPython Notebook
Куда двигаться дальше?
Куда двигаться дальше
Coursera: Data Analysis
Jeff Leek
https://www.coursera.org/course/dataanalysis
Куда двигаться дальше
Coursera: Machine Learning
Andrew Ng
https://www.coursera.org/course/ml
Куда двигаться дальше
Kaggle
http://kaggle.com

Contenu connexe

En vedette

Полный цикл разработки на Python + Django
Полный цикл разработки на Python + DjangoПолный цикл разработки на Python + Django
Полный цикл разработки на Python + Django
Azamat Tokhtaev
 
РОССИЯ 21 Века: Концепция Глобального Лидерства: Умная Россия: Smart Russia™...
РОССИЯ 21 Века: Концепция Глобального Лидерства: Умная Россия:  Smart Russia™...РОССИЯ 21 Века: Концепция Глобального Лидерства: Умная Россия:  Smart Russia™...
РОССИЯ 21 Века: Концепция Глобального Лидерства: Умная Россия: Smart Russia™...
Azamat Abdoullaev
 

En vedette (9)

Доклад АКТО-2012 Душкин, Смирнова
Доклад АКТО-2012 Душкин, СмирноваДоклад АКТО-2012 Душкин, Смирнова
Доклад АКТО-2012 Душкин, Смирнова
 
Полный цикл разработки на Python + Django
Полный цикл разработки на Python + DjangoПолный цикл разработки на Python + Django
Полный цикл разработки на Python + Django
 
Dictionary в Python. По мотивам Objects/dictnotes.txt
Dictionary в Python. По мотивам Objects/dictnotes.txtDictionary в Python. По мотивам Objects/dictnotes.txt
Dictionary в Python. По мотивам Objects/dictnotes.txt
 
Все самые важные команды SQL за 60 минут
Все самые важные команды SQL за 60 минутВсе самые важные команды SQL за 60 минут
Все самые важные команды SQL за 60 минут
 
PyQGIS presentation.
PyQGIS  presentation.PyQGIS  presentation.
PyQGIS presentation.
 
NumPy/SciPy Statistics
NumPy/SciPy StatisticsNumPy/SciPy Statistics
NumPy/SciPy Statistics
 
Введение в Python и Django
Введение в Python и DjangoВведение в Python и Django
Введение в Python и Django
 
РОССИЯ 21 Века: Концепция Глобального Лидерства: Умная Россия: Smart Russia™...
РОССИЯ 21 Века: Концепция Глобального Лидерства: Умная Россия:  Smart Russia™...РОССИЯ 21 Века: Концепция Глобального Лидерства: Умная Россия:  Smart Russia™...
РОССИЯ 21 Века: Концепция Глобального Лидерства: Умная Россия: Smart Russia™...
 
HUMAN ERROR
HUMAN ERRORHUMAN ERROR
HUMAN ERROR
 

Similaire à Python для анализа данных

Визуализация отчетов с помощью Data Studio и Power BI
Визуализация отчетов с помощью Data Studio и Power BIВизуализация отчетов с помощью Data Studio и Power BI
Визуализация отчетов с помощью Data Studio и Power BI
Маркетинг-аналитика с OWOX BI
 
Как настроить систему сквозной аналитики
Как настроить систему сквозной аналитикиКак настроить систему сквозной аналитики
Как настроить систему сквозной аналитики
Маркетинг-аналитика с OWOX BI
 
Сравнение инструментов для построения отчетов
Сравнение инструментов для построения отчетовСравнение инструментов для построения отчетов
Сравнение инструментов для построения отчетов
Маркетинг-аналитика с OWOX BI
 
Продвижение порталов и инфосайтов. Дмитрий Шахов
Продвижение порталов и инфосайтов. Дмитрий ШаховПродвижение порталов и инфосайтов. Дмитрий Шахов
Продвижение порталов и инфосайтов. Дмитрий Шахов
Дмитрий Шахов
 
Инновационные средства управления дизайн-студией
Инновационные средства управления дизайн-студиейИнновационные средства управления дизайн-студией
Инновационные средства управления дизайн-студией
Natalia Sakhnova
 
Grammarly Test Club#2. Выступление Василия Кривоноса (VostokVenutes): "Тестир...
Grammarly Test Club#2. Выступление Василия Кривоноса (VostokVenutes): "Тестир...Grammarly Test Club#2. Выступление Василия Кривоноса (VostokVenutes): "Тестир...
Grammarly Test Club#2. Выступление Василия Кривоноса (VostokVenutes): "Тестир...
GTestClub
 

Similaire à Python для анализа данных (20)

Разработка мобильного приложения. Мобильный маркетинг.
Разработка мобильного приложения. Мобильный маркетинг. Разработка мобильного приложения. Мобильный маркетинг.
Разработка мобильного приложения. Мобильный маркетинг.
 
Визуализация отчетов с помощью Data Studio и Power BI
Визуализация отчетов с помощью Data Studio и Power BIВизуализация отчетов с помощью Data Studio и Power BI
Визуализация отчетов с помощью Data Studio и Power BI
 
Предсказание вероятности конверсии на данных систем аналитики
Предсказание вероятности конверсии на данных систем аналитикиПредсказание вероятности конверсии на данных систем аналитики
Предсказание вероятности конверсии на данных систем аналитики
 
Как автоматизировать тестирование метрик на сайте
Как автоматизировать тестирование метрик на сайтеКак автоматизировать тестирование метрик на сайте
Как автоматизировать тестирование метрик на сайте
 
Путь дата аналитика
Путь дата аналитикаПуть дата аналитика
Путь дата аналитика
 
Как настроить систему сквозной аналитики
Как настроить систему сквозной аналитикиКак настроить систему сквозной аналитики
Как настроить систему сквозной аналитики
 
Сравнение инструментов для построения отчетов
Сравнение инструментов для построения отчетовСравнение инструментов для построения отчетов
Сравнение инструментов для построения отчетов
 
DV / Как Rocket замеряет результаты видеокампаний на TV и в Digital?
DV / Как Rocket замеряет результаты видеокампаний на TV и в Digital?DV / Как Rocket замеряет результаты видеокампаний на TV и в Digital?
DV / Как Rocket замеряет результаты видеокампаний на TV и в Digital?
 
Продвижение порталов и инфосайтов. Дмитрий Шахов
Продвижение порталов и инфосайтов. Дмитрий ШаховПродвижение порталов и инфосайтов. Дмитрий Шахов
Продвижение порталов и инфосайтов. Дмитрий Шахов
 
Андрей Осипов. Как PPC-специалисту полюбить Google Sheets и получить взаимность
Андрей Осипов. Как PPC-специалисту полюбить Google Sheets и получить взаимностьАндрей Осипов. Как PPC-специалисту полюбить Google Sheets и получить взаимность
Андрей Осипов. Как PPC-специалисту полюбить Google Sheets и получить взаимность
 
BigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнесаBigData в онлайн-маркетинге для малого и среднего бизнеса
BigData в онлайн-маркетинге для малого и среднего бизнеса
 
Чем Python плох для стартапа?
Чем Python плох для стартапа?Чем Python плох для стартапа?
Чем Python плох для стартапа?
 
Как запустить рекламу будущего Александр Шестаков (Руководитель отдела по раб...
Как запустить рекламу будущего Александр Шестаков (Руководитель отдела по раб...Как запустить рекламу будущего Александр Шестаков (Руководитель отдела по раб...
Как запустить рекламу будущего Александр Шестаков (Руководитель отдела по раб...
 
Александр Шестаков и Дмитрий Буров, Sape и Likeberi: "Bigdata"
Александр Шестаков и Дмитрий Буров, Sape и Likeberi: "Bigdata"Александр Шестаков и Дмитрий Буров, Sape и Likeberi: "Bigdata"
Александр Шестаков и Дмитрий Буров, Sape и Likeberi: "Bigdata"
 
Как избежать ошибок, которые приводят к неточности маркетинговых данных
Как избежать ошибок, которые приводят к неточности маркетинговых данныхКак избежать ошибок, которые приводят к неточности маркетинговых данных
Как избежать ошибок, которые приводят к неточности маркетинговых данных
 
Дмитрий Тарахно: «Почему без веб-аналитики не обойтись при продвижении бренда...
Дмитрий Тарахно: «Почему без веб-аналитики не обойтись при продвижении бренда...Дмитрий Тарахно: «Почему без веб-аналитики не обойтись при продвижении бренда...
Дмитрий Тарахно: «Почему без веб-аналитики не обойтись при продвижении бренда...
 
Инновационные средства управления дизайн-студией
Инновационные средства управления дизайн-студиейИнновационные средства управления дизайн-студией
Инновационные средства управления дизайн-студией
 
Как привлечь лидов с помощью бесплатного проекта: кейс Netpeak
Как привлечь лидов с помощью бесплатного проекта: кейс NetpeakКак привлечь лидов с помощью бесплатного проекта: кейс Netpeak
Как привлечь лидов с помощью бесплатного проекта: кейс Netpeak
 
Проект "Интеллектуальный помощник руководителя"
Проект "Интеллектуальный помощник руководителя"Проект "Интеллектуальный помощник руководителя"
Проект "Интеллектуальный помощник руководителя"
 
Grammarly Test Club#2. Выступление Василия Кривоноса (VostokVenutes): "Тестир...
Grammarly Test Club#2. Выступление Василия Кривоноса (VostokVenutes): "Тестир...Grammarly Test Club#2. Выступление Василия Кривоноса (VostokVenutes): "Тестир...
Grammarly Test Club#2. Выступление Василия Кривоноса (VostokVenutes): "Тестир...
 

Plus de Python Meetup

S.O.L.I.D. - Павел Кохан, Python Meetup 26.09.2014
S.O.L.I.D. - Павел Кохан, Python Meetup 26.09.2014S.O.L.I.D. - Павел Кохан, Python Meetup 26.09.2014
S.O.L.I.D. - Павел Кохан, Python Meetup 26.09.2014
Python Meetup
 
Максим Щепелин. "Unittesting. Как?"
Максим Щепелин. "Unittesting. Как?"Максим Щепелин. "Unittesting. Как?"
Максим Щепелин. "Unittesting. Как?"
Python Meetup
 

Plus de Python Meetup (20)

Python&Printer / Андрей Пучко / penta.by
Python&Printer / Андрей Пучко / penta.byPython&Printer / Андрей Пучко / penta.by
Python&Printer / Андрей Пучко / penta.by
 
Почему я пишу хороший код, но его никто не ценит, кроме моей мамы / Павел Меш...
Почему я пишу хороший код, но его никто не ценит, кроме моей мамы / Павел Меш...Почему я пишу хороший код, но его никто не ценит, кроме моей мамы / Павел Меш...
Почему я пишу хороший код, но его никто не ценит, кроме моей мамы / Павел Меш...
 
Про асинхронность / Максим Щепелин / Web Developer Wargaming
Про асинхронность / Максим Щепелин / Web Developer WargamingПро асинхронность / Максим Щепелин / Web Developer Wargaming
Про асинхронность / Максим Щепелин / Web Developer Wargaming
 
S.O.L.I.D. - Павел Кохан, Python Meetup 26.09.2014
S.O.L.I.D. - Павел Кохан, Python Meetup 26.09.2014S.O.L.I.D. - Павел Кохан, Python Meetup 26.09.2014
S.O.L.I.D. - Павел Кохан, Python Meetup 26.09.2014
 
Быстрые конструкции в Python - Олег Шидловский, Python Meetup 26.09.2014
Быстрые конструкции в Python - Олег Шидловский, Python Meetup 26.09.2014Быстрые конструкции в Python - Олег Шидловский, Python Meetup 26.09.2014
Быстрые конструкции в Python - Олег Шидловский, Python Meetup 26.09.2014
 
SWIG — cоздание мультиязыковых интерфейсов для C/C++ библиотек
SWIG — cоздание мультиязыковых интерфейсов для C/C++ библиотекSWIG — cоздание мультиязыковых интерфейсов для C/C++ библиотек
SWIG — cоздание мультиязыковых интерфейсов для C/C++ библиотек
 
Wargaming: тыл - фронту!
Wargaming: тыл - фронту!Wargaming: тыл - фронту!
Wargaming: тыл - фронту!
 
Язык программирования GO
Язык программирования GOЯзык программирования GO
Язык программирования GO
 
Максим Щепелин. "Unittesting. Как?"
Максим Щепелин. "Unittesting. Как?"Максим Щепелин. "Unittesting. Как?"
Максим Щепелин. "Unittesting. Как?"
 
Redis. Как мы боролись со сложностью
Redis. Как мы боролись со сложностьюRedis. Как мы боролись со сложностью
Redis. Как мы боролись со сложностью
 
Обзор фреймворка Twisted
Обзор фреймворка TwistedОбзор фреймворка Twisted
Обзор фреймворка Twisted
 
Обзор способов написания конкурентных программ в питоне
Обзор способов написания конкурентных программ в питоне Обзор способов написания конкурентных программ в питоне
Обзор способов написания конкурентных программ в питоне
 
Pebble
PebblePebble
Pebble
 
Очередной скучный доклад про логгирование
Очередной скучный доклад про логгированиеОчередной скучный доклад про логгирование
Очередной скучный доклад про логгирование
 
Асинхронное распределенное выполнение задач. Stdlib, Celery, RQ и собственные...
Асинхронное распределенное выполнение задач. Stdlib, Celery, RQ и собственные...Асинхронное распределенное выполнение задач. Stdlib, Celery, RQ и собственные...
Асинхронное распределенное выполнение задач. Stdlib, Celery, RQ и собственные...
 
Использование gevent для эмуляции высокой нагрузки
Использование gevent для эмуляции высокой нагрузкиИспользование gevent для эмуляции высокой нагрузки
Использование gevent для эмуляции высокой нагрузки
 
Введение в GIL и новый GIL
Введение в GIL и новый GILВведение в GIL и новый GIL
Введение в GIL и новый GIL
 
Недостатки Python
Недостатки PythonНедостатки Python
Недостатки Python
 
Социальный игровой сервер на Python: от первого коммита до продакшена
Социальный игровой сервер на Python: от первого коммита до продакшенаСоциальный игровой сервер на Python: от первого коммита до продакшена
Социальный игровой сервер на Python: от первого коммита до продакшена
 
Портируем на Python 3
Портируем на Python 3Портируем на Python 3
Портируем на Python 3
 

Python для анализа данных