SlideShare une entreprise Scribd logo
1  sur  28
Télécharger pour lire hors ligne
Анализ данных:
Data Science
и Data Engineering
Ermakov Petr @ HeadHunter
GeekWeekConf 2015 @ 22.11.2015
http://bit.ly/data_gwc2015
О себе
• HeadHunter, Старший разработчик
• МГТУ им Баумана, Лектор
• https://ru.linkedin.com/in/
ermakovpetr
• https://www.facebook.com/
ermakovpetr
План на лекцию
• Услышим много buzzword’ов
• Увидим кучу разных графиков
• Узнаем как обстоят дела с работой для data
scientist’ов
Апрель 2013 года, delphianalytics.net
Кто такие data scientist’ы?
https://twitter.com/josh_wills/status/198093512149958656
Кто такие data scientist’ы?
http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram
Кто такие data scientist’ы?
http://www.scoop.it/t/what-i-really-do/p/4021709708/2014/05/21/data-scientist
Сколько нужно
data scientist’ов?
Сколько нужно
data scientist’ов?
Сколько нужно
data scientist’ов?
Сколько нужно
data scientist’ов?
http://xkcd.ru/605/
На чем пишут
data scientist’ы?
Какие инструменты используют
data scientist’ы?
Сколько зарабатывают
data scientist’ы?
Как стать data scientist’ом?
http://nirvacana.com/thoughts/becoming-a-data-scientist/
Где готовят
data scientist’ов?
• МФТИ
• ВШЭ
• МГУ
Очные курсы
• Бесплатные
• ШАД: https://yandexdataschool.ru
• ПЗАД: http://www.machinelearning.ru/wiki/index.php?
title=Спецкурс_«Прикладные_задачи_анализа_данных»
• Платные
• New Professions Lab: http://newprolab.com/bigdata/
• Школа данных “Билайн”: http://bigdata.beeline.digital
• MLClass: http://dscourse.mlclass.ru
MOOC
• Mining Massive Datasets https://www.coursera.org/course/
mmds
• Practical Machine Learning https://www.coursera.org/course/
predmachlearn
• Data Analysis and Statistical Inference https://
www.coursera.org/course/statistics
• Core Concepts in Data Analysis https://www.coursera.org/
course/datan
• Statistics: Making Sense of Data https://www.coursera.org/
course/introstats
MOOC
• Introduction to Data Science https://www.coursera.org/course/
datasci
• Natural Language Processing https://www.coursera.org/course/
nlangp
• Neural Networks for Machine Learning https://
www.coursera.org/course/neuralnets
• Machine Learning https://www.coursera.org/course/
machlearning
• Machine Learning https://www.coursera.org/learn/machine-
learning
Meetups
• http://www.meetup.com/Moscow-Data-Science/
• http://www.meetup.com/Moscow-Data-Fest/
• http://www.meetup.com/Moscow-Independent-Data-Science-Meetup/
• https://www.facebook.com/groups/1413405125598651/
• https://www.facebook.com/groups/1505369016451458/
Data Engineer
http://blog.udacity.com/2014/12/data-analyst-vs-data-scientist-vs-data-engineer.html
Data Engineer
Анализ данных кликом
мыши
• Excel
• SAS
• SPSS
• Azure ML
Демонстрация
HeadHunter
• HeadHunter – это интернет-компания
• … а не рекрутер
• Высокие нагрузки:
• ~2k rps
• 1 минута простоя затронет 30k пользователей
Карьерные возможности
HeadHunter
• Java: Hibernate, Spring, Guice, Jersey
• http://hh.ru/vacancy/14729102
• Frontend: HTML, JS, CSS, XSL
• http://hh.ru/vacancy/13987888
• IOS
• http://hh.ru/vacancy/14309333
• Data Scientist: Python, Machine Learning
• http://hh.ru/vacancy/14310288
• Автоматизация тестирования: Java,
Selenium:
• http://hh.ru/vacancy/14309756
• Системный администратор Linux
• http://hh.ru/vacancy/13886018
• Свежие вакансии: http://hh.ru/employer/1455
Школа программистов
HeadHunter
• http://school.hh.ru
• Java, Python, SQL, Networking, Frontend, Git, …
• заканчивается 6 набор
• Набор каждую осень, подписывайтесь на сайте
Спасибо за внимание
До новых встреч
http://bit.ly/data_gwc2015

Contenu connexe

Similaire à Анализ данных: Data Science и Data Engineering @ GeekWeekConf 2015

Opendataschool datavis
Opendataschool datavisOpendataschool datavis
Opendataschool datavisIvan Begtin
 
Большому аналитику - большие данные
Большому аналитику - большие данныеБольшому аналитику - большие данные
Большому аналитику - большие данныеSQALab
 
Дата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контентаДата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контентаMax Kornev
 
How to become a Data Scientist
How to become a Data Scientist How to become a Data Scientist
How to become a Data Scientist Irina Radchenko
 
Opendata practice for Global Editors Hackathon
Opendata practice for Global Editors HackathonOpendata practice for Global Editors Hackathon
Opendata practice for Global Editors HackathonIvan Begtin
 
Как обучать работе с открытыми данными?
Как обучать работе с открытыми данными?Как обучать работе с открытыми данными?
Как обучать работе с открытыми данными?Irina Radchenko
 
Обработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данныхОбработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данныхIrina Radchenko
 
Data journalism 2013
Data journalism 2013Data journalism 2013
Data journalism 2013Gleb K
 
Онлайновые методы проверки источников и контента
Онлайновые методы проверки источников и контентаОнлайновые методы проверки источников и контента
Онлайновые методы проверки источников и контентаMax Kornev
 
Современное программное обеспечение в работе психолога
Современное программное обеспечение в работе психологаСовременное программное обеспечение в работе психолога
Современное программное обеспечение в работе психологаKyrylo Zakharov
 
Журналистика данных 101
Журналистика данных 101Журналистика данных 101
Журналистика данных 101Krystsina Shveda
 
Rising of Citizen Data Science
Rising of Citizen Data ScienceRising of Citizen Data Science
Rising of Citizen Data ScienceIrina Radchenko
 
Восхождение Гражданской науки о данных
Восхождение Гражданской науки о данныхВосхождение Гражданской науки о данных
Восхождение Гражданской науки о данныхCEE-SEC(R)
 
!Predictive analyticbasics part1
!Predictive analyticbasics part1!Predictive analyticbasics part1
!Predictive analyticbasics part1Vladimir Krylov
 
Журналистика данных (Data Journalism)
Журналистика данных (Data Journalism)Журналистика данных (Data Journalism)
Журналистика данных (Data Journalism)Irina Radchenko
 
Data management syllabus
Data management syllabusData management syllabus
Data management syllabusIrina Radchenko
 
Base1. Entry 6
Base1. Entry 6Base1. Entry 6
Base1. Entry 6BASE
 
Introduction to Open Data Data Journalism
Introduction to Open Data Data JournalismIntroduction to Open Data Data Journalism
Introduction to Open Data Data JournalismIrina Radchenko
 
10 основных метрик для анализа вашего сайта - 1.12.2014
10 основных метрик для анализа вашего сайта - 1.12.201410 основных метрик для анализа вашего сайта - 1.12.2014
10 основных метрик для анализа вашего сайта - 1.12.2014O K
 
ИПК_Социология и метрика интернет сми
ИПК_Социология и метрика интернет смиИПК_Социология и метрика интернет сми
ИПК_Социология и метрика интернет смиMax Kornev
 

Similaire à Анализ данных: Data Science и Data Engineering @ GeekWeekConf 2015 (20)

Opendataschool datavis
Opendataschool datavisOpendataschool datavis
Opendataschool datavis
 
Большому аналитику - большие данные
Большому аналитику - большие данныеБольшому аналитику - большие данные
Большому аналитику - большие данные
 
Дата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контентаДата-журналистика. Визуализация контента
Дата-журналистика. Визуализация контента
 
How to become a Data Scientist
How to become a Data Scientist How to become a Data Scientist
How to become a Data Scientist
 
Opendata practice for Global Editors Hackathon
Opendata practice for Global Editors HackathonOpendata practice for Global Editors Hackathon
Opendata practice for Global Editors Hackathon
 
Как обучать работе с открытыми данными?
Как обучать работе с открытыми данными?Как обучать работе с открытыми данными?
Как обучать работе с открытыми данными?
 
Обработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данныхОбработка данных для построения цифровой истории в журналистике данных
Обработка данных для построения цифровой истории в журналистике данных
 
Data journalism 2013
Data journalism 2013Data journalism 2013
Data journalism 2013
 
Онлайновые методы проверки источников и контента
Онлайновые методы проверки источников и контентаОнлайновые методы проверки источников и контента
Онлайновые методы проверки источников и контента
 
Современное программное обеспечение в работе психолога
Современное программное обеспечение в работе психологаСовременное программное обеспечение в работе психолога
Современное программное обеспечение в работе психолога
 
Журналистика данных 101
Журналистика данных 101Журналистика данных 101
Журналистика данных 101
 
Rising of Citizen Data Science
Rising of Citizen Data ScienceRising of Citizen Data Science
Rising of Citizen Data Science
 
Восхождение Гражданской науки о данных
Восхождение Гражданской науки о данныхВосхождение Гражданской науки о данных
Восхождение Гражданской науки о данных
 
!Predictive analyticbasics part1
!Predictive analyticbasics part1!Predictive analyticbasics part1
!Predictive analyticbasics part1
 
Журналистика данных (Data Journalism)
Журналистика данных (Data Journalism)Журналистика данных (Data Journalism)
Журналистика данных (Data Journalism)
 
Data management syllabus
Data management syllabusData management syllabus
Data management syllabus
 
Base1. Entry 6
Base1. Entry 6Base1. Entry 6
Base1. Entry 6
 
Introduction to Open Data Data Journalism
Introduction to Open Data Data JournalismIntroduction to Open Data Data Journalism
Introduction to Open Data Data Journalism
 
10 основных метрик для анализа вашего сайта - 1.12.2014
10 основных метрик для анализа вашего сайта - 1.12.201410 основных метрик для анализа вашего сайта - 1.12.2014
10 основных метрик для анализа вашего сайта - 1.12.2014
 
ИПК_Социология и метрика интернет сми
ИПК_Социология и метрика интернет смиИПК_Социология и метрика интернет сми
ИПК_Социология и метрика интернет сми
 

Анализ данных: Data Science и Data Engineering @ GeekWeekConf 2015