SlideShare une entreprise Scribd logo
1  sur  9
Télécharger pour lire hors ligne
Analytics Institute
Организация исследований и
проектов анализа данных
Основная ценность анализа больших данных - повышение эффективности
принятия решений, а не технологический стек хранения данных.
эффективность
принятия
решений
объем
данных
Данные
Информация
Знания
Решения

формирование действительности




Анализ данных

существует вне действительности





Данные

отражение действительности
Методы анализа данных предоставляют собой технологический мост,
обеспечивающий принимаемым решениям поддержку актуальной
информацией, отражающей объективную действительность.
Выбор критериев
успешности
Определение
возможных решений
Слежение за
результатами
Выбор и исполнение
лучшего решения
Оценка возможных
решений
Постановка задачи
Рациональный подход к принятию решений представляет собой
повторяющийся цикл оценки и выбора альтернатив.
В решении задач анализа данных существует разработанная методология -
CRoss Industry Standard Process for Data Mining (CRISP DM).
CRISP DM согласуется с рациональным подходом к принятию решений и
описывает стандартный жизненный цикл решений.
Выбор критериев
успешности
Определение
возможных решений
Слежение за
результатами
Выбор и исполнение
лучшего решения
Оценка возможных
решений
Постановка задачи
В процессе решения важно следовать нескольким простым принципам:
Порядок

следовать плану -
не перескакивать
между пунктами
Скорость

проходить полный
круг по циклу как
можно быстрее(чаще)
Фокусировка

держать в
приоритете решение
а не методы
Воспроизводимость

сохранять результаты
каждого цикла
решения
1. Сбор данных, подготовка
инфраструктуры
2. Разведочный анализ
данных
3. Жизненный цикл решений
анализа данных
4. Улучшение решений,
сопряженные задачи
5. Презентация решения
• Данные удалось считать,

удалось построить первые графики
• Есть план по созданию первого решения в
следующие несколько часов
• Есть одно готовое решение, команда
следует плану и знает что улучшить
• Есть несколько решений, дальнейшая
работа взвешена и спланирована
• Решение готово, удовлетворяет всем
требованиям
Шпаргалки, которые могут помочь в решении хакатона:
‣Данные считываются
верно?

‣В данных нет ошибок?
‣Данных достаточно?
‣Данные актуальны?
‣Можно улучшить
результат?
‣Тестирование
корректно?
‣Учтены все решения?
‣Тип модели/решения
адекватен?
‣Корректен ли выбор
(гипер)параметров?
‣Нет ли избыточной
сложности?
‣Есть технические
трудности?
‣Данные удобны для
работы?
‣Что еще можно
вытащить из данных?
‣Как задачу обычно
решают?
‣На что в данных
смотрят?
‣Что именно найти, что
оптимизировать?
Этап: Должно быть готово к концу этапа:
Алексей Натекин
anatekin@deloitte.ru
Спасибо!

Contenu connexe

En vedette

Антон Конушин (НИУ ВШЭ)
Антон Конушин (НИУ ВШЭ)Антон Конушин (НИУ ВШЭ)
Антон Конушин (НИУ ВШЭ)Edutainme
 
Григорий Сапунов (eclass)
Григорий Сапунов (eclass)Григорий Сапунов (eclass)
Григорий Сапунов (eclass)Edutainme
 
Михаил Бурцев (DeepHackLab)
Михаил Бурцев (DeepHackLab)Михаил Бурцев (DeepHackLab)
Михаил Бурцев (DeepHackLab)Edutainme
 
Presentation introduction to six sigma
Presentation   introduction to six sigmaPresentation   introduction to six sigma
Presentation introduction to six sigmajpanchpor
 
Basic Six Sigma Presentation
Basic Six Sigma PresentationBasic Six Sigma Presentation
Basic Six Sigma Presentationvivekissar
 
Six Sigma the best ppt
Six Sigma the best pptSix Sigma the best ppt
Six Sigma the best pptRabia Sgh S
 

En vedette (7)

Антон Конушин (НИУ ВШЭ)
Антон Конушин (НИУ ВШЭ)Антон Конушин (НИУ ВШЭ)
Антон Конушин (НИУ ВШЭ)
 
Григорий Сапунов (eclass)
Григорий Сапунов (eclass)Григорий Сапунов (eclass)
Григорий Сапунов (eclass)
 
Михаил Бурцев (DeepHackLab)
Михаил Бурцев (DeepHackLab)Михаил Бурцев (DeepHackLab)
Михаил Бурцев (DeepHackLab)
 
Presentation introduction to six sigma
Presentation   introduction to six sigmaPresentation   introduction to six sigma
Presentation introduction to six sigma
 
six sigma ppt
six sigma pptsix sigma ppt
six sigma ppt
 
Basic Six Sigma Presentation
Basic Six Sigma PresentationBasic Six Sigma Presentation
Basic Six Sigma Presentation
 
Six Sigma the best ppt
Six Sigma the best pptSix Sigma the best ppt
Six Sigma the best ppt
 

Similaire à Алексей Натекин (Deloitte)

Современные методы анализа данных
Современные методы анализа данныхСовременные методы анализа данных
Современные методы анализа данныхDEVTYPE
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данныхYuri Yashkin
 
Cl shg 2016 разбор решений-бизнес секция-v2
Cl shg 2016 разбор решений-бизнес секция-v2Cl shg 2016 разбор решений-бизнес секция-v2
Cl shg 2016 разбор решений-бизнес секция-v2Changellenge >> Capital
 
Подход КРОК к построению MDM
Подход КРОК к построению MDMПодход КРОК к построению MDM
Подход КРОК к построению MDMКРОК
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхElizaveta Alekseeva
 
A/B - тесты или раздолье для ошибок
A/B - тесты или раздолье для ошибокA/B - тесты или раздолье для ошибок
A/B - тесты или раздолье для ошибокНиколай Захаров
 
Visualization of information - Talat Numonov
Visualization of information - Talat NumonovVisualization of information - Talat Numonov
Visualization of information - Talat NumonovE-Journal ICT4D
 
Data-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииData-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииAlexander Barakov
 
Система эффективной разработки госкорпорации «РОСКОСМОС»
Система эффективной разработки госкорпорации «РОСКОСМОС»Система эффективной разработки госкорпорации «РОСКОСМОС»
Система эффективной разработки госкорпорации «РОСКОСМОС»Gregory Baev
 
Руководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данныхРуководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данныхElizaveta Alekseeva
 
Управление процессами разработки ПО
Управление процессами разработки ПОУправление процессами разработки ПО
Управление процессами разработки ПОPeoplemind
 
Руководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данныхРуководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данныхYuri Yashkin
 
6 важнейших качеств платформы для анализа Больших данных
6 важнейших качеств платформы для анализа Больших данных6 важнейших качеств платформы для анализа Больших данных
6 важнейших качеств платформы для анализа Больших данныхElizaveta Alekseeva
 
3. 10 shagov k pci compliance
3. 10 shagov k pci compliance3. 10 shagov k pci compliance
3. 10 shagov k pci complianceInformzaschita
 
Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)
Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)
Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)Edward Babushkin
 
Data-Drive Product Management (Михаил Томшинский, Яндекс)
Data-Drive Product Management (Михаил Томшинский, Яндекс)Data-Drive Product Management (Михаил Томшинский, Яндекс)
Data-Drive Product Management (Михаил Томшинский, Яндекс)PCampRussia
 

Similaire à Алексей Натекин (Deloitte) (20)

Современные методы анализа данных
Современные методы анализа данныхСовременные методы анализа данных
Современные методы анализа данных
 
SPSS Modeler
SPSS ModelerSPSS Modeler
SPSS Modeler
 
Решения HPE Software для Больших данных
Решения HPE Software для Больших данныхРешения HPE Software для Больших данных
Решения HPE Software для Больших данных
 
Cl shg 2016 разбор решений-бизнес секция-v2
Cl shg 2016 разбор решений-бизнес секция-v2Cl shg 2016 разбор решений-бизнес секция-v2
Cl shg 2016 разбор решений-бизнес секция-v2
 
Подход КРОК к построению MDM
Подход КРОК к построению MDMПодход КРОК к построению MDM
Подход КРОК к построению MDM
 
Восемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данныхВосемь подводных камней на пути к внедрению аналитики Больших данных
Восемь подводных камней на пути к внедрению аналитики Больших данных
 
A/B - тесты или раздолье для ошибок
A/B - тесты или раздолье для ошибокA/B - тесты или раздолье для ошибок
A/B - тесты или раздолье для ошибок
 
Visualization of information - Talat Numonov
Visualization of information - Talat NumonovVisualization of information - Talat Numonov
Visualization of information - Talat Numonov
 
Data-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной КомпанииData-driven business: Информационная основа деятельности современной Компании
Data-driven business: Информационная основа деятельности современной Компании
 
Система эффективной разработки госкорпорации «РОСКОСМОС»
Система эффективной разработки госкорпорации «РОСКОСМОС»Система эффективной разработки госкорпорации «РОСКОСМОС»
Система эффективной разработки госкорпорации «РОСКОСМОС»
 
Руководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данныхРуководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данных
 
Байдалина472(2)
Байдалина472(2)Байдалина472(2)
Байдалина472(2)
 
Управление процессами разработки ПО
Управление процессами разработки ПОУправление процессами разработки ПО
Управление процессами разработки ПО
 
Clt2016 1st round-guide mt-code
Clt2016 1st round-guide mt-codeClt2016 1st round-guide mt-code
Clt2016 1st round-guide mt-code
 
Руководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данныхРуководство по достижению зрелости в области аналитики Больших данных
Руководство по достижению зрелости в области аналитики Больших данных
 
6 важнейших качеств платформы для анализа Больших данных
6 важнейших качеств платформы для анализа Больших данных6 важнейших качеств платформы для анализа Больших данных
6 важнейших качеств платформы для анализа Больших данных
 
3. 10 shagov k pci compliance
3. 10 shagov k pci compliance3. 10 shagov k pci compliance
3. 10 shagov k pci compliance
 
Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)
Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)
Talent Analitycs / Bigdata HR (как показать влияние HR на бизнес показатели)
 
сппр
сппрсппр
сппр
 
Data-Drive Product Management (Михаил Томшинский, Яндекс)
Data-Drive Product Management (Михаил Томшинский, Яндекс)Data-Drive Product Management (Михаил Томшинский, Яндекс)
Data-Drive Product Management (Михаил Томшинский, Яндекс)
 

Plus de Edutainme

Светлана Вачкова, директор Института системных проектов МГПУ
Светлана Вачкова, директор Института системных проектов МГПУСветлана Вачкова, директор Института системных проектов МГПУ
Светлана Вачкова, директор Института системных проектов МГПУEdutainme
 
Кирилл Баранников, заместитель директора Института системных проектов МГПУ
Кирилл Баранников, заместитель директора Института системных проектов МГПУКирилл Баранников, заместитель директора Института системных проектов МГПУ
Кирилл Баранников, заместитель директора Института системных проектов МГПУEdutainme
 
Александр Поддьяков, ММСО 2017
Александр Поддьяков, ММСО 2017Александр Поддьяков, ММСО 2017
Александр Поддьяков, ММСО 2017Edutainme
 
Наталья Чеботарь, ММСО 2017
Наталья Чеботарь, ММСО 2017Наталья Чеботарь, ММСО 2017
Наталья Чеботарь, ММСО 2017Edutainme
 
Московский центр оценки качества образования, ММСО 2017
Московский центр оценки качества образования, ММСО 2017Московский центр оценки качества образования, ММСО 2017
Московский центр оценки качества образования, ММСО 2017Edutainme
 
Любовь Егорова, ММСО 2017
Любовь Егорова, ММСО 2017Любовь Егорова, ММСО 2017
Любовь Егорова, ММСО 2017Edutainme
 
Анна Кобцева, ММСО 2017
Анна Кобцева, ММСО 2017Анна Кобцева, ММСО 2017
Анна Кобцева, ММСО 2017Edutainme
 
Марианна Лазуткина, ММСО 2017
Марианна Лазуткина, ММСО 2017Марианна Лазуткина, ММСО 2017
Марианна Лазуткина, ММСО 2017Edutainme
 
Марина Захарова, ММСО 2017
Марина Захарова, ММСО 2017Марина Захарова, ММСО 2017
Марина Захарова, ММСО 2017Edutainme
 
Ольга Денисенко, ММСО 2017
Ольга Денисенко, ММСО 2017Ольга Денисенко, ММСО 2017
Ольга Денисенко, ММСО 2017Edutainme
 
Открытое образование для университетов
Открытое образование для университетовОткрытое образование для университетов
Открытое образование для университетовEdutainme
 
Валентина Шамшович, Edcrunch2016
Валентина Шамшович, Edcrunch2016Валентина Шамшович, Edcrunch2016
Валентина Шамшович, Edcrunch2016Edutainme
 
Сергей Тимкин, Edcrunch 2016
Сергей Тимкин, Edcrunch 2016Сергей Тимкин, Edcrunch 2016
Сергей Тимкин, Edcrunch 2016Edutainme
 
Александр Михеев, Edcrunch 2016
Александр Михеев, Edcrunch 2016Александр Михеев, Edcrunch 2016
Александр Михеев, Edcrunch 2016Edutainme
 
Владимир Ицыксон, Edcrunch2016
Владимир Ицыксон, Edcrunch2016Владимир Ицыксон, Edcrunch2016
Владимир Ицыксон, Edcrunch2016Edutainme
 
Александр Волков, EdCrunch 2016
Александр Волков, EdCrunch 2016Александр Волков, EdCrunch 2016
Александр Волков, EdCrunch 2016Edutainme
 
Мета-учебник, построенный на принципе целостности
Мета-учебник, построенный на принципе целостностиМета-учебник, построенный на принципе целостности
Мета-учебник, построенный на принципе целостностиEdutainme
 
Дизайн школы: Елена Иванова, МГПУ
Дизайн школы: Елена Иванова, МГПУДизайн школы: Елена Иванова, МГПУ
Дизайн школы: Елена Иванова, МГПУEdutainme
 
Дизайн школы: Екатерина Барсукова, МАРХИ
Дизайн школы: Екатерина Барсукова, МАРХИДизайн школы: Екатерина Барсукова, МАРХИ
Дизайн школы: Екатерина Барсукова, МАРХИEdutainme
 
Дизайн школы: Надежда Фролова, Хорошевская прогимназия (Хорошкола)
Дизайн школы: Надежда Фролова,  Хорошевская прогимназия (Хорошкола)Дизайн школы: Надежда Фролова,  Хорошевская прогимназия (Хорошкола)
Дизайн школы: Надежда Фролова, Хорошевская прогимназия (Хорошкола)Edutainme
 

Plus de Edutainme (20)

Светлана Вачкова, директор Института системных проектов МГПУ
Светлана Вачкова, директор Института системных проектов МГПУСветлана Вачкова, директор Института системных проектов МГПУ
Светлана Вачкова, директор Института системных проектов МГПУ
 
Кирилл Баранников, заместитель директора Института системных проектов МГПУ
Кирилл Баранников, заместитель директора Института системных проектов МГПУКирилл Баранников, заместитель директора Института системных проектов МГПУ
Кирилл Баранников, заместитель директора Института системных проектов МГПУ
 
Александр Поддьяков, ММСО 2017
Александр Поддьяков, ММСО 2017Александр Поддьяков, ММСО 2017
Александр Поддьяков, ММСО 2017
 
Наталья Чеботарь, ММСО 2017
Наталья Чеботарь, ММСО 2017Наталья Чеботарь, ММСО 2017
Наталья Чеботарь, ММСО 2017
 
Московский центр оценки качества образования, ММСО 2017
Московский центр оценки качества образования, ММСО 2017Московский центр оценки качества образования, ММСО 2017
Московский центр оценки качества образования, ММСО 2017
 
Любовь Егорова, ММСО 2017
Любовь Егорова, ММСО 2017Любовь Егорова, ММСО 2017
Любовь Егорова, ММСО 2017
 
Анна Кобцева, ММСО 2017
Анна Кобцева, ММСО 2017Анна Кобцева, ММСО 2017
Анна Кобцева, ММСО 2017
 
Марианна Лазуткина, ММСО 2017
Марианна Лазуткина, ММСО 2017Марианна Лазуткина, ММСО 2017
Марианна Лазуткина, ММСО 2017
 
Марина Захарова, ММСО 2017
Марина Захарова, ММСО 2017Марина Захарова, ММСО 2017
Марина Захарова, ММСО 2017
 
Ольга Денисенко, ММСО 2017
Ольга Денисенко, ММСО 2017Ольга Денисенко, ММСО 2017
Ольга Денисенко, ММСО 2017
 
Открытое образование для университетов
Открытое образование для университетовОткрытое образование для университетов
Открытое образование для университетов
 
Валентина Шамшович, Edcrunch2016
Валентина Шамшович, Edcrunch2016Валентина Шамшович, Edcrunch2016
Валентина Шамшович, Edcrunch2016
 
Сергей Тимкин, Edcrunch 2016
Сергей Тимкин, Edcrunch 2016Сергей Тимкин, Edcrunch 2016
Сергей Тимкин, Edcrunch 2016
 
Александр Михеев, Edcrunch 2016
Александр Михеев, Edcrunch 2016Александр Михеев, Edcrunch 2016
Александр Михеев, Edcrunch 2016
 
Владимир Ицыксон, Edcrunch2016
Владимир Ицыксон, Edcrunch2016Владимир Ицыксон, Edcrunch2016
Владимир Ицыксон, Edcrunch2016
 
Александр Волков, EdCrunch 2016
Александр Волков, EdCrunch 2016Александр Волков, EdCrunch 2016
Александр Волков, EdCrunch 2016
 
Мета-учебник, построенный на принципе целостности
Мета-учебник, построенный на принципе целостностиМета-учебник, построенный на принципе целостности
Мета-учебник, построенный на принципе целостности
 
Дизайн школы: Елена Иванова, МГПУ
Дизайн школы: Елена Иванова, МГПУДизайн школы: Елена Иванова, МГПУ
Дизайн школы: Елена Иванова, МГПУ
 
Дизайн школы: Екатерина Барсукова, МАРХИ
Дизайн школы: Екатерина Барсукова, МАРХИДизайн школы: Екатерина Барсукова, МАРХИ
Дизайн школы: Екатерина Барсукова, МАРХИ
 
Дизайн школы: Надежда Фролова, Хорошевская прогимназия (Хорошкола)
Дизайн школы: Надежда Фролова,  Хорошевская прогимназия (Хорошкола)Дизайн школы: Надежда Фролова,  Хорошевская прогимназия (Хорошкола)
Дизайн школы: Надежда Фролова, Хорошевская прогимназия (Хорошкола)
 

Алексей Натекин (Deloitte)

  • 1. Analytics Institute Организация исследований и проектов анализа данных
  • 2. Основная ценность анализа больших данных - повышение эффективности принятия решений, а не технологический стек хранения данных. эффективность принятия решений объем данных
  • 3. Данные Информация Знания Решения
 формирование действительности 
 
 Анализ данных
 существует вне действительности
 
 
 Данные
 отражение действительности Методы анализа данных предоставляют собой технологический мост, обеспечивающий принимаемым решениям поддержку актуальной информацией, отражающей объективную действительность.
  • 4. Выбор критериев успешности Определение возможных решений Слежение за результатами Выбор и исполнение лучшего решения Оценка возможных решений Постановка задачи Рациональный подход к принятию решений представляет собой повторяющийся цикл оценки и выбора альтернатив.
  • 5. В решении задач анализа данных существует разработанная методология - CRoss Industry Standard Process for Data Mining (CRISP DM).
  • 6. CRISP DM согласуется с рациональным подходом к принятию решений и описывает стандартный жизненный цикл решений. Выбор критериев успешности Определение возможных решений Слежение за результатами Выбор и исполнение лучшего решения Оценка возможных решений Постановка задачи
  • 7. В процессе решения важно следовать нескольким простым принципам: Порядок
 следовать плану - не перескакивать между пунктами Скорость
 проходить полный круг по циклу как можно быстрее(чаще) Фокусировка
 держать в приоритете решение а не методы Воспроизводимость
 сохранять результаты каждого цикла решения
  • 8. 1. Сбор данных, подготовка инфраструктуры 2. Разведочный анализ данных 3. Жизненный цикл решений анализа данных 4. Улучшение решений, сопряженные задачи 5. Презентация решения • Данные удалось считать,
 удалось построить первые графики • Есть план по созданию первого решения в следующие несколько часов • Есть одно готовое решение, команда следует плану и знает что улучшить • Есть несколько решений, дальнейшая работа взвешена и спланирована • Решение готово, удовлетворяет всем требованиям Шпаргалки, которые могут помочь в решении хакатона: ‣Данные считываются верно?
 ‣В данных нет ошибок? ‣Данных достаточно? ‣Данные актуальны? ‣Можно улучшить результат? ‣Тестирование корректно? ‣Учтены все решения? ‣Тип модели/решения адекватен? ‣Корректен ли выбор (гипер)параметров? ‣Нет ли избыточной сложности? ‣Есть технические трудности? ‣Данные удобны для работы? ‣Что еще можно вытащить из данных? ‣Как задачу обычно решают? ‣На что в данных смотрят? ‣Что именно найти, что оптимизировать? Этап: Должно быть готово к концу этапа: