Катерина Пугачева, специалист по связям с общественностью ARTW на Specia Conf: контент-маркетинг, 29 марта 2016 года.
Зачем журналистика данных бизнесу.
Форматы, инструменты и источники данных.
Анализ данных.
Катерина Пугачева, специалист по связям с общественностью ARTW на Specia Conf: контент-маркетинг, 29 марта 2016 года.
Зачем журналистика данных бизнесу.
Форматы, инструменты и источники данных.
Анализ данных.
Лекция 1. Введение в Big Data и MapReduceTechnopark
Техносфера Mail.ru Group, МГУ им. М.В. Ломоносова.
Курс "Методы распределенной обработки больших объемов данных в Hadoop"
Видео лекции курса https://www.youtube.com/playlist?list=PLrCZzMib1e9rPxMIgPri9YnOpvyDAL9HD
Это моя презентация для воркшопа по основам журналистики данных на митапе Hacks/Hackers Minsk #2. В презентации - примеры лучших мира сего, основные шаги, и ссылки для дальнейшего обучения.
This is my presentation at the Data Journalism 101 workshop at Hacks/Hackers Minsk #2. The presentations contains examples of the best, as well as explains key steps in Data Journalism.
Big Data - что это и с чем его "едят") Откуда взялся термин Big Data, какое содержание он в себе несет, и, есть ли будущее у тренда Big Data. Изучаем...
Семинар 24-25 апреля 2014 г. «R + TABLEAU. ПРОГНОЗИRОВАНИЕ И BIG DATA АНАЛИЗ»АНАЛИТИКА ПЛЮС
Публикуем небольшую часть раздаточных материалов нашего семинара «R + TABLEAU. ПРОГНОЗИRОВАНИЕ И BIG DATA АНАЛИЗ», который прошел 24-25 апреля 2014 г. в Москве. Подробнее о семинаре, отзывы участников семинара см. здесь: http://analytikaplus.ru/?page_id=2122
SECON'2016. Бартунов Олег, Карьера в Open SourceSECON
Я расскажу про то, как устроен современный Open Source на примере проекта PostgreSQL и про те возможности, которые дает Open Source разработчику, в частности, в реализации себя как творческой личности и карьерного роста, а также достижения свободы и независимости. Open Source в условиях цифрового равенства позволяет разработчику жить и работать в привычных условиях без обязательного перемещения в неудобный для жизни мегаполис, и при этом быть членом большого международного сообщества, принимать участие в его жизни и влиять на развитие проекта.
Низкомолекулярное проектирование: структурированные данные и UXLara Simonova
Подход к исследованию предметной области, созданию её модели данных и описанию информационных сущностей, образующих продукт. Методы и практическая польза для проекта.
Доклад в рамках World Information Architecture Day 2017 в Санкт-Петербурге
Автор: Лара Симонова — информационный архитектор в Collectrium, the Christie’s company; IA и ко-фаундер channelkit.com
Платформа и решения НРЕ для больших данныхAndrey Karpov
Интернет вещей
сеть физических объектов, содержащих
встроенные технологии, позволяющие
распознавать внешние воздействия или
внутренние состояния объектов, а также
взаимодействовать с другими объектами.
СУБД (cистема управления базами данных)
совокупность программных и
лингвистических средств общего или
специального назначения, обеспечивающих
управление созданием и использованием баз
данных.
Структурированные данные
данные, имеющие строгую повторяющуюся
структуру, что дает возможность хранить и
обрабатывать их с использованием СУБД.
Презентация "Аналитик, данные и джаз" на HackConf, 18.09.2022 в С-Петербурге
Рассказ про то, как прошли эти три года, и что произошло за это время в мире с открытыми данными, открытой наукой и мной.
Что было, что будет и чем сердце успокоится.
Лекция 1. Введение в Big Data и MapReduceTechnopark
Техносфера Mail.ru Group, МГУ им. М.В. Ломоносова.
Курс "Методы распределенной обработки больших объемов данных в Hadoop"
Видео лекции курса https://www.youtube.com/playlist?list=PLrCZzMib1e9rPxMIgPri9YnOpvyDAL9HD
Это моя презентация для воркшопа по основам журналистики данных на митапе Hacks/Hackers Minsk #2. В презентации - примеры лучших мира сего, основные шаги, и ссылки для дальнейшего обучения.
This is my presentation at the Data Journalism 101 workshop at Hacks/Hackers Minsk #2. The presentations contains examples of the best, as well as explains key steps in Data Journalism.
Big Data - что это и с чем его "едят") Откуда взялся термин Big Data, какое содержание он в себе несет, и, есть ли будущее у тренда Big Data. Изучаем...
Семинар 24-25 апреля 2014 г. «R + TABLEAU. ПРОГНОЗИRОВАНИЕ И BIG DATA АНАЛИЗ»АНАЛИТИКА ПЛЮС
Публикуем небольшую часть раздаточных материалов нашего семинара «R + TABLEAU. ПРОГНОЗИRОВАНИЕ И BIG DATA АНАЛИЗ», который прошел 24-25 апреля 2014 г. в Москве. Подробнее о семинаре, отзывы участников семинара см. здесь: http://analytikaplus.ru/?page_id=2122
SECON'2016. Бартунов Олег, Карьера в Open SourceSECON
Я расскажу про то, как устроен современный Open Source на примере проекта PostgreSQL и про те возможности, которые дает Open Source разработчику, в частности, в реализации себя как творческой личности и карьерного роста, а также достижения свободы и независимости. Open Source в условиях цифрового равенства позволяет разработчику жить и работать в привычных условиях без обязательного перемещения в неудобный для жизни мегаполис, и при этом быть членом большого международного сообщества, принимать участие в его жизни и влиять на развитие проекта.
Низкомолекулярное проектирование: структурированные данные и UXLara Simonova
Подход к исследованию предметной области, созданию её модели данных и описанию информационных сущностей, образующих продукт. Методы и практическая польза для проекта.
Доклад в рамках World Information Architecture Day 2017 в Санкт-Петербурге
Автор: Лара Симонова — информационный архитектор в Collectrium, the Christie’s company; IA и ко-фаундер channelkit.com
Платформа и решения НРЕ для больших данныхAndrey Karpov
Интернет вещей
сеть физических объектов, содержащих
встроенные технологии, позволяющие
распознавать внешние воздействия или
внутренние состояния объектов, а также
взаимодействовать с другими объектами.
СУБД (cистема управления базами данных)
совокупность программных и
лингвистических средств общего или
специального назначения, обеспечивающих
управление созданием и использованием баз
данных.
Структурированные данные
данные, имеющие строгую повторяющуюся
структуру, что дает возможность хранить и
обрабатывать их с использованием СУБД.
Презентация "Аналитик, данные и джаз" на HackConf, 18.09.2022 в С-Петербурге
Рассказ про то, как прошли эти три года, и что произошло за это время в мире с открытыми данными, открытой наукой и мной.
Что было, что будет и чем сердце успокоится.
Solving Data Integration Problems in Medical Imaging System: A Case Study in ...Irina Radchenko
Презентация доклада "Solving Data Integration Problems in Medical Imaging System: A Case Study in Almazov National Medical Research Centre" на SECR2018
Программа CATT (Content Area Teacher Training), университет Аризоны.
CATT - Content Area Teacher Training - программа обучения методике преподавания профильных учебных дисциплин на английском языке для неанглоязычных студентов
2. Вопрос №1
u На портале DataReview (http://datareview.info/article/irina-radchenko-data-
zhurnalistika-nachinaet-obretat-svoih-pionerov/) вы приводите цитату Т. Бернеса-Ли.
Расскажите, пожалуйста, что скрывается за фразой "Журналисты должны
хорошо уметь работать с данными и ориентироваться в них, как рыба в воде".
Каковы критерии того, что журналист умеет хорошо работать с данными?
4. Ответ №1
Какой дата-журналист (ДЖ) сможет написать грамотную статью?
1. ДЖ обладает компьютерной грамотностью.
2. ДЖ имеет представление и умеет пользоваться научным подходом.
3. ДЖ полностью самостоятельно может выстроить процесс управления данными
(Data Management Strategy/Data Management Plan).
4. ДЖ имеет соответствующие компетенции в области работы с данными (данные
и структуры данных, статистика, управление данными, анализ данных, визуализация
данных, подготовка данных, очистка данных, методы работы с большими данными,
программирование, ориентированные на данные, работа с открытыми данными,
юридические аспекты работы с данными и тд).
5. Вопрос №2
u В этой же статье Вы говорите "Для написания статей в стиле дата-
журналистики необходимы открытые данные". Данные в различных
соц.сетях – вроде как открытые данные, но вместе с тем – они являются
персональными данными. Можем ли мы использовать их с юридической
точки зрения?
6. Ответ №2
Данные из соцсетей не являются открытыми данными.
Примеры:
u Скандал с Cambridge Analytica
(https://en.wikipedia.org/wiki/Facebook%E2%80%93Cambridge_Analytica_data_scan
dal).
u Удаление аккаунтов DataSocialHub (https://vc.ru/services/47867-rossiyskaya-social-
data-hub-pozhalovalas-na-blokirovki-66-akkauntov-v-facebook-iz-za-sbora-dannyh-
polzovateley).
u Что такое персональные данные? https://ec.europa.eu/info/law/law-topic/data-
protection/reform/what-personal-data_en
7. Вопрос №3
u Что лучше использовать R или Python?
Какие библиотеки R вы можете порекомендовать?
8. Ответ №3
u Все зависит от задач.
Parameter R Python
Objective
Data analysis and
statistics
Deployment and
production
Primary Users Scholar and R&D
Programmers and
developers
Popularity of
Programming
Language.
Percentage change
4.23% in 2018 21.69% in 2018
Average Salary $99.000 $100.000
Integration Run locally Well-integrated with app
Disadvantages
Slow High Learning
curve
Dependencies
between library
Not as many libraries as R
Advantages
• Graphs are made to
talk. R makes it beautiful
• Large catalog for data
analysis
• GitHub interface
• RMarkdown
• Shiny
• Jupyter notebook:
Notebooks help to share
data with colleagues
• Mathematical
computation
• Deployment
• Code Readability
• Speed
• Function in Pythonhttps://www.guru99.com/r-vs-python.html
Популярность R (син.) и Python (оранж.)
9. Ответ №3
Библиотеки R для работы с данными (малая толика от множества)
u RMySQL, RPostgresSQL, RSQLite – для работы с SQL
u XLConnect, xlsx – работа с Excel
u jsonlite – работа с JSON
u dplyr – описательная статистика
u stringr – работа со строками и регулярными выражениями
u ggplot2 – визуализация данных
u ggvis – интерактивная визуализация
u htmlwidgets – визуализация на основе JavaScript
u shiny – отчеты и веб-приложения
u maps – работа с картами
u randomForest – Random Forest для машинного обучения
10. Вопрос №4
u Какой уровень зарплат у дата-журналиста в 2018 году?
Какие перспективы роста зарплат?
15. Вопрос №6
u Какими софт-скиллами и хард-скиллами должен обладать хороший
дата-журналист?
16. Ответ №6
Hard skills
u Excellent spreadsheet skills, with the ability to teach others.
u Proficiency with relational databases and SQL.
u Strong analytical, research and investigative skills.
u Successful public records requests for databases.
u Familiar with math and basic statistics needed for data analysis.
u An understanding of data visualization and news apps.
u Experience analyzing data with code (Python, R).
u Familiarity with spatial analysis using GIS programs (QGIS or ArcMap).
u Other preferred skills: web scraping, statistical testing and programming.
Web development skills a plus.
17. Ответ №6
Soft skills
u Team up with reporters throughout the newsroom to produce data-driven stories.
u Teach and mentor reporters, both one-on-one and in group settings, to promote data
journalism skill across all beats.
u Strong written and verbal communication skills.
u Excellent interpersonal skills and an ability to collaborate with diverse individuals.
u Stay current with developments and trends in data journalism.
u Ability to manage multiple projects under tight deadlines.
19. Ответ №7
В России
u Медиа-агентства
u По знакомству (по знакомству во ВШЭ и в медиа-тусовке)
u Гуглить (и найти случайные вакансии)
За рубежом
u Медиа-агентства
u Агрегаторы (indeed, glassdoor, etc)
u Гуглить, общаться с зарубежными дата-журналистами