O documento discute Big Data, Analytics e o Cientista de Dados. Aborda o que é Big Data e como os dados são coletados e processados. Explora o que é Analytics e como extrair conhecimento dos dados. Define o Cientista de Dados e as qualificações e habilidades necessárias para a profissão.
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
1. Universidade Presbiteriana Mackenzie
Faculdade de Computação e Informática
Big Data, Analytics e o
Cientista de Dados – um novo
campo de trabalho se abre
Profs. Drs.
• Vivaldo José Breternitz
• Leandro Augusto da Silva
• Fábio Silva Lopes
2. Abordaremos hoje
• Uma visão geral de Big Data
• Analytics
• O Cientista de Dados
– características pessoais desejadas
– formação
3. • Podemos chamar Big Data a tecnologia que
reúne uma quantidade extraordinariamente
grande de dados, em diferentes formatos e
pode processa-la praticamente em tempo real,
aumentando as possibilidades de uso imediato
das informações assim geradas
3
4. Detalhando um pouco
• Every day, we create 2.5 quintillion bytes of
data — so much that 90% of the data in the
world today has been created in the last two
years alone.
• This data comes in different formats from
everywhere: sensors used to gather climate
information, posts to social media sites,
digital pictures and videos, purchase
transaction records, and cell phone GPS
signals to name a few.
5.
6. Da coleta para o consumo – um processo em fluxo contínuo…
7. Sobre Analytics:
É uma disciplina multidimensional.
Consiste em aplicar simultaneamente
técnicas de Estatística, Programação e
Mineração de Dados a um conjunto de
dados, com o intuito de descobrir
padrões significativos, não triviais.
Os resultados descrevem, classificam,
predizem cenários e servem de apoio a
decisão na gestão de negócios.
8. Data Science:
Estudo da extração de conhecimento a partir dos dados.
Dados representam traços do mundo real.
Gerar conhecimento é o desafio.
12. Cientista de Dados
É o profissional que
coordena o
processo de
exploração dos
grandes volumes
de dados que as
organizações
reúnem e
organizam
tentando obter
informações
úteis, quer acerca
do que vem
ocorrendo, quer
acerca do futuro.
13. Skills para trabalhar com Analytics
https://www.linkedin.com/pulse/article/20140903194459-57656293-the-data-science-skills-network
14. Características pessoais desejadas
• Curiosidade e criatividade
• Iniciativa e capacidade de enfrentar
dificuldades
Jonathan Goldman, a despeito do desinteresse e
até oposição de superiores e colegas,
conseguiu implementar no LinkedIn a
funcionalidade “People You May Know“, que
trouxe à empresa milhões de novas page views.
15. Características pessoais desejadas
• Capacidade de comunicação com todos os demais
envolvidos no processo, quer os técnicos, quer os
usuários.
• Capacidade de desenvolver soluções de forma
incremental, gerando produtos inicialmente
pequenos, mas que podem evoluir para soluções
mais amplas.
• Capacidade de “pensar fora da caixa”, partindo
de situações do tipo “temos uma grande
quantidade de dados, o que podemos fazer com
eles?”.
16. Características pessoais desejadas
“A Data Scientist is
somebody who is
inquisitive, who can stare
at data and spot trends.
It's almost like a
Renaissance person who
really wants to learn and
bring change to an
organization.“
Anjul Bhambhri, vice president of Big Data products at IBM
16
17. Renaissance person?
17
A Renaissance
person, also
known as a
"polymath",
refers to a
person with
many talents or
interests
18. • Profissionais com esse perfil são muito
raros
• Sua formação demanda muito tempo
• Pesquisas da consultoria McKinsey
dizem que, apenas nos USA, faltarão em
2018 aproximadamente 190.000 desses
profissionais.
• Faltarão também cerca de 1,5 milhão de
profissionais habilitados como usuários
18
19. Esses profissionais não são os atuais
“Analistas de Business Intelligence”,
especialmente pelo grau de sofisticação das
ferramentas utilizadas e da formação
necessária
Não havendo ainda formação específica
para profissionais dessa área, tem sido
comum a utilização de pessoas com
formação e experiências diversas
19
20. São necessários “T-shaped professionals” ou
“especialistas generalistas”.
A barra horizontal do “T” é a formação básica, que deve ser
suficientemente ampla para que o profissional desenvolva as habilidades
para influenciar pessoas, atuar em equipes multidisciplinares, vislumbrar
oportunidades e encontrar soluções para problemas complexos.
A barra vertical, caracteriza o
aprofundamento nos temas ligados a
BDA propriamente dito.
21. O Mack, em parceria com a IBM,
trabalha para fechar esse gap
• No segundo semestre lançamos um novo curso
de pós graduação: Ciência de Dados: BIG
DATA ANALYTICS, com ênfase em mineração
e análise de dados.
• Objetivo do curso: formar futuros CDO –
Chief Data Officers
21
22. Por falar em formação: uma
visão do mercado americano
22
*ABD – All But Dissertation
*
23. Salários: ainda não temos números confiáveis,
• UK mas...
• Graduates entering the industry can expect to be paid
approximately £27k
• An analyst with four years’ experience is likely to command
£40k - £48k
• Senior consultants will earn around £120k
• Consultancy is a popular option and freelancers can
potentially earn £500 per day.
• USA
• Median salary: US$117,500/year
• Brasil
• Iniciantes, com mestrado/doutorado: R$ 7k/mês
• Nível senior, com mestrado/doutorado: R$ 15k/mês
23