SlideShare une entreprise Scribd logo
1  sur  95
Télécharger pour lire hors ligne
AGILE ANALYTICS
Uma abordagem de BI e Analytics Avançado
Guiada por Valor de Negócio
A n d r e s s a S i v o l e l l a
ESTA É A MARÍLIA…
2Gerente de Projetos
OUTUBRO DE 2015…
3
JANEIRO DE 2016
4
JULHO DE 2016
5
6
ARQUITETURAS TRADICIONAIS DE BI & DW
7
ARQUITETURAS TRADICIONAIS DE BI & DW
Extração ativa de
dados em lote
8
ARQUITETURAS TRADICIONAIS DE BI & DW
Extração ativa de
dados em lote
Modelagem
de dados
corporativos
9
ARQUITETURAS TRADICIONAIS DE BI & DW
Extração ativa de
dados em lote
Modelagem
de dados
corporativos
Lógica de ETL
complexa
Jobs ETL
de longa
duração
10
Extração ativa de
dados em lote
Modelagem
de dados
corporativos
Lógica de ETL
complexa
Design emergente é de
difícil implementação
Jobs ETL
de longa
duração
ARQUITETURAS TRADICIONAIS DE BI & DW
Não
adequado à
dados não-
relacionais
11
ARQUITETURAS TRADICIONAIS DE BI & DW
Extração ativa de
dados em lote
Modelagem
de dados
corporativos
Lógica de ETL
complexa
Não
adequado à
dados não-
relacionais
Design emergente é de
difícil implementação
Jobs ETL
de longa
duração
11
Relatórios e
Diagnósticos
MARÍLIA E A ARQUITETURA ATUAL
12
Você está demitido!
NOVA ABORDAGEM
13
VS
NÍVEIS DE MATURIDADE EM ANALYTICS
14
Valor
Complexidade
Paridade
Diferenciação
O que aconteceu?
Análise
Descritiva
Por que aconteceu?
Análise
Diagnóstica
O que vai acontecer?
Análise
Preditiva
O que fazer quando
acontecer?
Análise
Prescritiva
15
NÍVEIS DE MATURIDADE EM ANALYTICSValor
Complexidade
Paridade
Diferenciação
O que aconteceu?
Análise
Descritiva
Por que aconteceu?
Análise
Diagnóstica
O que vai acontecer?
Análise
Preditiva
O que fazer quando
acontecer?
Análise
Prescritiva
BI
Tradicional
Analytics
Avançado
CENÁRIO ATUAL
16
✴ Volume, Velocidade e Variedade Analytics Avançado
CENÁRIO ATUAL
17
✴ Volume, Velocidade e Variedade Analytics Avançado
✴ Oportunidade de Inovação
CENÁRIO ATUAL
18
✴ Volume, Velocidade e Variedade Analytics Avançado
✴ Oportunidade de Inovação
✴ Desafios:
• Processamento
• Armazenamento
• Análise
CENÁRIO ATUAL
19
✴ Volume, Velocidade e Variedade Analytics Avançado
✴ Oportunidade de Inovação
✴ Desafios:
• Processamento
• Armazenamento
• Análise
✴ BI Tradicional não lida com desafios
CENÁRIO ATUAL
20
✴ Volume, Velocidade e Variedade Analytics Avançado
✴ Oportunidade de Inovação
✴ Desafios:
• Processamento
• Armazenamento
• Análise
✴ BI Tradicional não lida com desafios
✴ Ferramentas proprietárias
• Dificuldade para integração contínua
ANALYTICS AVANÇADO?
21
ARQUITETURA E ENGENHARIA
DE DADOS
Definição de estruturas e
modelos de dados, escolha e
implementação das tecnologias
adequadas
VISUALIZAÇÃO DE DADOS
Design colaborativo,
prototipação, testes e avaliação
de feedbacks para visualização
efetiva dos dados
CIÊNCIA DE DADOS
Criação de modelos que
permitam dar o passo de uma
abordagem descritiva para uma
preditiva.
É, NÃO É, FAZ, NÃO FAZ
22
Analytics Avançado BI Tradicional
Baseada em Ciência Estatística
Baseada em sistemas de suporte a
decisão (CRM, ERP, …)
É, NÃO É, FAZ, NÃO FAZ
23
Analytics Avançado BI Tradicional
Baseada em Ciência Estatística
Baseada em sistemas de suporte a
decisão (CRM, ERP, …)
Computação em Nuvem,
massivamente paralela, bancos de
dados não relacionais
Bancos de dados relacionais
É, NÃO É, FAZ, NÃO FAZ
24
Analytics Avançado BI Tradicional
Baseada em Ciência Estatística
Baseada em sistemas de suporte a
decisão (CRM, ERP, …)
Computação em Nuvem,
massivamente paralela, bancos de
dados não relacionais
Bancos de dados relacionais
Data Lake Data Warehouse
É, NÃO É, FAZ, NÃO FAZ
25
Analytics Avançado BI Tradicional
Baseada em Ciência Estatística
Baseada em sistemas de suporte a
decisão (CRM, ERP, …)
Computação em Nuvem,
massivamente paralela, bancos de
dados não relacionais
Bancos de dados relacionais
Data Lake Data Warehouse
Foco em estatística e
experimentação
Foco em relatórios e Dashboards
É, NÃO É, FAZ, NÃO FAZ
26
Analytics Avançado BI Tradicional
Baseada em Ciência Estatística
Baseada em sistemas de suporte a
decisão (CRM, ERP, …)
Computação em Nuvem,
massivamente paralela, bancos de
dados não relacionais
Bancos de dados relacionais
Data Lake Data Warehouse
Foco em estatística e
experimentação
Foco em relatórios e Dashboards
Aprendizado de Máquina OLAP
É, NÃO É, FAZ, NÃO FAZ
27
Analytics Avançado BI Tradicional
Baseada em Ciência Estatística
Baseada em sistemas de suporte a
decisão (CRM, ERP, …)
Computação em Nuvem,
massivamente paralela, bancos de
dados não relacionais
Bancos de dados relacionais
Data Lake Data Warehouse
Foco em estatística e
experimentação
Foco em relatórios e Dashboards
Aprendizado de Máquina OLAP
Ferramentas Open Source (poucas
proprietárias)
Ferramentas proprietárias (poucas
Open Source)
É, NÃO É, FAZ, NÃO FAZ
28
Analytics Avançado BI Tradicional
Baseada em Ciência Estatística
Baseada em sistemas de suporte a
decisão (CRM, ERP, …)
Computação em Nuvem,
massivamente paralela, bancos de
dados não relacionais
Bancos de dados relacionais
Data Lake Data Warehouse
Foco em estatística e
experimentação
Foco em relatórios e Dashboards
Aprendizado de Máquina OLAP
Ferramentas Open Source (poucas
proprietárias)
Ferramentas proprietárias (poucas
Open Source)
Suporta à ausência de dados Requer dados completos
É, NÃO É, FAZ, NÃO FAZ
29
Analytics Avançado BI Tradicional
Baseada em Ciência Estatística
Baseada em sistemas de suporte a
decisão (CRM, ERP, …)
Computação em Nuvem,
massivamente paralela, bancos de
dados não relacionais
Bancos de dados relacionais
Data Lake Data Warehouse
Foco em estatística e
experimentação
Foco em relatórios e Dashboards
Aprendizado de Máquina OLAP
Ferramentas Open Source (poucas
proprietárias)
Ferramentas proprietárias (poucas
Open Source)
Suporta à ausência de dados Requer dados completos
Dados (des)estruturados Dados estruturados
PONTOS CHAVE
30
✴ Analytics Avançado não é BI ou geração de relatórios.
✴ Analytics é uma forma de alavancar dados e algoritmos de
modo a produzir soluções novas e inovadoras.
✴ Agile Analytics é modelada para reduzir custos
31
Starwood buscava entender quais eventos
possuíam o maior impacto nas ações da
empresa e encontrou na ThoughtWorks a
parceira ideal para ajudar na identificação
desses eventos.
Os resultados foram:
- Melhoria na medição da
performance dos hotéis com o
desenvolvimento de um 

índice de sazonalidade
ajustável
- Identificadas as tendências
potencialmente prejudiciais à
propriedade
- Principais indicadores econômicos
utilizados pela Starwood não eram
mais relevantes para prever a
performance futura do negócio
32
Rackspace, em parceria com a ThoughtWorks, criou
uma plataforma de Cloud Analytics para que o Grupo
de Produtos pudesse extrair valor a partir dos dados de
seus clientes.
Os resultados foram:
- Compreensão de quais usuários aderem a um
plano pago, porque eles aderem e sob quais
circunstâncias.
- Geração contínua de insights possibilitando
novas estratégias de produto.
33
Os resultados foram:
- Reimplementação do motor de
identificação de itens de
contrato para possibilitar
cenários mais complexos e
conjuntos de dados maiores
- Aumento do percentual de
registros identificados de 80%
para 95%
- Redução do tempo de
processamento de horas para
minutos
- App para visualização
substituiu o Excel
PREMIER
A Premier buscou a ThoughtWorks com a
necessidade de simplificar e melhorar a identificação
de itens de listas de compras para negociação de
contratos.
34
Construção de um sistema de gerenciamento de anúncios
para que os usuários finais pudessem gerenciar campanhas
online com foco na otimização de performance.
Geração de recomendações ”inteligentes” com base em algoritmos de machine
learning treinados com dados históricos de mercado.
REACH LOCAL
GRANDE VAREJISTA NOS EUA
Migração da plataforma de dados utilizando 

tecnologias de Big Data
PROBLEMA
• Os sistemas legados utilizados para armazenar e processar dados foram
considerados inadequados
• Os algoritmos de previsão de demanda precisavam ser implementados em um
ambiente de Big Data
SOLUÇÃO
• Os dados foram migrados para um cluster Hadoop
• Foram implementados workflows de dados totalmente automatizados para
preparação de dados, processamento e publicação
• Foram implementados algoritmos de forecasting utilizando Hive e R (no cluster)
• O treinamento de modelos e previsões foi paralelizado através de operações
MapReduce a partir do código em R
36
TECNOLOGIAS
AGILE ANALYTICS
37
ESTRUTURA
38
CAMADA DE
INFORMAÇÃO
DADOS DESESTRU-
TURADOS
CAMADA DE
APLICAÇÃO
38
ESTRUTURA
39
■ Foco nos objetivos de negócio
CAMADA DE
INFORMAÇÃO
DADOS
DESESTRU-
TURADOS
CAMADA DE
APLICAÇÃO
40
ESTRUTURA
■ Foco nos objetivos de negócio
■ Engajamento constante dos
stakeholders
CAMADA DE
INFORMAÇÃO
DADOS
DESESTRU-
TURADOS
CAMADA DE
APLICAÇÃO
40
41
ESTRUTURA
■ Foco nos objetivos de negócio
■ Engajamento constante dos
stakeholders
■ Implementação em fatias
verticais, da extração de
dados às aplicações
CAMADA DE
INFORMAÇÃO
DADOS
DESESTRU-
TURADOS
CAMADA DE
APLICAÇÃO
41
42
ESTRUTURA
■ Foco nos objetivos de negócio
■ Engajamento constante dos
stakeholders
■ Implementação em fatias
verticais, da extração de dados
às aplicações
■ Ingestão incremental de
dados, com capacidade real
time
CAMADA DE
INFORMAÇÃO
DADOS
DESESTRU-
TURADOS
CAMADA DE
APLICAÇÃO
42
43
ESTRUTURA
■ Foco nos objetivos de negócio
■ Engajamento constante dos
stakeholders
■ Implementação em fatias
verticais, da extração de dados
às aplicações
■ Ingestão incremental de dados,
com capacidade real time
■ Estruturas de dados de cada
fatia adequadas à aplicação
CAMADA DE
INFORMAÇÃO
DADOS
DESESTRU-
TURADOS
CAMADA DE
APLICAÇÃO
43
44
ESTRUTURA
■ Foco nos objetivos de negócio
■ Engajamento constante dos
stakeholders
■ Implementação em fatias
verticais, da extração de dados
às aplicações
■ Ingestão incremental de dados,
com capacidade real time
■ Estruturas de dados de cada
fatia adequadas à aplicação
■ Lógica perto da aplicação
CAMADA DE
INFORMAÇÃO
DADOS
DESESTRU-
TURADOS
CAMADA DE
APLICAÇÃO
44
45
ESTRUTURA
■ Foco nos objetivos de negócio
■ Engajamento constante dos
stakeholders
■ Implementação em fatias verticais,
da extração de dados às aplicações
■ Ingestão incremental de dados,
com capacidade real time
■ Estruturas de dados de cada fatia
adequadas à aplicação
■ Lógica perto da aplicação
■ Design emergente / “just enough
architecture”
CAMADA DE
INFORMAÇÃO
DADOS
DESESTRU-
TURADOS
CAMADA DE
APLICAÇÃO
45
NA PRÁTICA…
46
Por onde eu começo?
ALINHAMENTO VIA INCEPTION
47
ALINHAMENTO VIA INCEPTION
48
Riscos Valor de Negócio
QUAIS SÃO OS ELEMENTOS?
FACILITAÇÃO E ANÁLISE DE
NEGÓCIO
Facilitação de workshops,
identificação de cenários e
hipóteses, discussão de
premissas e soluções
ARQUITETURA E ENGENHARIA
DE DADOS
Definição de estruturas e
modelos de dados, escolha e
implementação das tecnologias
adequadas
DESENVOLVIMENTO

ÁGIL
Análise, desenvolvimento e
qualidade de software com
métodos ágeis
VISUALIZAÇÃO DE DADOS
Design colaborativo,
prototipação, testes e avaliação
de feedbacks para visualização
efetiva dos dados
CIÊNCIA DE DADOS
Criação de modelos que
permitam dar o passo de uma
abordagem descritiva para uma
preditiva.
NEGÓCIO E FONTES DE DADOS
Conhecimento do negócio e
fontes de dados
49
POR ONDE COMEÇAR?
50
CIÊNCIA DE DADOS
Criação de modelos que
permitam dar o passo de uma
abordagem descritiva para uma
preditiva.
OPEN SOURCE
CIÊNCIA DE DADOS
51
CIÊNCIA DE DADOS
52
O QUE É MACHINE LEARNING?
53
ABORDAGEM DE REGRAS
54
8
Abordagem de regras?
Cores?
Tipo de costura?
Tamanho?
...
ABORDAGEM DE ANALYTICS AVANÇADO
55
9
Abordagem de Machine Learning
Classificador
Treinado a partir de
conjunto conhecido
(supervisionado)
Atributos
(features)
Resposta
(label/target/output)
ABORDAGEM DE ANALYTICS AVANÇADO
56
10
Abordagem de Machine Learning
Classificador
Algoritmos encontram padrões
nas amostras conhecidas
Atributos
(features)
Resposta
(label/target/output)
ABORDAGEM DE ANALYTICS AVANÇADO
57
12
● árvore de decisão???
● rede neural
● regressão linear
● ensemble
● ...
Possíveis Classificadores
ClassificadorAtributos
(features)
Resposta
(label/target/output)
58
Marília joga tênis
MARÍLIA JOGA TÊNIS?
59
15
João joga tênis?
Tempo
Umidade
Vento
...
Não joga
Joga
Árvore de Decisão
60
# Dia Tempo Umidade Vento Joga?
1 Ensolarado Alta Fraco Não
2 Ensolarado Alta Fraco Não
3 Nublado Alta Fraco Sim
4 Chuvoso Alta Forte Sim
5 Chuvoso Normal Fraco Sim
6 Chuvoso Normal Forte Sim
7 Nublado Normal Forte Sim
8 Ensolarado Alta Fraco Não
9 Ensolarado Normal Fraco Sim
10 Chuvoso Normal Fraco Sim
11 Ensolarado Normal Forte Sim
12 Nublado Alta Forte Sim
13 Nublado Normal Fraco Sim
14 Chuvoso Alta Forte Não
2 semanas de
João joga tên
2 semanas
de
Janeiro
61
17
Tempo
Ensolarado
Nublado
Chuvoso
Umidade Vento
Joga
Alta Normal
Joga
Forte Fraco
Não Joga JogaNão Joga
Árvore de Decisão
62
# Dia Tempo Umidade Vento Joga?
1 Nublado Alta Fraco Sim
2 Ensolarado Alta Forte Não
3 Ensolarado Alta Fraco Não
4 Chuvoso Normal Fraco Sim
5 Chuvoso Alta Fraco Sim
6 Chuvoso Normal Forte Não
7 Nublado Alta Forte Sim
8 Chuvoso Alta Forte Não
9 Ensolarado Normal Fraco Sim
10 Chuvoso Alta Fraco Sim
11 Nublado Normal Fraco Não
12 Nublado Alta Forte Sim
13 Nublado Alta Fraco Sim
14 Ensolarado Alta Fraco Não
2 semanas d
João joga tên
2 semanas
de
Julho
63
19
Árvore de Decisão
Tempo
Ensolarado
Nublado
Chuvoso
Umidade
NormalAlta
JogaNão Joga
Umidade
NormalAlta
Joga Não Joga
Vento
NormalFraco
Joga Não Joga
64
20
Sub-conjuntos (im)puros
Tempo
Ensolarado
Nublado
Chuvoso
Umidade Vento
0 / 4
Profundidade = 2 Puro
3 / 2
Impuro
2 / 3
Impuro
65
21
Sub-conjuntos (im)puros
Tempo
Ensolarado
Nublado
Chuvoso
Profundidade = 2
Joga
Não Joga Joga
TREINAMENTO SUPERVISIONADO
66
Treinamento Supervisionado
Conjunto de
amostras
rotulado
TREINAMENTO SUPERVISIONADO
67
23
Treinamento Supervisionado
100% de amostras
70%
Treino Teste
30%
COMO COMPARAR DESEMPENHO?
68
Como comparar desempenho?
Palpite do Classificador
ClassificaçãoReal
Joga
Joga
Não Joga
NãoJoga
Verdadeiro
Positivo (TP)
Verdadeiro
Negativo (TN)
False
Negativo (FN)
False
Positivo (FP)
Matriz de Confusão
COMO COMPARAR DESEMPENHO?
69
25
Como comparar desempenho?
Palpite do Classificador
ClassificaçãoReal
Joga
Joga
Não Joga
NãoJoga
Verdadeiro
Positivo (TP)
Verdadeiro
Negativo (TN)
False
Negativo (FN)
False
Positivo (FP)
Precisão =
TP
TP + FP
Recall =
TP
TP + FN
Acurácia =
TP + TN
Total
F1 Score = 2 .
Precisão . Recall
Precisão + Recall
70
Código, mostre-me código!
EVOLUÇÃO: MODELOS ENSEMBLE
71
Em qual atleta eu posso
apostar na final do
US Open?
OPINIÃO 1
72
Opinião 1
29
No passado, ele teve êxito em 68% de
seus palpites
Conhece bem o esporte
… mas tendencioso
Não é imparcial
OPINIÃO 2
73
Opinião 2
30
Acompanha apostas há 10 anos
Estuda atletas individualmente
Excelência em apostas esportivas
No passado, ela teve êxito em 73% de
seus palpites
Ⓡ
OPINIÃO 3
74
Opinião 3
31
Mais afinidade com atletas mulheres
Desconhece atletas novos
Não vem acompanhando o esporte
No passado, ela teve êxito em 70% de
seus palpites
OPINIÃO 4
75
Opinião 4
32
...
No passado, ela teve êxito em 62% de
seus palpites
COMBINAÇÃO DOS PALPITES
76
Combinação das Avaliações
= 1 - (68% x 73% x 70% x 62%)
= 79% de acurácia
Guga Empresa Sharapova Galvão
Correlacionados
Acurácia
33
Ⓡ
MODELO ENSEMBLE
77
Modelos Ensemble
Classificador 1
Classificador 2
Classificador 3
Classificador 4
Classificador N
Hipótese
Coletiva
Classificador Ensemble
34
H1
H2
H3
H4
HN
MODELO ENSEMBLE
78
Modelos Ensemble
Guga
Galvão
Blabous
Sharapova
Hipótese
Coletiva
Classificador Ensemble
Voto
Majoritário
35
CLASSIFICADORES
79
Classificadores
Árvore de Decisão 1
Árvore de Decisão 2
Árvore de Decisão 3
Árvore de Decisão 4
Árvore de Decisão N
Algoritmos da mesma natureza
SVM
Árvore de Decisão
Rede Neural
Deep Learner
Regressor Linear
Diversidade de Algoritmos
36
CLASSIFICADORES
80
PositivoNegativo
Hipótese Coletiva
Classificadores
Árvore de Decisão 1
Árvore de Decisão 2
Árvore de Decisão 3
Árvore de Decisão 4
Árvore de Decisão N
+1
+1
-1
-1
-1
SVM
Árvore de Decisão
Rede Neural
Deep Learner
Regressor Linear
+2
-1
+3
-1
-1
37
CLASSIFICADORES
81
38
Hipótese Coletiva: -1 Hipótese Coletiva: +2
Árvore de Decisão 1
Árvore de Decisão 2
Árvore de Decisão 3
Árvore de Decisão 4
Árvore de Decisão N
+1
+1
-1
-1
-1
SVM
Árvore de Decisão
Rede Neural
Deep Learner
Regressor Linear
+2
-1
+3
-1
-1
Classificadores
AGILE ANALYTICS
82
Árvore de Decisão
AGILE ANALYTICS
83
Árvore de Decisão
Regressão Linear
AGILE ANALYTICS
84
Árvore de Decisão
Regressão Linear
Rede Neural
AGILE ANALYTICS
85
Árvore de Decisão
Regressão Linear
Rede Neural
Modelo Ensemble
ABORDAGEM
86
ABORDAGEM
87
88
METODOLOGIAS
CANVAS
89
ESTÓRIAS DE USUÁRIOS
90
Como um <papel>
Eu quero <objetivo>
Para então <valor>
PAREAMENTO
91
TIMES AUTO-GERENCIÁVEIS
92
OUTRAS PRÁTICAS
93
✴ Stand-ups
✴ Showcases
✴ Atividades de Team Building
✴ Retrospectivas Semanais
RADAR TÉCNICO
94
@asivolella
asivolella@thoughtworks.com
Andressa Sivolella

Contenu connexe

Tendances

People analytics - O RH Data Driven
People analytics - O RH Data DrivenPeople analytics - O RH Data Driven
People analytics - O RH Data DrivenMarcelo Furtado
 
Wiseminer Data Blending, Data Preparation & Analytics
Wiseminer Data Blending, Data Preparation & AnalyticsWiseminer Data Blending, Data Preparation & Analytics
Wiseminer Data Blending, Data Preparation & AnalyticsLeonardo Couto
 
Tableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with TableauTableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with TableauXpand IT
 
Wiseminer: Data Blending & Data Preparation
Wiseminer: Data Blending & Data PreparationWiseminer: Data Blending & Data Preparation
Wiseminer: Data Blending & Data PreparationLeonardo Couto
 
Tome Decisões + Inteligentes!
Tome Decisões + Inteligentes!Tome Decisões + Inteligentes!
Tome Decisões + Inteligentes!Leonardo Couto
 
Big Data: Desafios e Oportunidades
Big Data: Desafios e OportunidadesBig Data: Desafios e Oportunidades
Big Data: Desafios e OportunidadesGabriel Prado
 
Software as a Service
Software as a ServiceSoftware as a Service
Software as a ServiceDenis Vieira
 
Big data e agile analytics
Big data e agile analytics Big data e agile analytics
Big data e agile analytics Luca Bastos
 
Caso de sucesso Tableau Brasil na Gascom - Partner Somativa
Caso de sucesso Tableau Brasil na Gascom - Partner SomativaCaso de sucesso Tableau Brasil na Gascom - Partner Somativa
Caso de sucesso Tableau Brasil na Gascom - Partner Somativastellasomativa
 
As 10 principais tendências em business intelligence para 2015
As 10 principais tendências em business intelligence para 2015As 10 principais tendências em business intelligence para 2015
As 10 principais tendências em business intelligence para 2015Tableau Software
 
Apresentação Floripa tech day 240819
Apresentação Floripa tech day 240819Apresentação Floripa tech day 240819
Apresentação Floripa tech day 240819Luana da Silva
 
Apresentação Executiva Paralelo CS - Qlik - Business Intelligence
Apresentação Executiva Paralelo CS - Qlik - Business IntelligenceApresentação Executiva Paralelo CS - Qlik - Business Intelligence
Apresentação Executiva Paralelo CS - Qlik - Business IntelligenceLucas Magalhães
 
Introdução - Big Data e Business Intelligence
Introdução - Big Data e Business IntelligenceIntrodução - Big Data e Business Intelligence
Introdução - Big Data e Business IntelligenceLeandro Guerra
 

Tendances (15)

People analytics - O RH Data Driven
People analytics - O RH Data DrivenPeople analytics - O RH Data Driven
People analytics - O RH Data Driven
 
Wiseminer Data Blending, Data Preparation & Analytics
Wiseminer Data Blending, Data Preparation & AnalyticsWiseminer Data Blending, Data Preparation & Analytics
Wiseminer Data Blending, Data Preparation & Analytics
 
Tableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with TableauTableau: Big Data Analytics with Tableau
Tableau: Big Data Analytics with Tableau
 
Wiseminer: Data Blending & Data Preparation
Wiseminer: Data Blending & Data PreparationWiseminer: Data Blending & Data Preparation
Wiseminer: Data Blending & Data Preparation
 
Tome Decisões + Inteligentes!
Tome Decisões + Inteligentes!Tome Decisões + Inteligentes!
Tome Decisões + Inteligentes!
 
Clustering
ClusteringClustering
Clustering
 
Dê Adeus ao BI e Seja Bem Vindo à Era do Analytics...
Dê Adeus ao BI e Seja Bem Vindo à Era do Analytics...Dê Adeus ao BI e Seja Bem Vindo à Era do Analytics...
Dê Adeus ao BI e Seja Bem Vindo à Era do Analytics...
 
Big Data: Desafios e Oportunidades
Big Data: Desafios e OportunidadesBig Data: Desafios e Oportunidades
Big Data: Desafios e Oportunidades
 
Software as a Service
Software as a ServiceSoftware as a Service
Software as a Service
 
Big data e agile analytics
Big data e agile analytics Big data e agile analytics
Big data e agile analytics
 
Caso de sucesso Tableau Brasil na Gascom - Partner Somativa
Caso de sucesso Tableau Brasil na Gascom - Partner SomativaCaso de sucesso Tableau Brasil na Gascom - Partner Somativa
Caso de sucesso Tableau Brasil na Gascom - Partner Somativa
 
As 10 principais tendências em business intelligence para 2015
As 10 principais tendências em business intelligence para 2015As 10 principais tendências em business intelligence para 2015
As 10 principais tendências em business intelligence para 2015
 
Apresentação Floripa tech day 240819
Apresentação Floripa tech day 240819Apresentação Floripa tech day 240819
Apresentação Floripa tech day 240819
 
Apresentação Executiva Paralelo CS - Qlik - Business Intelligence
Apresentação Executiva Paralelo CS - Qlik - Business IntelligenceApresentação Executiva Paralelo CS - Qlik - Business Intelligence
Apresentação Executiva Paralelo CS - Qlik - Business Intelligence
 
Introdução - Big Data e Business Intelligence
Introdução - Big Data e Business IntelligenceIntrodução - Big Data e Business Intelligence
Introdução - Big Data e Business Intelligence
 

En vedette

Agile analytics : An exploratory study of technical complexity management
Agile analytics : An exploratory study of technical complexity managementAgile analytics : An exploratory study of technical complexity management
Agile analytics : An exploratory study of technical complexity managementAgnirudra Sikdar
 
Big Data Agile Analytics by Ken Collier - Director Agile Analytics, Thoughtwo...
Big Data Agile Analytics by Ken Collier - Director Agile Analytics, Thoughtwo...Big Data Agile Analytics by Ken Collier - Director Agile Analytics, Thoughtwo...
Big Data Agile Analytics by Ken Collier - Director Agile Analytics, Thoughtwo...Thoughtworks
 
Desenvolvimento Ágil para BI
Desenvolvimento Ágil para BIDesenvolvimento Ágil para BI
Desenvolvimento Ágil para BIRicardo Gouvêa
 
Empowering the Business with Agile Analytics
Empowering the Business with Agile AnalyticsEmpowering the Business with Agile Analytics
Empowering the Business with Agile AnalyticsInside Analysis
 
Agile Consumer Analytics
Agile Consumer AnalyticsAgile Consumer Analytics
Agile Consumer AnalyticsThoughtworks
 
Beyond pretty charts, Analytics for the rest of us. Toufic Boubez DevOps Days...
Beyond pretty charts, Analytics for the rest of us. Toufic Boubez DevOps Days...Beyond pretty charts, Analytics for the rest of us. Toufic Boubez DevOps Days...
Beyond pretty charts, Analytics for the rest of us. Toufic Boubez DevOps Days...tboubez
 
Metodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho DayMetodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho DayMarco Garcia
 
Agile Analytics: The Secret to Test, Improve, Fail & Succeed Quickly.
Agile Analytics: The Secret to Test, Improve, Fail & Succeed Quickly.Agile Analytics: The Secret to Test, Improve, Fail & Succeed Quickly.
Agile Analytics: The Secret to Test, Improve, Fail & Succeed Quickly.Venveo
 
Continuous delivery with zero downtime. made real by dev ops.
Continuous delivery with zero downtime. made real by dev ops.Continuous delivery with zero downtime. made real by dev ops.
Continuous delivery with zero downtime. made real by dev ops.Edureka!
 
DevOps and the Bottom Line
DevOps and the Bottom Line DevOps and the Bottom Line
DevOps and the Bottom Line Chef
 
Analytics for smarter software development
Analytics for smarter software development Analytics for smarter software development
Analytics for smarter software development Thomas Zimmermann
 
DevOps: The Key to IT Performance
DevOps: The Key to IT PerformanceDevOps: The Key to IT Performance
DevOps: The Key to IT PerformanceNicole Forsgren
 
ChefConf 2015 Event Slides
ChefConf 2015 Event SlidesChefConf 2015 Event Slides
ChefConf 2015 Event SlidesSumo Logic
 
Enhance your Agility with DevOps
Enhance your Agility with DevOpsEnhance your Agility with DevOps
Enhance your Agility with DevOpsEdureka!
 
Analytics for Software Development
Analytics for Software DevelopmentAnalytics for Software Development
Analytics for Software DevelopmentRay Buse
 

En vedette (20)

Agile analytics : An exploratory study of technical complexity management
Agile analytics : An exploratory study of technical complexity managementAgile analytics : An exploratory study of technical complexity management
Agile analytics : An exploratory study of technical complexity management
 
Big Data Agile Analytics by Ken Collier - Director Agile Analytics, Thoughtwo...
Big Data Agile Analytics by Ken Collier - Director Agile Analytics, Thoughtwo...Big Data Agile Analytics by Ken Collier - Director Agile Analytics, Thoughtwo...
Big Data Agile Analytics by Ken Collier - Director Agile Analytics, Thoughtwo...
 
FDWS - Apresentação Projeto Final de Curso
FDWS - Apresentação Projeto Final de CursoFDWS - Apresentação Projeto Final de Curso
FDWS - Apresentação Projeto Final de Curso
 
Desenvolvimento Ágil para BI
Desenvolvimento Ágil para BIDesenvolvimento Ágil para BI
Desenvolvimento Ágil para BI
 
Aula - Aplicação de Metodologias/Práticas Ágeis em Projetos de BI
Aula - Aplicação de Metodologias/Práticas Ágeis em Projetos de BIAula - Aplicação de Metodologias/Práticas Ágeis em Projetos de BI
Aula - Aplicação de Metodologias/Práticas Ágeis em Projetos de BI
 
Empowering the Business with Agile Analytics
Empowering the Business with Agile AnalyticsEmpowering the Business with Agile Analytics
Empowering the Business with Agile Analytics
 
Pitch AcheSeuEstúdio - Campus Party
Pitch AcheSeuEstúdio - Campus PartyPitch AcheSeuEstúdio - Campus Party
Pitch AcheSeuEstúdio - Campus Party
 
Agile Consumer Analytics
Agile Consumer AnalyticsAgile Consumer Analytics
Agile Consumer Analytics
 
Beyond pretty charts, Analytics for the rest of us. Toufic Boubez DevOps Days...
Beyond pretty charts, Analytics for the rest of us. Toufic Boubez DevOps Days...Beyond pretty charts, Analytics for the rest of us. Toufic Boubez DevOps Days...
Beyond pretty charts, Analytics for the rest of us. Toufic Boubez DevOps Days...
 
Analytics gets Agile
Analytics gets AgileAnalytics gets Agile
Analytics gets Agile
 
Metodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho DayMetodologia Ágil para Projetos de BI - Pentaho Day
Metodologia Ágil para Projetos de BI - Pentaho Day
 
Agile Analytics: The Secret to Test, Improve, Fail & Succeed Quickly.
Agile Analytics: The Secret to Test, Improve, Fail & Succeed Quickly.Agile Analytics: The Secret to Test, Improve, Fail & Succeed Quickly.
Agile Analytics: The Secret to Test, Improve, Fail & Succeed Quickly.
 
Continuous delivery with zero downtime. made real by dev ops.
Continuous delivery with zero downtime. made real by dev ops.Continuous delivery with zero downtime. made real by dev ops.
Continuous delivery with zero downtime. made real by dev ops.
 
DevOps and the Bottom Line
DevOps and the Bottom Line DevOps and the Bottom Line
DevOps and the Bottom Line
 
Lean Analytics 101
Lean Analytics 101Lean Analytics 101
Lean Analytics 101
 
Analytics for smarter software development
Analytics for smarter software development Analytics for smarter software development
Analytics for smarter software development
 
DevOps: The Key to IT Performance
DevOps: The Key to IT PerformanceDevOps: The Key to IT Performance
DevOps: The Key to IT Performance
 
ChefConf 2015 Event Slides
ChefConf 2015 Event SlidesChefConf 2015 Event Slides
ChefConf 2015 Event Slides
 
Enhance your Agility with DevOps
Enhance your Agility with DevOpsEnhance your Agility with DevOps
Enhance your Agility with DevOps
 
Analytics for Software Development
Analytics for Software DevelopmentAnalytics for Software Development
Analytics for Software Development
 

Similaire à GUBI: Agile Analytics [pt-br]

Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxApresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxdataRain
 
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.  Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics. Ambiente Livre
 
Estratégia de Mensuração para Produtos Digitais
Estratégia de Mensuração para Produtos DigitaisEstratégia de Mensuração para Produtos Digitais
Estratégia de Mensuração para Produtos DigitaisHuxley Dias
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Finaljcaroso
 
Big Data & Cognitive Lab
Big Data & Cognitive LabBig Data & Cognitive Lab
Big Data & Cognitive LabTenbu
 
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Cicero Joasyo Mateus de Moura
 
Inteligência Analítica
Inteligência AnalíticaInteligência Analítica
Inteligência AnalíticaCesar Patiño
 
Trabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado FinanceiroTrabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado FinanceiroMarco Garcia
 
Ppt webinar - renato avelar
Ppt  webinar - renato avelarPpt  webinar - renato avelar
Ppt webinar - renato avelarRenato Avelar
 
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...Aislan Honorato
 
Construindo Data Lakes e Analytics na AWS - BDA301 - Sao Paulo Summit
Construindo Data Lakes e Analytics na AWS -  BDA301 - Sao Paulo SummitConstruindo Data Lakes e Analytics na AWS -  BDA301 - Sao Paulo Summit
Construindo Data Lakes e Analytics na AWS - BDA301 - Sao Paulo SummitAmazon Web Services
 
SQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da Microsoft
SQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da MicrosoftSQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da Microsoft
SQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da MicrosoftRodrigo Crespi
 
Carreiras em Business Intelligence e Big Data
Carreiras em Business Intelligence e Big DataCarreiras em Business Intelligence e Big Data
Carreiras em Business Intelligence e Big DataMarco Garcia
 
SAP Forum Brasil 2018 - A importância dos dados para a empresa inteligente
SAP Forum Brasil 2018 - A importância dos dados para a empresa inteligenteSAP Forum Brasil 2018 - A importância dos dados para a empresa inteligente
SAP Forum Brasil 2018 - A importância dos dados para a empresa inteligenteJuly A. M. Rizzo
 
Sistemas de Informação (SAD / OLAP)
Sistemas de Informação (SAD / OLAP)Sistemas de Informação (SAD / OLAP)
Sistemas de Informação (SAD / OLAP)m4rkSpinelli
 
Apresentação Seeds to the Cloud - Carlos Paiola, Aquarius.pptx
Apresentação Seeds to the Cloud - Carlos Paiola, Aquarius.pptxApresentação Seeds to the Cloud - Carlos Paiola, Aquarius.pptx
Apresentação Seeds to the Cloud - Carlos Paiola, Aquarius.pptxdataRain
 

Similaire à GUBI: Agile Analytics [pt-br] (20)

Course Content.en.pt.pdf
Course Content.en.pt.pdfCourse Content.en.pt.pdf
Course Content.en.pt.pdf
 
Business Analytics
Business AnalyticsBusiness Analytics
Business Analytics
 
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptxApresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
Apresentação Seeds to the Cloud - Igor Barreto e Thais Lino, dataRain.pptx
 
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.  Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
 
Estratégia de Mensuração para Produtos Digitais
Estratégia de Mensuração para Produtos DigitaisEstratégia de Mensuração para Produtos Digitais
Estratégia de Mensuração para Produtos Digitais
 
Tesi Dados Final
Tesi Dados FinalTesi Dados Final
Tesi Dados Final
 
Big Data & Cognitive Lab
Big Data & Cognitive LabBig Data & Cognitive Lab
Big Data & Cognitive Lab
 
TIEnergia2016
TIEnergia2016TIEnergia2016
TIEnergia2016
 
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
 
Inteligência Analítica
Inteligência AnalíticaInteligência Analítica
Inteligência Analítica
 
Trabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado FinanceiroTrabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado Financeiro
 
Ppt webinar - renato avelar
Ppt  webinar - renato avelarPpt  webinar - renato avelar
Ppt webinar - renato avelar
 
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
PowerBI na Pártica com Indicadores Elicitados com MindMap e Canvas consumidos...
 
Construindo Data Lakes e Analytics na AWS - BDA301 - Sao Paulo Summit
Construindo Data Lakes e Analytics na AWS -  BDA301 - Sao Paulo SummitConstruindo Data Lakes e Analytics na AWS -  BDA301 - Sao Paulo Summit
Construindo Data Lakes e Analytics na AWS - BDA301 - Sao Paulo Summit
 
SharperDataBI
SharperDataBI SharperDataBI
SharperDataBI
 
SQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da Microsoft
SQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da MicrosoftSQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da Microsoft
SQL Saturday 469 Brasília - Oportunidades com a plataforma de dados da Microsoft
 
Carreiras em Business Intelligence e Big Data
Carreiras em Business Intelligence e Big DataCarreiras em Business Intelligence e Big Data
Carreiras em Business Intelligence e Big Data
 
SAP Forum Brasil 2018 - A importância dos dados para a empresa inteligente
SAP Forum Brasil 2018 - A importância dos dados para a empresa inteligenteSAP Forum Brasil 2018 - A importância dos dados para a empresa inteligente
SAP Forum Brasil 2018 - A importância dos dados para a empresa inteligente
 
Sistemas de Informação (SAD / OLAP)
Sistemas de Informação (SAD / OLAP)Sistemas de Informação (SAD / OLAP)
Sistemas de Informação (SAD / OLAP)
 
Apresentação Seeds to the Cloud - Carlos Paiola, Aquarius.pptx
Apresentação Seeds to the Cloud - Carlos Paiola, Aquarius.pptxApresentação Seeds to the Cloud - Carlos Paiola, Aquarius.pptx
Apresentação Seeds to the Cloud - Carlos Paiola, Aquarius.pptx
 

GUBI: Agile Analytics [pt-br]

  • 1. AGILE ANALYTICS Uma abordagem de BI e Analytics Avançado Guiada por Valor de Negócio A n d r e s s a S i v o l e l l a
  • 2. ESTA É A MARÍLIA… 2Gerente de Projetos
  • 7. 7 ARQUITETURAS TRADICIONAIS DE BI & DW Extração ativa de dados em lote
  • 8. 8 ARQUITETURAS TRADICIONAIS DE BI & DW Extração ativa de dados em lote Modelagem de dados corporativos
  • 9. 9 ARQUITETURAS TRADICIONAIS DE BI & DW Extração ativa de dados em lote Modelagem de dados corporativos Lógica de ETL complexa Jobs ETL de longa duração
  • 10. 10 Extração ativa de dados em lote Modelagem de dados corporativos Lógica de ETL complexa Design emergente é de difícil implementação Jobs ETL de longa duração ARQUITETURAS TRADICIONAIS DE BI & DW Não adequado à dados não- relacionais
  • 11. 11 ARQUITETURAS TRADICIONAIS DE BI & DW Extração ativa de dados em lote Modelagem de dados corporativos Lógica de ETL complexa Não adequado à dados não- relacionais Design emergente é de difícil implementação Jobs ETL de longa duração 11 Relatórios e Diagnósticos
  • 12. MARÍLIA E A ARQUITETURA ATUAL 12 Você está demitido!
  • 14. NÍVEIS DE MATURIDADE EM ANALYTICS 14 Valor Complexidade Paridade Diferenciação O que aconteceu? Análise Descritiva Por que aconteceu? Análise Diagnóstica O que vai acontecer? Análise Preditiva O que fazer quando acontecer? Análise Prescritiva
  • 15. 15 NÍVEIS DE MATURIDADE EM ANALYTICSValor Complexidade Paridade Diferenciação O que aconteceu? Análise Descritiva Por que aconteceu? Análise Diagnóstica O que vai acontecer? Análise Preditiva O que fazer quando acontecer? Análise Prescritiva BI Tradicional Analytics Avançado
  • 16. CENÁRIO ATUAL 16 ✴ Volume, Velocidade e Variedade Analytics Avançado
  • 17. CENÁRIO ATUAL 17 ✴ Volume, Velocidade e Variedade Analytics Avançado ✴ Oportunidade de Inovação
  • 18. CENÁRIO ATUAL 18 ✴ Volume, Velocidade e Variedade Analytics Avançado ✴ Oportunidade de Inovação ✴ Desafios: • Processamento • Armazenamento • Análise
  • 19. CENÁRIO ATUAL 19 ✴ Volume, Velocidade e Variedade Analytics Avançado ✴ Oportunidade de Inovação ✴ Desafios: • Processamento • Armazenamento • Análise ✴ BI Tradicional não lida com desafios
  • 20. CENÁRIO ATUAL 20 ✴ Volume, Velocidade e Variedade Analytics Avançado ✴ Oportunidade de Inovação ✴ Desafios: • Processamento • Armazenamento • Análise ✴ BI Tradicional não lida com desafios ✴ Ferramentas proprietárias • Dificuldade para integração contínua
  • 21. ANALYTICS AVANÇADO? 21 ARQUITETURA E ENGENHARIA DE DADOS Definição de estruturas e modelos de dados, escolha e implementação das tecnologias adequadas VISUALIZAÇÃO DE DADOS Design colaborativo, prototipação, testes e avaliação de feedbacks para visualização efetiva dos dados CIÊNCIA DE DADOS Criação de modelos que permitam dar o passo de uma abordagem descritiva para uma preditiva.
  • 22. É, NÃO É, FAZ, NÃO FAZ 22 Analytics Avançado BI Tradicional Baseada em Ciência Estatística Baseada em sistemas de suporte a decisão (CRM, ERP, …)
  • 23. É, NÃO É, FAZ, NÃO FAZ 23 Analytics Avançado BI Tradicional Baseada em Ciência Estatística Baseada em sistemas de suporte a decisão (CRM, ERP, …) Computação em Nuvem, massivamente paralela, bancos de dados não relacionais Bancos de dados relacionais
  • 24. É, NÃO É, FAZ, NÃO FAZ 24 Analytics Avançado BI Tradicional Baseada em Ciência Estatística Baseada em sistemas de suporte a decisão (CRM, ERP, …) Computação em Nuvem, massivamente paralela, bancos de dados não relacionais Bancos de dados relacionais Data Lake Data Warehouse
  • 25. É, NÃO É, FAZ, NÃO FAZ 25 Analytics Avançado BI Tradicional Baseada em Ciência Estatística Baseada em sistemas de suporte a decisão (CRM, ERP, …) Computação em Nuvem, massivamente paralela, bancos de dados não relacionais Bancos de dados relacionais Data Lake Data Warehouse Foco em estatística e experimentação Foco em relatórios e Dashboards
  • 26. É, NÃO É, FAZ, NÃO FAZ 26 Analytics Avançado BI Tradicional Baseada em Ciência Estatística Baseada em sistemas de suporte a decisão (CRM, ERP, …) Computação em Nuvem, massivamente paralela, bancos de dados não relacionais Bancos de dados relacionais Data Lake Data Warehouse Foco em estatística e experimentação Foco em relatórios e Dashboards Aprendizado de Máquina OLAP
  • 27. É, NÃO É, FAZ, NÃO FAZ 27 Analytics Avançado BI Tradicional Baseada em Ciência Estatística Baseada em sistemas de suporte a decisão (CRM, ERP, …) Computação em Nuvem, massivamente paralela, bancos de dados não relacionais Bancos de dados relacionais Data Lake Data Warehouse Foco em estatística e experimentação Foco em relatórios e Dashboards Aprendizado de Máquina OLAP Ferramentas Open Source (poucas proprietárias) Ferramentas proprietárias (poucas Open Source)
  • 28. É, NÃO É, FAZ, NÃO FAZ 28 Analytics Avançado BI Tradicional Baseada em Ciência Estatística Baseada em sistemas de suporte a decisão (CRM, ERP, …) Computação em Nuvem, massivamente paralela, bancos de dados não relacionais Bancos de dados relacionais Data Lake Data Warehouse Foco em estatística e experimentação Foco em relatórios e Dashboards Aprendizado de Máquina OLAP Ferramentas Open Source (poucas proprietárias) Ferramentas proprietárias (poucas Open Source) Suporta à ausência de dados Requer dados completos
  • 29. É, NÃO É, FAZ, NÃO FAZ 29 Analytics Avançado BI Tradicional Baseada em Ciência Estatística Baseada em sistemas de suporte a decisão (CRM, ERP, …) Computação em Nuvem, massivamente paralela, bancos de dados não relacionais Bancos de dados relacionais Data Lake Data Warehouse Foco em estatística e experimentação Foco em relatórios e Dashboards Aprendizado de Máquina OLAP Ferramentas Open Source (poucas proprietárias) Ferramentas proprietárias (poucas Open Source) Suporta à ausência de dados Requer dados completos Dados (des)estruturados Dados estruturados
  • 30. PONTOS CHAVE 30 ✴ Analytics Avançado não é BI ou geração de relatórios. ✴ Analytics é uma forma de alavancar dados e algoritmos de modo a produzir soluções novas e inovadoras. ✴ Agile Analytics é modelada para reduzir custos
  • 31. 31 Starwood buscava entender quais eventos possuíam o maior impacto nas ações da empresa e encontrou na ThoughtWorks a parceira ideal para ajudar na identificação desses eventos. Os resultados foram: - Melhoria na medição da performance dos hotéis com o desenvolvimento de um 
 índice de sazonalidade ajustável - Identificadas as tendências potencialmente prejudiciais à propriedade - Principais indicadores econômicos utilizados pela Starwood não eram mais relevantes para prever a performance futura do negócio
  • 32. 32 Rackspace, em parceria com a ThoughtWorks, criou uma plataforma de Cloud Analytics para que o Grupo de Produtos pudesse extrair valor a partir dos dados de seus clientes. Os resultados foram: - Compreensão de quais usuários aderem a um plano pago, porque eles aderem e sob quais circunstâncias. - Geração contínua de insights possibilitando novas estratégias de produto.
  • 33. 33 Os resultados foram: - Reimplementação do motor de identificação de itens de contrato para possibilitar cenários mais complexos e conjuntos de dados maiores - Aumento do percentual de registros identificados de 80% para 95% - Redução do tempo de processamento de horas para minutos - App para visualização substituiu o Excel PREMIER A Premier buscou a ThoughtWorks com a necessidade de simplificar e melhorar a identificação de itens de listas de compras para negociação de contratos.
  • 34. 34 Construção de um sistema de gerenciamento de anúncios para que os usuários finais pudessem gerenciar campanhas online com foco na otimização de performance. Geração de recomendações ”inteligentes” com base em algoritmos de machine learning treinados com dados históricos de mercado. REACH LOCAL
  • 35. GRANDE VAREJISTA NOS EUA Migração da plataforma de dados utilizando 
 tecnologias de Big Data PROBLEMA • Os sistemas legados utilizados para armazenar e processar dados foram considerados inadequados • Os algoritmos de previsão de demanda precisavam ser implementados em um ambiente de Big Data SOLUÇÃO • Os dados foram migrados para um cluster Hadoop • Foram implementados workflows de dados totalmente automatizados para preparação de dados, processamento e publicação • Foram implementados algoritmos de forecasting utilizando Hive e R (no cluster) • O treinamento de modelos e previsões foi paralelizado através de operações MapReduce a partir do código em R
  • 39. ESTRUTURA 39 ■ Foco nos objetivos de negócio CAMADA DE INFORMAÇÃO DADOS DESESTRU- TURADOS CAMADA DE APLICAÇÃO
  • 40. 40 ESTRUTURA ■ Foco nos objetivos de negócio ■ Engajamento constante dos stakeholders CAMADA DE INFORMAÇÃO DADOS DESESTRU- TURADOS CAMADA DE APLICAÇÃO 40
  • 41. 41 ESTRUTURA ■ Foco nos objetivos de negócio ■ Engajamento constante dos stakeholders ■ Implementação em fatias verticais, da extração de dados às aplicações CAMADA DE INFORMAÇÃO DADOS DESESTRU- TURADOS CAMADA DE APLICAÇÃO 41
  • 42. 42 ESTRUTURA ■ Foco nos objetivos de negócio ■ Engajamento constante dos stakeholders ■ Implementação em fatias verticais, da extração de dados às aplicações ■ Ingestão incremental de dados, com capacidade real time CAMADA DE INFORMAÇÃO DADOS DESESTRU- TURADOS CAMADA DE APLICAÇÃO 42
  • 43. 43 ESTRUTURA ■ Foco nos objetivos de negócio ■ Engajamento constante dos stakeholders ■ Implementação em fatias verticais, da extração de dados às aplicações ■ Ingestão incremental de dados, com capacidade real time ■ Estruturas de dados de cada fatia adequadas à aplicação CAMADA DE INFORMAÇÃO DADOS DESESTRU- TURADOS CAMADA DE APLICAÇÃO 43
  • 44. 44 ESTRUTURA ■ Foco nos objetivos de negócio ■ Engajamento constante dos stakeholders ■ Implementação em fatias verticais, da extração de dados às aplicações ■ Ingestão incremental de dados, com capacidade real time ■ Estruturas de dados de cada fatia adequadas à aplicação ■ Lógica perto da aplicação CAMADA DE INFORMAÇÃO DADOS DESESTRU- TURADOS CAMADA DE APLICAÇÃO 44
  • 45. 45 ESTRUTURA ■ Foco nos objetivos de negócio ■ Engajamento constante dos stakeholders ■ Implementação em fatias verticais, da extração de dados às aplicações ■ Ingestão incremental de dados, com capacidade real time ■ Estruturas de dados de cada fatia adequadas à aplicação ■ Lógica perto da aplicação ■ Design emergente / “just enough architecture” CAMADA DE INFORMAÇÃO DADOS DESESTRU- TURADOS CAMADA DE APLICAÇÃO 45
  • 49. QUAIS SÃO OS ELEMENTOS? FACILITAÇÃO E ANÁLISE DE NEGÓCIO Facilitação de workshops, identificação de cenários e hipóteses, discussão de premissas e soluções ARQUITETURA E ENGENHARIA DE DADOS Definição de estruturas e modelos de dados, escolha e implementação das tecnologias adequadas DESENVOLVIMENTO
 ÁGIL Análise, desenvolvimento e qualidade de software com métodos ágeis VISUALIZAÇÃO DE DADOS Design colaborativo, prototipação, testes e avaliação de feedbacks para visualização efetiva dos dados CIÊNCIA DE DADOS Criação de modelos que permitam dar o passo de uma abordagem descritiva para uma preditiva. NEGÓCIO E FONTES DE DADOS Conhecimento do negócio e fontes de dados 49
  • 50. POR ONDE COMEÇAR? 50 CIÊNCIA DE DADOS Criação de modelos que permitam dar o passo de uma abordagem descritiva para uma preditiva. OPEN SOURCE
  • 53. O QUE É MACHINE LEARNING? 53
  • 54. ABORDAGEM DE REGRAS 54 8 Abordagem de regras? Cores? Tipo de costura? Tamanho? ...
  • 55. ABORDAGEM DE ANALYTICS AVANÇADO 55 9 Abordagem de Machine Learning Classificador Treinado a partir de conjunto conhecido (supervisionado) Atributos (features) Resposta (label/target/output)
  • 56. ABORDAGEM DE ANALYTICS AVANÇADO 56 10 Abordagem de Machine Learning Classificador Algoritmos encontram padrões nas amostras conhecidas Atributos (features) Resposta (label/target/output)
  • 57. ABORDAGEM DE ANALYTICS AVANÇADO 57 12 ● árvore de decisão??? ● rede neural ● regressão linear ● ensemble ● ... Possíveis Classificadores ClassificadorAtributos (features) Resposta (label/target/output)
  • 59. MARÍLIA JOGA TÊNIS? 59 15 João joga tênis? Tempo Umidade Vento ... Não joga Joga Árvore de Decisão
  • 60. 60 # Dia Tempo Umidade Vento Joga? 1 Ensolarado Alta Fraco Não 2 Ensolarado Alta Fraco Não 3 Nublado Alta Fraco Sim 4 Chuvoso Alta Forte Sim 5 Chuvoso Normal Fraco Sim 6 Chuvoso Normal Forte Sim 7 Nublado Normal Forte Sim 8 Ensolarado Alta Fraco Não 9 Ensolarado Normal Fraco Sim 10 Chuvoso Normal Fraco Sim 11 Ensolarado Normal Forte Sim 12 Nublado Alta Forte Sim 13 Nublado Normal Fraco Sim 14 Chuvoso Alta Forte Não 2 semanas de João joga tên 2 semanas de Janeiro
  • 61. 61 17 Tempo Ensolarado Nublado Chuvoso Umidade Vento Joga Alta Normal Joga Forte Fraco Não Joga JogaNão Joga Árvore de Decisão
  • 62. 62 # Dia Tempo Umidade Vento Joga? 1 Nublado Alta Fraco Sim 2 Ensolarado Alta Forte Não 3 Ensolarado Alta Fraco Não 4 Chuvoso Normal Fraco Sim 5 Chuvoso Alta Fraco Sim 6 Chuvoso Normal Forte Não 7 Nublado Alta Forte Sim 8 Chuvoso Alta Forte Não 9 Ensolarado Normal Fraco Sim 10 Chuvoso Alta Fraco Sim 11 Nublado Normal Fraco Não 12 Nublado Alta Forte Sim 13 Nublado Alta Fraco Sim 14 Ensolarado Alta Fraco Não 2 semanas d João joga tên 2 semanas de Julho
  • 63. 63 19 Árvore de Decisão Tempo Ensolarado Nublado Chuvoso Umidade NormalAlta JogaNão Joga Umidade NormalAlta Joga Não Joga Vento NormalFraco Joga Não Joga
  • 64. 64 20 Sub-conjuntos (im)puros Tempo Ensolarado Nublado Chuvoso Umidade Vento 0 / 4 Profundidade = 2 Puro 3 / 2 Impuro 2 / 3 Impuro
  • 68. COMO COMPARAR DESEMPENHO? 68 Como comparar desempenho? Palpite do Classificador ClassificaçãoReal Joga Joga Não Joga NãoJoga Verdadeiro Positivo (TP) Verdadeiro Negativo (TN) False Negativo (FN) False Positivo (FP) Matriz de Confusão
  • 69. COMO COMPARAR DESEMPENHO? 69 25 Como comparar desempenho? Palpite do Classificador ClassificaçãoReal Joga Joga Não Joga NãoJoga Verdadeiro Positivo (TP) Verdadeiro Negativo (TN) False Negativo (FN) False Positivo (FP) Precisão = TP TP + FP Recall = TP TP + FN Acurácia = TP + TN Total F1 Score = 2 . Precisão . Recall Precisão + Recall
  • 71. EVOLUÇÃO: MODELOS ENSEMBLE 71 Em qual atleta eu posso apostar na final do US Open?
  • 72. OPINIÃO 1 72 Opinião 1 29 No passado, ele teve êxito em 68% de seus palpites Conhece bem o esporte … mas tendencioso Não é imparcial
  • 73. OPINIÃO 2 73 Opinião 2 30 Acompanha apostas há 10 anos Estuda atletas individualmente Excelência em apostas esportivas No passado, ela teve êxito em 73% de seus palpites Ⓡ
  • 74. OPINIÃO 3 74 Opinião 3 31 Mais afinidade com atletas mulheres Desconhece atletas novos Não vem acompanhando o esporte No passado, ela teve êxito em 70% de seus palpites
  • 75. OPINIÃO 4 75 Opinião 4 32 ... No passado, ela teve êxito em 62% de seus palpites
  • 76. COMBINAÇÃO DOS PALPITES 76 Combinação das Avaliações = 1 - (68% x 73% x 70% x 62%) = 79% de acurácia Guga Empresa Sharapova Galvão Correlacionados Acurácia 33 Ⓡ
  • 77. MODELO ENSEMBLE 77 Modelos Ensemble Classificador 1 Classificador 2 Classificador 3 Classificador 4 Classificador N Hipótese Coletiva Classificador Ensemble 34 H1 H2 H3 H4 HN
  • 79. CLASSIFICADORES 79 Classificadores Árvore de Decisão 1 Árvore de Decisão 2 Árvore de Decisão 3 Árvore de Decisão 4 Árvore de Decisão N Algoritmos da mesma natureza SVM Árvore de Decisão Rede Neural Deep Learner Regressor Linear Diversidade de Algoritmos 36
  • 80. CLASSIFICADORES 80 PositivoNegativo Hipótese Coletiva Classificadores Árvore de Decisão 1 Árvore de Decisão 2 Árvore de Decisão 3 Árvore de Decisão 4 Árvore de Decisão N +1 +1 -1 -1 -1 SVM Árvore de Decisão Rede Neural Deep Learner Regressor Linear +2 -1 +3 -1 -1 37
  • 81. CLASSIFICADORES 81 38 Hipótese Coletiva: -1 Hipótese Coletiva: +2 Árvore de Decisão 1 Árvore de Decisão 2 Árvore de Decisão 3 Árvore de Decisão 4 Árvore de Decisão N +1 +1 -1 -1 -1 SVM Árvore de Decisão Rede Neural Deep Learner Regressor Linear +2 -1 +3 -1 -1 Classificadores
  • 83. AGILE ANALYTICS 83 Árvore de Decisão Regressão Linear
  • 84. AGILE ANALYTICS 84 Árvore de Decisão Regressão Linear Rede Neural
  • 85. AGILE ANALYTICS 85 Árvore de Decisão Regressão Linear Rede Neural Modelo Ensemble
  • 90. ESTÓRIAS DE USUÁRIOS 90 Como um <papel> Eu quero <objetivo> Para então <valor>
  • 93. OUTRAS PRÁTICAS 93 ✴ Stand-ups ✴ Showcases ✴ Atividades de Team Building ✴ Retrospectivas Semanais