SlideShare une entreprise Scribd logo
1  sur  36
CASE: O POSTGRESQL EM BI
Milhares de operações diárias consolidadas "near-real-time"
PGDay Campinas 2014 www.object.com.br 1
Wagner Correa Ramos
Anderson Massaharu Shibata
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Roteiro
 Apresentação da empresa do “CASE”
 Requisitos do projeto de BI
 Origem dos dados
 Modelo de dados do BI
 Escolha do SGBD (PostgreSQL)
 Tecnologia para a integração dos dados
 Tecnologias usadas
 Resultados
 Futuro
PGDay Campinas 2014 www.object.com.br 2
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Requisitos do projeto de BI
 Aumentar velocidade da informação
para a prevenção de problemas
 Disponibilidade destas informações
dentro e fora da empresa
 Foco em qualidade dos dados
 Usabilidade
 Dados para futuras pesquisas
PGDay Campinas 2014 www.object.com.br 3
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Origem dos dados
 Cadastros (ERP)
 Vendas
 PDV (MySQL)
 ERP (PostgreSQL)
 Compras (ERP)
 Despesas (ERP)
 Metas (Excel)
 Vendas, Compras, Despesas
 RH (WS)
PGDay Campinas 2014 www.object.com.br 4
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Modelo de dados do BI
 Primeira tentativa
 Compras e Vendas: Tabela única com totais
por loja, mercadoria, ano, mes, dia e hora
 Problema de desempenho nas consultas e
na qualidade dos dados
PGDay Campinas 2014 www.object.com.br 5
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Modelo de dados do BI
PGDay Campinas 2014 www.object.com.br 6
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Modelo de dados do BI
 Segunda tentativa
 Compras e Vendas, ainda juntos mas com 3
tabelas (hora/dia/mês)
 Melhor desempenho nas consultas
 Ainda problemas na qualidade dos dados
PGDay Campinas 2014 www.object.com.br 7
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Modelo de dados do BI
 Terceira tentativa
 Nas 2 tentativas iniciais faziamos a
totalização durante a replicação dos dados
dos PDVs para o BI
 Na terceira criamos no BI as tabelas de
cupons e itens de cupons de venda
 Simplificação das transformações
necessárias nos dados entre PDVs e BI
 Qualidade dos dados 100%
PGDay Campinas 2014 www.object.com.br 8
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Modelo de dados do BI
 Modelo desnormalizado x normalizado
 Desempenho de consultas
 Facilidade de consultas
 Manutenção do correto histórico dos dados
em consultas retroativas
 Problema do reaproveitamento de “IDs”
PGDay Campinas 2014 www.object.com.br 9
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Modelo de dados do BI
 Tabelas: 63 – Views: 4
 Volume atual de dados (6/set/14)
 mercadoria: 439.033
 cupom: 9.279.743 (jan/14)
 cupom_item: 33.713.982 (jan/14)
 mercadoria_hora: 153.891.136 (mai/12)
 mercadoria_dia: 58.523.056 (nov/12)
 mercadoria_mes: 9.338.419 (nov/12)
 mercadoria_estoque: 6.452.036 (mai/12)
PGDay Campinas 2014 www.object.com.br 10
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Escolha do SGBD
 Fatores para decisão
 Ferramentas existentes para BI
 Custo
 Facilidade de uso
 Equipe existente
 Evolução
 Gerenciadores considerados
 Oracle
 MS SQLServer
 PostgreSQL
 MySQL
PGDay Campinas 2014 www.object.com.br 11
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Escolha do SGBD
 2012 a 2013 – Oracle e PostgreSQL
 2014 – MySQL e PostgreSQL
 Atual - PostgreSQL
PGDay Campinas 2014 www.object.com.br 12
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Escolha do SGBD
 Algum receio em usar um software open
source como o PostgreSQL ? NÃO
 A rede Shibata usa o PostgreSQL open source
desde 2004 sem NUNCA parar por algum
motivo de bug, etc, no software.
 Alguma motivação para uso de versão
comercial do PostgreSQL ? NÃO
 Para ficar novamente dependente de uma única
empresa ?
 Melhor opção contratar suporte de empresa
nacional especializada no PostgreSQL open
source.
PGDay Campinas 2014 www.object.com.br 13
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
PostgreSQL
 100% de satisfação
 Uso de recursos avançados
 Triggers e funções executando com
excelente desempenho complexas regras
de negócio
 Regras de negócio que se implementadas
em linguagem de programação ficariam
inviáveis devido ao baixo desempenho
PGDay Campinas 2014 www.object.com.br 14
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
PostgreSQL
PGDay Campinas 2014 www.object.com.br 15
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
PostgreSQL
PGDay Campinas 2014 www.object.com.br 16
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
PostgreSQL
PGDay Campinas 2014 www.object.com.br 17
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
PostgreSQL
PGDay Campinas 2014 www.object.com.br 18
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Tecnologia Integração de dados
 O principal requisito para o projeto de BI
foi e continua sendo a alta velocidade
na obtenção de informações
consolidadas
 Escolhemos então uma ferramenta para
garantir a consolidação “near-real-time”
 Outro requisito importante é a
disponibilidade das informações dentro
e fora da empresa
PGDay Campinas 2014 www.object.com.br 19
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Tecnologia Integração de dados
 A rede Shibata utiliza o software
replicador OBJECTMMRS com objetivo
de descentralização
 No projeto BI o objetivo é praticamente
o contrário, queremos a consolidação
dos dados em um único servidor central
PGDay Campinas 2014 www.object.com.br 20
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Tecnologia Integração de dados
 Motivos que levaram à escolha
novamente do OBJECTMMRS
 Compatível com outros SGBDs (Oracle,
SQLServer, MySQL, etc)
 Flexibilidade. Pode-se desenvolver classes
java para realização de transformações de
dados
 Qualidade dos dados
PGDay Campinas 2014 www.object.com.br 21
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Classe customizada
OBJECTMMRS
PGDay Campinas 2014 www.object.com.br 22
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Classe customizada
OBJECTMMRS
PGDay Campinas 2014 www.object.com.br 23
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Tecnologia Integração de dados
PGDay Campinas 2014 www.object.com.br 24
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Tecnologia Integração de dados
PGDay Campinas 2014 www.object.com.br 25
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Tecnologia Integração de dados
PGDay Campinas 2014 www.object.com.br 26
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Tecnologias usadas
 Banco de dados: PostgreSQL 8.x e 9.x
 Replicação e integração:
OBJECTMMRS 6.x e 7.x
 Interface Web do BI: PHP 5.4, Apache
2.2, HTML5
 Webservices BI: Java, Jetty, Restlet
 Desenvolvimento Mobile: Phonegap 3.5
PGDay Campinas 2014 www.object.com.br 27
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Resultados
 Totais de vendas acumulados e
disponíveis para consultas “near-real-
time”
 Informações sobre compras também
disponíveis “near-real-time”
 BI além de mostrar resultados ajuda na
prevenção de problemas (ruptura)
 Informação disponível dentro e fora da
empresa (online e/ou offline)
PGDay Campinas 2014 www.object.com.br 28
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Resultados
PGDay Campinas 2014 www.object.com.br 29
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Resultados
PGDay Campinas 2014 www.object.com.br 30
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Resultados
PGDay Campinas 2014 www.object.com.br 31
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Resultados
PGDay Campinas 2014 www.object.com.br 32
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Resultados
PGDay Campinas 2014 www.object.com.br 33
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Resultados
PGDay Campinas 2014 www.object.com.br 34
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
Futuro
 O volume de dados sendo armazenado
no banco BI é gigantesco. A cada ano
mais de 100 milhões de novas linhas.
 Cluster de Pg x Big Data
 Data mining
 Ferramenta para consultas/gráficos “ad-
hoc”
PGDay Campinas 2014 www.object.com.br 35
CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time"
PGDAY Campinas 2014
 Questões / Comentários
 Obrigado a todos pela presença
 Parabéns à Dextra pela organização do
evento
 Contato
 contato@object.com.br
 www.object.com.br
 Principais projetos de replicação com
OBJECTMMRS
 TJAM, PRODAM, Exército Brasileiro, Shibata
PGDay Campinas 2014 www.object.com.br 36

Contenu connexe

Tendances

Arquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open sourceArquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open sourceFelipe RENZ - MBA TI / Big
 
Bancos de dados analíticos open source
Bancos de dados analíticos open sourceBancos de dados analíticos open source
Bancos de dados analíticos open sourceMatheus Espanhol
 
BIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaBIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaDaniel Checchia
 
Hive vs impala vs spark - tuning
Hive vs impala vs spark - tuningHive vs impala vs spark - tuning
Hive vs impala vs spark - tuningTiago Simões
 
TDC 2014 - Hadoop Hands ON
TDC 2014 - Hadoop Hands ONTDC 2014 - Hadoop Hands ON
TDC 2014 - Hadoop Hands ONThiago Santiago
 
Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014Thiago Santiago
 
Hadoop - Primeiros passos
Hadoop - Primeiros passosHadoop - Primeiros passos
Hadoop - Primeiros passosSensedia
 
Bigdata na pratica: Resolvendo problemas de performance com hadoop
Bigdata na pratica: Resolvendo problemas de performance com hadoopBigdata na pratica: Resolvendo problemas de performance com hadoop
Bigdata na pratica: Resolvendo problemas de performance com hadooptdc-globalcode
 
[Webinar] Performance e otimização de banco de dados MySQL
[Webinar] Performance e otimização de banco de dados MySQL[Webinar] Performance e otimização de banco de dados MySQL
[Webinar] Performance e otimização de banco de dados MySQLKingHost - Hospedagem de sites
 
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big DataDeep Tech Brasil
 
Análise e Caracterização das Novas Ferramentas para Computação em Nuvem
Análise e Caracterização das Novas Ferramentas para Computação em NuvemAnálise e Caracterização das Novas Ferramentas para Computação em Nuvem
Análise e Caracterização das Novas Ferramentas para Computação em NuvemOtávio Carvalho
 

Tendances (20)

Arquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open sourceArquitetura para solução Big Data – open source
Arquitetura para solução Big Data – open source
 
Bancos de dados analíticos open source
Bancos de dados analíticos open sourceBancos de dados analíticos open source
Bancos de dados analíticos open source
 
Pgday campinas 2015
Pgday campinas 2015Pgday campinas 2015
Pgday campinas 2015
 
Bi ferramentas olap 1
Bi   ferramentas olap 1Bi   ferramentas olap 1
Bi ferramentas olap 1
 
BIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à PraticaBIGDATA: Da teoria à Pratica
BIGDATA: Da teoria à Pratica
 
Hive vs impala vs spark - tuning
Hive vs impala vs spark - tuningHive vs impala vs spark - tuning
Hive vs impala vs spark - tuning
 
pgDay Campinas – 2015
pgDay Campinas – 2015pgDay Campinas – 2015
pgDay Campinas – 2015
 
TDC 2014 - Hadoop Hands ON
TDC 2014 - Hadoop Hands ONTDC 2014 - Hadoop Hands ON
TDC 2014 - Hadoop Hands ON
 
Oficina Pentaho
Oficina PentahoOficina Pentaho
Oficina Pentaho
 
Treinamento Hadoop - dia2
Treinamento Hadoop - dia2Treinamento Hadoop - dia2
Treinamento Hadoop - dia2
 
Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014Hadoop - Mãos à massa! Qcon2014
Hadoop - Mãos à massa! Qcon2014
 
Hadoop
HadoopHadoop
Hadoop
 
Hadoop - Primeiros passos
Hadoop - Primeiros passosHadoop - Primeiros passos
Hadoop - Primeiros passos
 
Bigdata na pratica: Resolvendo problemas de performance com hadoop
Bigdata na pratica: Resolvendo problemas de performance com hadoopBigdata na pratica: Resolvendo problemas de performance com hadoop
Bigdata na pratica: Resolvendo problemas de performance com hadoop
 
[Webinar] Performance e otimização de banco de dados MySQL
[Webinar] Performance e otimização de banco de dados MySQL[Webinar] Performance e otimização de banco de dados MySQL
[Webinar] Performance e otimização de banco de dados MySQL
 
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
[DTC21] Lucas Gomes - Do 0 ao 100 no Big Data
 
Análise e Caracterização das Novas Ferramentas para Computação em Nuvem
Análise e Caracterização das Novas Ferramentas para Computação em NuvemAnálise e Caracterização das Novas Ferramentas para Computação em Nuvem
Análise e Caracterização das Novas Ferramentas para Computação em Nuvem
 
Treinamento hadoop - dia3
Treinamento hadoop - dia3Treinamento hadoop - dia3
Treinamento hadoop - dia3
 
Seminário Hadoop
Seminário HadoopSeminário Hadoop
Seminário Hadoop
 
Big Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro SparkBig Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro Spark
 

En vedette

PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoAmbiente Livre
 
PostgreSQL Tuning: O elefante mais rápido que um leopardo
PostgreSQL Tuning: O elefante mais rápido que um leopardoPostgreSQL Tuning: O elefante mais rápido que um leopardo
PostgreSQL Tuning: O elefante mais rápido que um leopardoFabio Telles Rodriguez
 
Gerenciamento de Backup e Recovery com o Barman
Gerenciamento de Backup e Recovery com o BarmanGerenciamento de Backup e Recovery com o Barman
Gerenciamento de Backup e Recovery com o BarmanCaio Oliveira
 
Jaime Casanova - Domando a la bestia Replicación
Jaime Casanova - Domando a la bestia ReplicaciónJaime Casanova - Domando a la bestia Replicación
Jaime Casanova - Domando a la bestia ReplicaciónPGDay Campinas
 
PGDay Campinas 2013 - Mineração de Dados com MADlib
PGDay Campinas 2013 - Mineração de Dados com MADlibPGDay Campinas 2013 - Mineração de Dados com MADlib
PGDay Campinas 2013 - Mineração de Dados com MADlibPGDay Campinas
 
PGDay Campinas 2013 - Window Function e CTE – Surpreendente
PGDay Campinas 2013 - Window Function e CTE – SurpreendentePGDay Campinas 2013 - Window Function e CTE – Surpreendente
PGDay Campinas 2013 - Window Function e CTE – SurpreendentePGDay Campinas
 
Palestra Diogo Rubert - PGDAY Campinas 2015
Palestra Diogo Rubert - PGDAY Campinas 2015Palestra Diogo Rubert - PGDAY Campinas 2015
Palestra Diogo Rubert - PGDAY Campinas 2015Diogo L. V. G. Rubert
 
PGDay Campinas 2013 - PL/pg…ETL – Transformação de dados para DW e BI usando ...
PGDay Campinas 2013 - PL/pg…ETL – Transformação de dados para DW e BI usando ...PGDay Campinas 2013 - PL/pg…ETL – Transformação de dados para DW e BI usando ...
PGDay Campinas 2013 - PL/pg…ETL – Transformação de dados para DW e BI usando ...PGDay Campinas
 
PGDay Campinas 2013 - Como Full Text Search pode ajudar na busca textual
PGDay Campinas 2013 - Como Full Text Search pode ajudar na busca textualPGDay Campinas 2013 - Como Full Text Search pode ajudar na busca textual
PGDay Campinas 2013 - Como Full Text Search pode ajudar na busca textualPGDay Campinas
 
PGDay Campinas 2013 - Implementando o PostgreSQL de maneira escalável e com a...
PGDay Campinas 2013 - Implementando o PostgreSQL de maneira escalável e com a...PGDay Campinas 2013 - Implementando o PostgreSQL de maneira escalável e com a...
PGDay Campinas 2013 - Implementando o PostgreSQL de maneira escalável e com a...PGDay Campinas
 
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0Marcos William Valentini
 
PGDay Campinas 2013 - Postgres XC @ Cloud
PGDay Campinas 2013 - Postgres XC @ CloudPGDay Campinas 2013 - Postgres XC @ Cloud
PGDay Campinas 2013 - Postgres XC @ CloudPGDay Campinas
 
PGDay Campinas 2013 - CASE: PostgreSQL no Tribunal de Justiça do Paraná
PGDay Campinas 2013 - CASE: PostgreSQL no Tribunal de Justiça do ParanáPGDay Campinas 2013 - CASE: PostgreSQL no Tribunal de Justiça do Paraná
PGDay Campinas 2013 - CASE: PostgreSQL no Tribunal de Justiça do ParanáPGDay Campinas
 
DevOps & PostgreSQL - Provisionamento Ágil
DevOps & PostgreSQL - Provisionamento ÁgilDevOps & PostgreSQL - Provisionamento Ágil
DevOps & PostgreSQL - Provisionamento Ágilinstructbr
 
PGDAY - Palestra PostGIS + PgRouting
PGDAY - Palestra PostGIS + PgRoutingPGDAY - Palestra PostGIS + PgRouting
PGDAY - Palestra PostGIS + PgRoutingJairo de Almeida
 
Ux na vida real deedz
Ux na vida real  deedzUx na vida real  deedz
Ux na vida real deedzDextra
 
PostgreSQL: How to Store Passwords Safely
PostgreSQL: How to Store Passwords SafelyPostgreSQL: How to Store Passwords Safely
PostgreSQL: How to Store Passwords SafelyJuliano Atanazio
 
Greenplum: O banco de dados open source massivamente paralelo baseado em Post...
Greenplum: O banco de dados open source massivamente paralelo baseado em Post...Greenplum: O banco de dados open source massivamente paralelo baseado em Post...
Greenplum: O banco de dados open source massivamente paralelo baseado em Post...PGDay Campinas
 

En vedette (20)

Discos & Cia em PostgreSQL
Discos & Cia em PostgreSQLDiscos & Cia em PostgreSQL
Discos & Cia em PostgreSQL
 
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
 
Postgres Tuning
Postgres TuningPostgres Tuning
Postgres Tuning
 
PostgreSQL Tuning: O elefante mais rápido que um leopardo
PostgreSQL Tuning: O elefante mais rápido que um leopardoPostgreSQL Tuning: O elefante mais rápido que um leopardo
PostgreSQL Tuning: O elefante mais rápido que um leopardo
 
Gerenciamento de Backup e Recovery com o Barman
Gerenciamento de Backup e Recovery com o BarmanGerenciamento de Backup e Recovery com o Barman
Gerenciamento de Backup e Recovery com o Barman
 
Jaime Casanova - Domando a la bestia Replicación
Jaime Casanova - Domando a la bestia ReplicaciónJaime Casanova - Domando a la bestia Replicación
Jaime Casanova - Domando a la bestia Replicación
 
PGDay Campinas 2013 - Mineração de Dados com MADlib
PGDay Campinas 2013 - Mineração de Dados com MADlibPGDay Campinas 2013 - Mineração de Dados com MADlib
PGDay Campinas 2013 - Mineração de Dados com MADlib
 
PGDay Campinas 2013 - Window Function e CTE – Surpreendente
PGDay Campinas 2013 - Window Function e CTE – SurpreendentePGDay Campinas 2013 - Window Function e CTE – Surpreendente
PGDay Campinas 2013 - Window Function e CTE – Surpreendente
 
Palestra Diogo Rubert - PGDAY Campinas 2015
Palestra Diogo Rubert - PGDAY Campinas 2015Palestra Diogo Rubert - PGDAY Campinas 2015
Palestra Diogo Rubert - PGDAY Campinas 2015
 
PGDay Campinas 2013 - PL/pg…ETL – Transformação de dados para DW e BI usando ...
PGDay Campinas 2013 - PL/pg…ETL – Transformação de dados para DW e BI usando ...PGDay Campinas 2013 - PL/pg…ETL – Transformação de dados para DW e BI usando ...
PGDay Campinas 2013 - PL/pg…ETL – Transformação de dados para DW e BI usando ...
 
PGDay Campinas 2013 - Como Full Text Search pode ajudar na busca textual
PGDay Campinas 2013 - Como Full Text Search pode ajudar na busca textualPGDay Campinas 2013 - Como Full Text Search pode ajudar na busca textual
PGDay Campinas 2013 - Como Full Text Search pode ajudar na busca textual
 
PGDay Campinas 2013 - Implementando o PostgreSQL de maneira escalável e com a...
PGDay Campinas 2013 - Implementando o PostgreSQL de maneira escalável e com a...PGDay Campinas 2013 - Implementando o PostgreSQL de maneira escalável e com a...
PGDay Campinas 2013 - Implementando o PostgreSQL de maneira escalável e com a...
 
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
Pgday Campinas 2015 - Uma visão do PPAS 9.4 e PEM 5.0
 
PGDay Campinas 2013 - Postgres XC @ Cloud
PGDay Campinas 2013 - Postgres XC @ CloudPGDay Campinas 2013 - Postgres XC @ Cloud
PGDay Campinas 2013 - Postgres XC @ Cloud
 
PGDay Campinas 2013 - CASE: PostgreSQL no Tribunal de Justiça do Paraná
PGDay Campinas 2013 - CASE: PostgreSQL no Tribunal de Justiça do ParanáPGDay Campinas 2013 - CASE: PostgreSQL no Tribunal de Justiça do Paraná
PGDay Campinas 2013 - CASE: PostgreSQL no Tribunal de Justiça do Paraná
 
DevOps & PostgreSQL - Provisionamento Ágil
DevOps & PostgreSQL - Provisionamento ÁgilDevOps & PostgreSQL - Provisionamento Ágil
DevOps & PostgreSQL - Provisionamento Ágil
 
PGDAY - Palestra PostGIS + PgRouting
PGDAY - Palestra PostGIS + PgRoutingPGDAY - Palestra PostGIS + PgRouting
PGDAY - Palestra PostGIS + PgRouting
 
Ux na vida real deedz
Ux na vida real  deedzUx na vida real  deedz
Ux na vida real deedz
 
PostgreSQL: How to Store Passwords Safely
PostgreSQL: How to Store Passwords SafelyPostgreSQL: How to Store Passwords Safely
PostgreSQL: How to Store Passwords Safely
 
Greenplum: O banco de dados open source massivamente paralelo baseado em Post...
Greenplum: O banco de dados open source massivamente paralelo baseado em Post...Greenplum: O banco de dados open source massivamente paralelo baseado em Post...
Greenplum: O banco de dados open source massivamente paralelo baseado em Post...
 

Similaire à CASE: O PostgreSQL em BI: Milhares de operações diárias consolidadas em "near-real-time"

Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Cicero Joasyo Mateus de Moura
 
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Cicero Joasyo Mateus de Moura
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Denodo
 
Trabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado FinanceiroTrabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado FinanceiroMarco Garcia
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoHélio Silva
 
Webinar: Como obter valor comercial com Big Data
Webinar: Como obter valor comercial com Big DataWebinar: Como obter valor comercial com Big Data
Webinar: Como obter valor comercial com Big DataAmazon Web Services LATAM
 
[GetNinjas] Business Intelligence Workshop @ Google Campus SP
[GetNinjas] Business Intelligence Workshop @ Google Campus SP[GetNinjas] Business Intelligence Workshop @ Google Campus SP
[GetNinjas] Business Intelligence Workshop @ Google Campus SPBernardo Srulzon
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...Diego Nogare
 
TDC São Paulo Online 2020 - trilha Big Data
TDC São Paulo Online 2020 - trilha Big DataTDC São Paulo Online 2020 - trilha Big Data
TDC São Paulo Online 2020 - trilha Big DataEduardo Hahn
 
Cenário das Plataformas de Dados 2017/2018
Cenário das Plataformas de Dados 2017/2018Cenário das Plataformas de Dados 2017/2018
Cenário das Plataformas de Dados 2017/2018Raul Oliveira
 
Introdução ao Google Cloud Platform: Computação em Nuvem do Google
Introdução ao Google Cloud Platform: Computação em Nuvem do GoogleIntrodução ao Google Cloud Platform: Computação em Nuvem do Google
Introdução ao Google Cloud Platform: Computação em Nuvem do GoogleJose Papo, MSc
 
Google BigQuery - Introdução
Google BigQuery - IntroduçãoGoogle BigQuery - Introdução
Google BigQuery - IntroduçãoJose Papo, MSc
 
ABC da Aprendizagem de Máquinas
ABC da Aprendizagem de MáquinasABC da Aprendizagem de Máquinas
ABC da Aprendizagem de MáquinasDiego Nogare
 
Integrando Azure Machine Learning na prática
Integrando Azure Machine Learning na práticaIntegrando Azure Machine Learning na prática
Integrando Azure Machine Learning na práticaDiego Nogare
 

Similaire à CASE: O PostgreSQL em BI: Milhares de operações diárias consolidadas em "near-real-time" (20)

Google BigQuery
Google BigQueryGoogle BigQuery
Google BigQuery
 
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
 
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
Escalando a Qualidade de Dados com Great Expectations e Spark no Modern Data ...
 
Big Data na Nuvem
Big Data na NuvemBig Data na Nuvem
Big Data na Nuvem
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?
 
Trabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado FinanceiroTrabalhos Big Data e Algoritmos - Mercado Financeiro
Trabalhos Big Data e Algoritmos - Mercado Financeiro
 
Aula 5
Aula 5 Aula 5
Aula 5
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
Webinar: Como obter valor comercial com Big Data
Webinar: Como obter valor comercial com Big DataWebinar: Como obter valor comercial com Big Data
Webinar: Como obter valor comercial com Big Data
 
Power BI 101
Power BI 101Power BI 101
Power BI 101
 
GUBI: Agile Analytics [pt-br]
GUBI: Agile Analytics [pt-br]GUBI: Agile Analytics [pt-br]
GUBI: Agile Analytics [pt-br]
 
[GetNinjas] Business Intelligence Workshop @ Google Campus SP
[GetNinjas] Business Intelligence Workshop @ Google Campus SP[GetNinjas] Business Intelligence Workshop @ Google Campus SP
[GetNinjas] Business Intelligence Workshop @ Google Campus SP
 
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...
 
TDC São Paulo Online 2020 - trilha Big Data
TDC São Paulo Online 2020 - trilha Big DataTDC São Paulo Online 2020 - trilha Big Data
TDC São Paulo Online 2020 - trilha Big Data
 
Cenário das Plataformas de Dados 2017/2018
Cenário das Plataformas de Dados 2017/2018Cenário das Plataformas de Dados 2017/2018
Cenário das Plataformas de Dados 2017/2018
 
Introdução ao Google Cloud Platform: Computação em Nuvem do Google
Introdução ao Google Cloud Platform: Computação em Nuvem do GoogleIntrodução ao Google Cloud Platform: Computação em Nuvem do Google
Introdução ao Google Cloud Platform: Computação em Nuvem do Google
 
Google BigQuery - Introdução
Google BigQuery - IntroduçãoGoogle BigQuery - Introdução
Google BigQuery - Introdução
 
ABC da Aprendizagem de Máquinas
ABC da Aprendizagem de MáquinasABC da Aprendizagem de Máquinas
ABC da Aprendizagem de Máquinas
 
Integrando Azure Machine Learning na prática
Integrando Azure Machine Learning na práticaIntegrando Azure Machine Learning na prática
Integrando Azure Machine Learning na prática
 
Gestão Empresarial Integrada
Gestão Empresarial IntegradaGestão Empresarial Integrada
Gestão Empresarial Integrada
 

CASE: O PostgreSQL em BI: Milhares de operações diárias consolidadas em "near-real-time"

  • 1. CASE: O POSTGRESQL EM BI Milhares de operações diárias consolidadas "near-real-time" PGDay Campinas 2014 www.object.com.br 1 Wagner Correa Ramos Anderson Massaharu Shibata
  • 2. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Roteiro  Apresentação da empresa do “CASE”  Requisitos do projeto de BI  Origem dos dados  Modelo de dados do BI  Escolha do SGBD (PostgreSQL)  Tecnologia para a integração dos dados  Tecnologias usadas  Resultados  Futuro PGDay Campinas 2014 www.object.com.br 2
  • 3. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Requisitos do projeto de BI  Aumentar velocidade da informação para a prevenção de problemas  Disponibilidade destas informações dentro e fora da empresa  Foco em qualidade dos dados  Usabilidade  Dados para futuras pesquisas PGDay Campinas 2014 www.object.com.br 3
  • 4. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Origem dos dados  Cadastros (ERP)  Vendas  PDV (MySQL)  ERP (PostgreSQL)  Compras (ERP)  Despesas (ERP)  Metas (Excel)  Vendas, Compras, Despesas  RH (WS) PGDay Campinas 2014 www.object.com.br 4
  • 5. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Modelo de dados do BI  Primeira tentativa  Compras e Vendas: Tabela única com totais por loja, mercadoria, ano, mes, dia e hora  Problema de desempenho nas consultas e na qualidade dos dados PGDay Campinas 2014 www.object.com.br 5
  • 6. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Modelo de dados do BI PGDay Campinas 2014 www.object.com.br 6
  • 7. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Modelo de dados do BI  Segunda tentativa  Compras e Vendas, ainda juntos mas com 3 tabelas (hora/dia/mês)  Melhor desempenho nas consultas  Ainda problemas na qualidade dos dados PGDay Campinas 2014 www.object.com.br 7
  • 8. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Modelo de dados do BI  Terceira tentativa  Nas 2 tentativas iniciais faziamos a totalização durante a replicação dos dados dos PDVs para o BI  Na terceira criamos no BI as tabelas de cupons e itens de cupons de venda  Simplificação das transformações necessárias nos dados entre PDVs e BI  Qualidade dos dados 100% PGDay Campinas 2014 www.object.com.br 8
  • 9. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Modelo de dados do BI  Modelo desnormalizado x normalizado  Desempenho de consultas  Facilidade de consultas  Manutenção do correto histórico dos dados em consultas retroativas  Problema do reaproveitamento de “IDs” PGDay Campinas 2014 www.object.com.br 9
  • 10. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Modelo de dados do BI  Tabelas: 63 – Views: 4  Volume atual de dados (6/set/14)  mercadoria: 439.033  cupom: 9.279.743 (jan/14)  cupom_item: 33.713.982 (jan/14)  mercadoria_hora: 153.891.136 (mai/12)  mercadoria_dia: 58.523.056 (nov/12)  mercadoria_mes: 9.338.419 (nov/12)  mercadoria_estoque: 6.452.036 (mai/12) PGDay Campinas 2014 www.object.com.br 10
  • 11. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Escolha do SGBD  Fatores para decisão  Ferramentas existentes para BI  Custo  Facilidade de uso  Equipe existente  Evolução  Gerenciadores considerados  Oracle  MS SQLServer  PostgreSQL  MySQL PGDay Campinas 2014 www.object.com.br 11
  • 12. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Escolha do SGBD  2012 a 2013 – Oracle e PostgreSQL  2014 – MySQL e PostgreSQL  Atual - PostgreSQL PGDay Campinas 2014 www.object.com.br 12
  • 13. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Escolha do SGBD  Algum receio em usar um software open source como o PostgreSQL ? NÃO  A rede Shibata usa o PostgreSQL open source desde 2004 sem NUNCA parar por algum motivo de bug, etc, no software.  Alguma motivação para uso de versão comercial do PostgreSQL ? NÃO  Para ficar novamente dependente de uma única empresa ?  Melhor opção contratar suporte de empresa nacional especializada no PostgreSQL open source. PGDay Campinas 2014 www.object.com.br 13
  • 14. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" PostgreSQL  100% de satisfação  Uso de recursos avançados  Triggers e funções executando com excelente desempenho complexas regras de negócio  Regras de negócio que se implementadas em linguagem de programação ficariam inviáveis devido ao baixo desempenho PGDay Campinas 2014 www.object.com.br 14
  • 15. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" PostgreSQL PGDay Campinas 2014 www.object.com.br 15
  • 16. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" PostgreSQL PGDay Campinas 2014 www.object.com.br 16
  • 17. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" PostgreSQL PGDay Campinas 2014 www.object.com.br 17
  • 18. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" PostgreSQL PGDay Campinas 2014 www.object.com.br 18
  • 19. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Tecnologia Integração de dados  O principal requisito para o projeto de BI foi e continua sendo a alta velocidade na obtenção de informações consolidadas  Escolhemos então uma ferramenta para garantir a consolidação “near-real-time”  Outro requisito importante é a disponibilidade das informações dentro e fora da empresa PGDay Campinas 2014 www.object.com.br 19
  • 20. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Tecnologia Integração de dados  A rede Shibata utiliza o software replicador OBJECTMMRS com objetivo de descentralização  No projeto BI o objetivo é praticamente o contrário, queremos a consolidação dos dados em um único servidor central PGDay Campinas 2014 www.object.com.br 20
  • 21. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Tecnologia Integração de dados  Motivos que levaram à escolha novamente do OBJECTMMRS  Compatível com outros SGBDs (Oracle, SQLServer, MySQL, etc)  Flexibilidade. Pode-se desenvolver classes java para realização de transformações de dados  Qualidade dos dados PGDay Campinas 2014 www.object.com.br 21
  • 22. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Classe customizada OBJECTMMRS PGDay Campinas 2014 www.object.com.br 22
  • 23. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Classe customizada OBJECTMMRS PGDay Campinas 2014 www.object.com.br 23
  • 24. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Tecnologia Integração de dados PGDay Campinas 2014 www.object.com.br 24
  • 25. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Tecnologia Integração de dados PGDay Campinas 2014 www.object.com.br 25
  • 26. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Tecnologia Integração de dados PGDay Campinas 2014 www.object.com.br 26
  • 27. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Tecnologias usadas  Banco de dados: PostgreSQL 8.x e 9.x  Replicação e integração: OBJECTMMRS 6.x e 7.x  Interface Web do BI: PHP 5.4, Apache 2.2, HTML5  Webservices BI: Java, Jetty, Restlet  Desenvolvimento Mobile: Phonegap 3.5 PGDay Campinas 2014 www.object.com.br 27
  • 28. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Resultados  Totais de vendas acumulados e disponíveis para consultas “near-real- time”  Informações sobre compras também disponíveis “near-real-time”  BI além de mostrar resultados ajuda na prevenção de problemas (ruptura)  Informação disponível dentro e fora da empresa (online e/ou offline) PGDay Campinas 2014 www.object.com.br 28
  • 29. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Resultados PGDay Campinas 2014 www.object.com.br 29
  • 30. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Resultados PGDay Campinas 2014 www.object.com.br 30
  • 31. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Resultados PGDay Campinas 2014 www.object.com.br 31
  • 32. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Resultados PGDay Campinas 2014 www.object.com.br 32
  • 33. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Resultados PGDay Campinas 2014 www.object.com.br 33
  • 34. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Resultados PGDay Campinas 2014 www.object.com.br 34
  • 35. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" Futuro  O volume de dados sendo armazenado no banco BI é gigantesco. A cada ano mais de 100 milhões de novas linhas.  Cluster de Pg x Big Data  Data mining  Ferramenta para consultas/gráficos “ad- hoc” PGDay Campinas 2014 www.object.com.br 35
  • 36. CASE: O POSTGRESQL EM BI - Milhares de operações diárias consolidadas "near-real-time" PGDAY Campinas 2014  Questões / Comentários  Obrigado a todos pela presença  Parabéns à Dextra pela organização do evento  Contato  contato@object.com.br  www.object.com.br  Principais projetos de replicação com OBJECTMMRS  TJAM, PRODAM, Exército Brasileiro, Shibata PGDay Campinas 2014 www.object.com.br 36