SlideShare une entreprise Scribd logo
1  sur  12
Big Data



Msc. Mauro C. Pichiliani (pichiliani@uol.com.br)
                 @pichiliani




                                                   1
Explosão de dados
     Twitter:
         1 bilhão de mensagens por semana
         Recorde: 6.939 mensagens por segundo

       WallMart: 1 milhão de transações de cliente por segundo

       Facebook: 40 bilhões de fotos

       IDC: universo digital terá 20 zettabytes de dados em 2020
       1 zettabyte = 1 bilhão de terabyes

       IBM: 2,5 quintilhões de dados por dia
       90% dos dados do mundo criados no últimos 2 anos

                                                                    2
Infográficos




               3
Fontes de dados
   Principais áreas: metereologia, genômica, simulações, biologia,
    pesquisa ambiental, pesquisas na internet, finanças, dados de
    negócios, política, jornalismo e outras
   Origem: dispositivos móveis, sensores, logs de software, câmeras,
    microfones, RFID e redes de sensores
   Produção voluntária: Facebook, Twitter, Linkedin e outras mídias
    sociais
   Produção automática: sensores
   Características: variedades de dados e velocidade de geração
   Nota: dados em excesso não é novidade
   Porém tirar vantagem expressiva ao explorar grandes bases de
    dados é o foco do Big Data
                                                                       4
Hardware?




            5
O que é Big Data?
   Não é um produto, aplicação, plataforma, solução ou mesmo algo
    tangível. Está mais para um conceito. Algumas definições:
   Wikipedia: “(…) big data consists of datasets that grow so large that they
    become awkward to work with using on-hand database management tools.
    Difficulties include capture, storage, search, sharing, analytics, and
    visualizing”
   IBM: “The data that comes from everywhere: from sensors used to gather
    climate information, posts to social media sites, digital pictures and videos
    posted online, transaction records of online purchases, and from cell phone
    GPS”
   Richard Dobbs e Jaques Bugin: “Big data refers to datasets whose size is
    beyond the ability of typical database software tools to capture, store,
    manage and analyze”
   IMPORTANTE: Big Data não é apenas sobre tamanho dos dados!
   Com certeza é uma buzzword!
                                                                                 6
Explicação diática de Big Data
   O vídeo “How big is Big Data?” produzido pela EMC explica com
    desenhos o que é Big Data
   Fonte: http://www.youtube.com/watch?v=qD5S6yZXaVI




                                                                    7
Big Data – possibilidades
    Desbloquear o potencial dos dados
       Análise, mineração, descoberta de tendências, etc
       Visualizações
       Uso estratégico dos dados
    Potencial é superior ao que se tinha antes
    Exemplos:
       Análise de dados do setor de automação residencial
       Análise para campanhas políticas (case do Obama)
       Aprofundamento do foco na pessoa por suas
        preferências (grafo do Facebook)
    Novamente, foco na estratégia
                                                         8
Trabalhando com Big Data
   Resumindo o trabalho a ser feito com Big Data:




                                                     9
Manipulando Big Data
   Muitos argumentos indicando que tecnologias atuais não suportam
    novas tendências




                                                               10
Problemas com o RDBMS




                        11
Conclusão
   Explosão de dados na era atual
   Big Data foca em muitos dados de formatos variados
   Há enorme potencial para estratégias e táticas fundamentais
    para o negócio/aplicação
   Características indicam que RDBMS tradicional não suporta
    Big Data
   Big Table é uma das abordagens que vem se despontando
    para trabalhar com Big Data
   NoSQL classifica abordagens para armazenamento           e
    manipulação de dados de forma diferente dos RDBMS
   Big Data, Big Table e NoSQL são termos em evidência que
    ainda vão ser muito discutidos e analisados
                                                            12

Contenu connexe

Tendances

Tendances (8)

Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados Massivos
 
Big data
Big dataBig data
Big data
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro Wanderley
 
Bigdata alexandre v2
Bigdata alexandre v2Bigdata alexandre v2
Bigdata alexandre v2
 
BigData
BigDataBigData
BigData
 
Business intelligence e Bigdata
Business intelligence e BigdataBusiness intelligence e Bigdata
Business intelligence e Bigdata
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATA
 
Big Data e oportunidades de negócios
Big Data e oportunidades de negóciosBig Data e oportunidades de negócios
Big Data e oportunidades de negócios
 

Similaire à BigData

Tendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big dataTendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big data
cictec
 
Texto - 3º cictec - Big Data.docx
Texto -  3º cictec - Big Data.docxTexto -  3º cictec - Big Data.docx
Texto - 3º cictec - Big Data.docx
cictec
 
15.03.26 big data os novos desafios para o profissional da informação
15.03.26   big data os novos desafios para o profissional da informação15.03.26   big data os novos desafios para o profissional da informação
15.03.26 big data os novos desafios para o profissional da informação
Talita Lima
 

Similaire à BigData (20)

BIG DATA
BIG DATABIG DATA
BIG DATA
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
 
BIG DATA
BIG DATA BIG DATA
BIG DATA
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big data
 
Tendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big dataTendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big data
 
Mma playbook-bigdata 2018-pt
Mma playbook-bigdata 2018-ptMma playbook-bigdata 2018-pt
Mma playbook-bigdata 2018-pt
 
9 motivos para aprender small data
9 motivos para aprender small data9 motivos para aprender small data
9 motivos para aprender small data
 
Texto - 3º cictec - Big Data.docx
Texto -  3º cictec - Big Data.docxTexto -  3º cictec - Big Data.docx
Texto - 3º cictec - Big Data.docx
 
Big Data e profissionais da informação
Big Data e profissionais da informaçãoBig Data e profissionais da informação
Big Data e profissionais da informação
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 
Analisando qual região mais fala sobre política no Twitter utilizando a arqui...
Analisando qual região mais fala sobre política no Twitter utilizando a arqui...Analisando qual região mais fala sobre política no Twitter utilizando a arqui...
Analisando qual região mais fala sobre política no Twitter utilizando a arqui...
 
Hackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big DataHackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big Data
 
The big data theory sap spectrum
The big data theory   sap spectrumThe big data theory   sap spectrum
The big data theory sap spectrum
 
Desmistificando o Big Data
Desmistificando o Big DataDesmistificando o Big Data
Desmistificando o Big Data
 
Palestra do BI ao Big Data
Palestra do BI ao Big DataPalestra do BI ao Big Data
Palestra do BI ao Big Data
 
BigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdfBigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdf
 
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...A importância das APIs públicas e Big Data no universo da comunicação (Jornal...
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...
 
15.03.26 big data os novos desafios para o profissional da informação
15.03.26   big data os novos desafios para o profissional da informação15.03.26   big data os novos desafios para o profissional da informação
15.03.26 big data os novos desafios para o profissional da informação
 
Treinamento hadoop - dia1
Treinamento hadoop - dia1Treinamento hadoop - dia1
Treinamento hadoop - dia1
 

Plus de iMasters

Plus de iMasters (20)

O que você precisa saber para modelar bancos de dados NoSQL - Dani Monteiro
O que você precisa saber para modelar bancos de dados NoSQL - Dani MonteiroO que você precisa saber para modelar bancos de dados NoSQL - Dani Monteiro
O que você precisa saber para modelar bancos de dados NoSQL - Dani Monteiro
 
Postgres: wanted, beloved or dreaded? - Fabio Telles
Postgres: wanted, beloved or dreaded? - Fabio TellesPostgres: wanted, beloved or dreaded? - Fabio Telles
Postgres: wanted, beloved or dreaded? - Fabio Telles
 
Por que minha query esta lenta? - Suellen Moraes
Por que minha query esta lenta? - Suellen MoraesPor que minha query esta lenta? - Suellen Moraes
Por que minha query esta lenta? - Suellen Moraes
 
Relato das trincheiras: o dia a dia de uma consultoria de banco de dados - Ig...
Relato das trincheiras: o dia a dia de uma consultoria de banco de dados - Ig...Relato das trincheiras: o dia a dia de uma consultoria de banco de dados - Ig...
Relato das trincheiras: o dia a dia de uma consultoria de banco de dados - Ig...
 
ORMs heróis ou vilões dentro da arquitetura de dados? - Otávio gonçalves
ORMs heróis ou vilões dentro da arquitetura de dados? - Otávio gonçalvesORMs heróis ou vilões dentro da arquitetura de dados? - Otávio gonçalves
ORMs heróis ou vilões dentro da arquitetura de dados? - Otávio gonçalves
 
SQL e NoSQL trabalhando juntos: uma comparação para obter o melhor de ambos -...
SQL e NoSQL trabalhando juntos: uma comparação para obter o melhor de ambos -...SQL e NoSQL trabalhando juntos: uma comparação para obter o melhor de ambos -...
SQL e NoSQL trabalhando juntos: uma comparação para obter o melhor de ambos -...
 
Arquitetando seus dados na prática para a LGPD - Alessandra Martins
Arquitetando seus dados na prática para a LGPD - Alessandra MartinsArquitetando seus dados na prática para a LGPD - Alessandra Martins
Arquitetando seus dados na prática para a LGPD - Alessandra Martins
 
O papel do DBA no mundo de ciência de dados e machine learning - Mauro Pichil...
O papel do DBA no mundo de ciência de dados e machine learning - Mauro Pichil...O papel do DBA no mundo de ciência de dados e machine learning - Mauro Pichil...
O papel do DBA no mundo de ciência de dados e machine learning - Mauro Pichil...
 
Desenvolvimento Mobile Híbrido, Nativo ou Web: Quando usá-los - Juliana Chahoud
Desenvolvimento Mobile Híbrido, Nativo ou Web: Quando usá-los - Juliana ChahoudDesenvolvimento Mobile Híbrido, Nativo ou Web: Quando usá-los - Juliana Chahoud
Desenvolvimento Mobile Híbrido, Nativo ou Web: Quando usá-los - Juliana Chahoud
 
Use MDD e faça as máquinas trabalharem para você - Andreza Leite
 Use MDD e faça as máquinas trabalharem para você - Andreza Leite Use MDD e faça as máquinas trabalharem para você - Andreza Leite
Use MDD e faça as máquinas trabalharem para você - Andreza Leite
 
Entendendo os porquês do seu servidor - Talita Bernardes
Entendendo os porquês do seu servidor - Talita BernardesEntendendo os porquês do seu servidor - Talita Bernardes
Entendendo os porquês do seu servidor - Talita Bernardes
 
Backend performático além do "coloca mais máquina lá" - Diana Arnos
Backend performático além do "coloca mais máquina lá" - Diana ArnosBackend performático além do "coloca mais máquina lá" - Diana Arnos
Backend performático além do "coloca mais máquina lá" - Diana Arnos
 
Dicas para uma maior performance em APIs REST - Renato Groffe
Dicas para uma maior performance em APIs REST - Renato GroffeDicas para uma maior performance em APIs REST - Renato Groffe
Dicas para uma maior performance em APIs REST - Renato Groffe
 
7 dicas de desempenho que equivalem por 21 - Danielle Monteiro
7 dicas de desempenho que equivalem por 21 - Danielle Monteiro7 dicas de desempenho que equivalem por 21 - Danielle Monteiro
7 dicas de desempenho que equivalem por 21 - Danielle Monteiro
 
Quem se importa com acessibilidade Web? - Mauricio Maujor
Quem se importa com acessibilidade Web? - Mauricio MaujorQuem se importa com acessibilidade Web? - Mauricio Maujor
Quem se importa com acessibilidade Web? - Mauricio Maujor
 
Service Mesh com Istio e Kubernetes - Wellington Figueira da Silva
Service Mesh com Istio e Kubernetes - Wellington Figueira da SilvaService Mesh com Istio e Kubernetes - Wellington Figueira da Silva
Service Mesh com Istio e Kubernetes - Wellington Figueira da Silva
 
Erros: Como eles vivem, se alimentam e se reproduzem? - Augusto Pascutti
Erros: Como eles vivem, se alimentam e se reproduzem? - Augusto PascuttiErros: Como eles vivem, se alimentam e se reproduzem? - Augusto Pascutti
Erros: Como eles vivem, se alimentam e se reproduzem? - Augusto Pascutti
 
Elasticidade e engenharia de banco de dados para alta performance - Rubens G...
Elasticidade e engenharia de banco de dados para alta performance  - Rubens G...Elasticidade e engenharia de banco de dados para alta performance  - Rubens G...
Elasticidade e engenharia de banco de dados para alta performance - Rubens G...
 
Construindo aplicações mais confiantes - Carolina Karklis
Construindo aplicações mais confiantes - Carolina KarklisConstruindo aplicações mais confiantes - Carolina Karklis
Construindo aplicações mais confiantes - Carolina Karklis
 
Monitoramento de Aplicações - Felipe Regalgo
Monitoramento de Aplicações - Felipe RegalgoMonitoramento de Aplicações - Felipe Regalgo
Monitoramento de Aplicações - Felipe Regalgo
 

Dernier

Dernier (8)

ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docxATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
 
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docxATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
 
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docxATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
 
Programação Orientada a Objetos - 4 Pilares.pdf
Programação Orientada a Objetos - 4 Pilares.pdfProgramação Orientada a Objetos - 4 Pilares.pdf
Programação Orientada a Objetos - 4 Pilares.pdf
 
Boas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsBoas práticas de programação com Object Calisthenics
Boas práticas de programação com Object Calisthenics
 
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docxATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
 
Padrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploPadrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemplo
 
Luís Kitota AWS Discovery Day Ka Solution.pdf
Luís Kitota AWS Discovery Day Ka Solution.pdfLuís Kitota AWS Discovery Day Ka Solution.pdf
Luís Kitota AWS Discovery Day Ka Solution.pdf
 

BigData

  • 1. Big Data Msc. Mauro C. Pichiliani (pichiliani@uol.com.br) @pichiliani 1
  • 2. Explosão de dados  Twitter:  1 bilhão de mensagens por semana  Recorde: 6.939 mensagens por segundo  WallMart: 1 milhão de transações de cliente por segundo  Facebook: 40 bilhões de fotos  IDC: universo digital terá 20 zettabytes de dados em 2020  1 zettabyte = 1 bilhão de terabyes  IBM: 2,5 quintilhões de dados por dia  90% dos dados do mundo criados no últimos 2 anos 2
  • 4. Fontes de dados  Principais áreas: metereologia, genômica, simulações, biologia, pesquisa ambiental, pesquisas na internet, finanças, dados de negócios, política, jornalismo e outras  Origem: dispositivos móveis, sensores, logs de software, câmeras, microfones, RFID e redes de sensores  Produção voluntária: Facebook, Twitter, Linkedin e outras mídias sociais  Produção automática: sensores  Características: variedades de dados e velocidade de geração  Nota: dados em excesso não é novidade  Porém tirar vantagem expressiva ao explorar grandes bases de dados é o foco do Big Data 4
  • 6. O que é Big Data?  Não é um produto, aplicação, plataforma, solução ou mesmo algo tangível. Está mais para um conceito. Algumas definições:  Wikipedia: “(…) big data consists of datasets that grow so large that they become awkward to work with using on-hand database management tools. Difficulties include capture, storage, search, sharing, analytics, and visualizing”  IBM: “The data that comes from everywhere: from sensors used to gather climate information, posts to social media sites, digital pictures and videos posted online, transaction records of online purchases, and from cell phone GPS”  Richard Dobbs e Jaques Bugin: “Big data refers to datasets whose size is beyond the ability of typical database software tools to capture, store, manage and analyze”  IMPORTANTE: Big Data não é apenas sobre tamanho dos dados!  Com certeza é uma buzzword! 6
  • 7. Explicação diática de Big Data  O vídeo “How big is Big Data?” produzido pela EMC explica com desenhos o que é Big Data  Fonte: http://www.youtube.com/watch?v=qD5S6yZXaVI 7
  • 8. Big Data – possibilidades  Desbloquear o potencial dos dados  Análise, mineração, descoberta de tendências, etc  Visualizações  Uso estratégico dos dados  Potencial é superior ao que se tinha antes  Exemplos:  Análise de dados do setor de automação residencial  Análise para campanhas políticas (case do Obama)  Aprofundamento do foco na pessoa por suas preferências (grafo do Facebook)  Novamente, foco na estratégia 8
  • 9. Trabalhando com Big Data  Resumindo o trabalho a ser feito com Big Data: 9
  • 10. Manipulando Big Data  Muitos argumentos indicando que tecnologias atuais não suportam novas tendências 10
  • 11. Problemas com o RDBMS 11
  • 12. Conclusão  Explosão de dados na era atual  Big Data foca em muitos dados de formatos variados  Há enorme potencial para estratégias e táticas fundamentais para o negócio/aplicação  Características indicam que RDBMS tradicional não suporta Big Data  Big Table é uma das abordagens que vem se despontando para trabalhar com Big Data  NoSQL classifica abordagens para armazenamento e manipulação de dados de forma diferente dos RDBMS  Big Data, Big Table e NoSQL são termos em evidência que ainda vão ser muito discutidos e analisados 12