SlideShare une entreprise Scribd logo
1  sur  12
Big Data



Msc. Mauro C. Pichiliani (pichiliani@uol.com.br)
                 @pichiliani




                                                   1
Explosão de dados
     Twitter:
         1 bilhão de mensagens por semana
         Recorde: 6.939 mensagens por segundo

       WallMart: 1 milhão de transações de cliente por segundo

       Facebook: 40 bilhões de fotos

       IDC: universo digital terá 20 zettabytes de dados em 2020
       1 zettabyte = 1 bilhão de terabyes

       IBM: 2,5 quintilhões de dados por dia
       90% dos dados do mundo criados no últimos 2 anos

                                                                    2
Infográficos




               3
Fontes de dados
   Principais áreas: metereologia, genômica, simulações, biologia,
    pesquisa ambiental, pesquisas na internet, finanças, dados de
    negócios, política, jornalismo e outras
   Origem: dispositivos móveis, sensores, logs de software, câmeras,
    microfones, RFID e redes de sensores
   Produção voluntária: Facebook, Twitter, Linkedin e outras mídias
    sociais
   Produção automática: sensores
   Características: variedades de dados e velocidade de geração
   Nota: dados em excesso não é novidade
   Porém tirar vantagem expressiva ao explorar grandes bases de
    dados é o foco do Big Data
                                                                       4
Hardware?




            5
O que é Big Data?
   Não é um produto, aplicação, plataforma, solução ou mesmo algo
    tangível. Está mais para um conceito. Algumas definições:
   Wikipedia: “(…) big data consists of datasets that grow so large that they
    become awkward to work with using on-hand database management tools.
    Difficulties include capture, storage, search, sharing, analytics, and
    visualizing”
   IBM: “The data that comes from everywhere: from sensors used to gather
    climate information, posts to social media sites, digital pictures and videos
    posted online, transaction records of online purchases, and from cell phone
    GPS”
   Richard Dobbs e Jaques Bugin: “Big data refers to datasets whose size is
    beyond the ability of typical database software tools to capture, store,
    manage and analyze”
   IMPORTANTE: Big Data não é apenas sobre tamanho dos dados!
   Com certeza é uma buzzword!
                                                                                 6
Explicação diática de Big Data
   O vídeo “How big is Big Data?” produzido pela EMC explica com
    desenhos o que é Big Data
   Fonte: http://www.youtube.com/watch?v=qD5S6yZXaVI




                                                                    7
Big Data – possibilidades
    Desbloquear o potencial dos dados
       Análise, mineração, descoberta de tendências, etc
       Visualizações
       Uso estratégico dos dados
    Potencial é superior ao que se tinha antes
    Exemplos:
       Análise de dados do setor de automação residencial
       Análise para campanhas políticas (case do Obama)
       Aprofundamento do foco na pessoa por suas
        preferências (grafo do Facebook)
    Novamente, foco na estratégia
                                                         8
Trabalhando com Big Data
   Resumindo o trabalho a ser feito com Big Data:




                                                     9
Manipulando Big Data
   Muitos argumentos indicando que tecnologias atuais não suportam
    novas tendências




                                                               10
Problemas com o RDBMS




                        11
Conclusão
   Explosão de dados na era atual
   Big Data foca em muitos dados de formatos variados
   Há enorme potencial para estratégias e táticas fundamentais
    para o negócio/aplicação
   Características indicam que RDBMS tradicional não suporta
    Big Data
   Big Table é uma das abordagens que vem se despontando
    para trabalhar com Big Data
   NoSQL classifica abordagens para armazenamento           e
    manipulação de dados de forma diferente dos RDBMS
   Big Data, Big Table e NoSQL são termos em evidência que
    ainda vão ser muito discutidos e analisados
                                                            12

Contenu connexe

Tendances

Tendances (8)

Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados Massivos
 
Big data
Big dataBig data
Big data
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro Wanderley
 
Bigdata alexandre v2
Bigdata alexandre v2Bigdata alexandre v2
Bigdata alexandre v2
 
BigData
BigDataBigData
BigData
 
Business intelligence e Bigdata
Business intelligence e BigdataBusiness intelligence e Bigdata
Business intelligence e Bigdata
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATA
 
Big Data e oportunidades de negócios
Big Data e oportunidades de negóciosBig Data e oportunidades de negócios
Big Data e oportunidades de negócios
 

Similaire à BigData

Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RNMarcos Luiz Lins Filho
 
BIG DATA
BIG DATA BIG DATA
BIG DATA ABEP123
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Arthur Souza
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big dataFelipe Ferraz
 
Tendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big dataTendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big datacictec
 
Mma playbook-bigdata 2018-pt
Mma playbook-bigdata 2018-ptMma playbook-bigdata 2018-pt
Mma playbook-bigdata 2018-ptHandsMobile
 
9 motivos para aprender small data
9 motivos para aprender small data9 motivos para aprender small data
9 motivos para aprender small dataRoberto Oliveira
 
Texto - 3º cictec - Big Data.docx
Texto -  3º cictec - Big Data.docxTexto -  3º cictec - Big Data.docx
Texto - 3º cictec - Big Data.docxcictec
 
Big Data e profissionais da informação
Big Data e profissionais da informaçãoBig Data e profissionais da informação
Big Data e profissionais da informaçãoFabiana Andrade Pereira
 
Analisando qual região mais fala sobre política no Twitter utilizando a arqui...
Analisando qual região mais fala sobre política no Twitter utilizando a arqui...Analisando qual região mais fala sobre política no Twitter utilizando a arqui...
Analisando qual região mais fala sobre política no Twitter utilizando a arqui...Juan Felipe dos Reis Barbosa
 
Hackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big DataHackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big Datainmetrics
 
The big data theory sap spectrum
The big data theory   sap spectrumThe big data theory   sap spectrum
The big data theory sap spectrumFernando Corbi
 
Desmistificando o Big Data
Desmistificando o Big DataDesmistificando o Big Data
Desmistificando o Big DataZipCode
 
BigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdfBigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdfssuserbd3b69
 
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...A importância das APIs públicas e Big Data no universo da comunicação (Jornal...
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...Rafael Sbarai
 
15.03.26 big data os novos desafios para o profissional da informação
15.03.26   big data os novos desafios para o profissional da informação15.03.26   big data os novos desafios para o profissional da informação
15.03.26 big data os novos desafios para o profissional da informaçãoTalita Lima
 

Similaire à BigData (20)

BIG DATA
BIG DATABIG DATA
BIG DATA
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
 
BIG DATA
BIG DATA BIG DATA
BIG DATA
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big data
 
Tendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big dataTendências de inovações para a tecnologia de big data
Tendências de inovações para a tecnologia de big data
 
Mma playbook-bigdata 2018-pt
Mma playbook-bigdata 2018-ptMma playbook-bigdata 2018-pt
Mma playbook-bigdata 2018-pt
 
9 motivos para aprender small data
9 motivos para aprender small data9 motivos para aprender small data
9 motivos para aprender small data
 
Texto - 3º cictec - Big Data.docx
Texto -  3º cictec - Big Data.docxTexto -  3º cictec - Big Data.docx
Texto - 3º cictec - Big Data.docx
 
Big Data e profissionais da informação
Big Data e profissionais da informaçãoBig Data e profissionais da informação
Big Data e profissionais da informação
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 
Analisando qual região mais fala sobre política no Twitter utilizando a arqui...
Analisando qual região mais fala sobre política no Twitter utilizando a arqui...Analisando qual região mais fala sobre política no Twitter utilizando a arqui...
Analisando qual região mais fala sobre política no Twitter utilizando a arqui...
 
Hackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big DataHackathon Inmetrics e Fiap: Desafios do Big Data
Hackathon Inmetrics e Fiap: Desafios do Big Data
 
The big data theory sap spectrum
The big data theory   sap spectrumThe big data theory   sap spectrum
The big data theory sap spectrum
 
Desmistificando o Big Data
Desmistificando o Big DataDesmistificando o Big Data
Desmistificando o Big Data
 
Palestra do BI ao Big Data
Palestra do BI ao Big DataPalestra do BI ao Big Data
Palestra do BI ao Big Data
 
BigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdfBigData-Hekima-Ebook.pdf
BigData-Hekima-Ebook.pdf
 
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...A importância das APIs públicas e Big Data no universo da comunicação (Jornal...
A importância das APIs públicas e Big Data no universo da comunicação (Jornal...
 
15.03.26 big data os novos desafios para o profissional da informação
15.03.26   big data os novos desafios para o profissional da informação15.03.26   big data os novos desafios para o profissional da informação
15.03.26 big data os novos desafios para o profissional da informação
 
Treinamento hadoop - dia1
Treinamento hadoop - dia1Treinamento hadoop - dia1
Treinamento hadoop - dia1
 

Plus de iMasters

O que você precisa saber para modelar bancos de dados NoSQL - Dani Monteiro
O que você precisa saber para modelar bancos de dados NoSQL - Dani MonteiroO que você precisa saber para modelar bancos de dados NoSQL - Dani Monteiro
O que você precisa saber para modelar bancos de dados NoSQL - Dani MonteiroiMasters
 
Postgres: wanted, beloved or dreaded? - Fabio Telles
Postgres: wanted, beloved or dreaded? - Fabio TellesPostgres: wanted, beloved or dreaded? - Fabio Telles
Postgres: wanted, beloved or dreaded? - Fabio TellesiMasters
 
Por que minha query esta lenta? - Suellen Moraes
Por que minha query esta lenta? - Suellen MoraesPor que minha query esta lenta? - Suellen Moraes
Por que minha query esta lenta? - Suellen MoraesiMasters
 
Relato das trincheiras: o dia a dia de uma consultoria de banco de dados - Ig...
Relato das trincheiras: o dia a dia de uma consultoria de banco de dados - Ig...Relato das trincheiras: o dia a dia de uma consultoria de banco de dados - Ig...
Relato das trincheiras: o dia a dia de uma consultoria de banco de dados - Ig...iMasters
 
ORMs heróis ou vilões dentro da arquitetura de dados? - Otávio gonçalves
ORMs heróis ou vilões dentro da arquitetura de dados? - Otávio gonçalvesORMs heróis ou vilões dentro da arquitetura de dados? - Otávio gonçalves
ORMs heróis ou vilões dentro da arquitetura de dados? - Otávio gonçalvesiMasters
 
SQL e NoSQL trabalhando juntos: uma comparação para obter o melhor de ambos -...
SQL e NoSQL trabalhando juntos: uma comparação para obter o melhor de ambos -...SQL e NoSQL trabalhando juntos: uma comparação para obter o melhor de ambos -...
SQL e NoSQL trabalhando juntos: uma comparação para obter o melhor de ambos -...iMasters
 
Arquitetando seus dados na prática para a LGPD - Alessandra Martins
Arquitetando seus dados na prática para a LGPD - Alessandra MartinsArquitetando seus dados na prática para a LGPD - Alessandra Martins
Arquitetando seus dados na prática para a LGPD - Alessandra MartinsiMasters
 
O papel do DBA no mundo de ciência de dados e machine learning - Mauro Pichil...
O papel do DBA no mundo de ciência de dados e machine learning - Mauro Pichil...O papel do DBA no mundo de ciência de dados e machine learning - Mauro Pichil...
O papel do DBA no mundo de ciência de dados e machine learning - Mauro Pichil...iMasters
 
Desenvolvimento Mobile Híbrido, Nativo ou Web: Quando usá-los - Juliana Chahoud
Desenvolvimento Mobile Híbrido, Nativo ou Web: Quando usá-los - Juliana ChahoudDesenvolvimento Mobile Híbrido, Nativo ou Web: Quando usá-los - Juliana Chahoud
Desenvolvimento Mobile Híbrido, Nativo ou Web: Quando usá-los - Juliana ChahoudiMasters
 
Use MDD e faça as máquinas trabalharem para você - Andreza Leite
 Use MDD e faça as máquinas trabalharem para você - Andreza Leite Use MDD e faça as máquinas trabalharem para você - Andreza Leite
Use MDD e faça as máquinas trabalharem para você - Andreza LeiteiMasters
 
Entendendo os porquês do seu servidor - Talita Bernardes
Entendendo os porquês do seu servidor - Talita BernardesEntendendo os porquês do seu servidor - Talita Bernardes
Entendendo os porquês do seu servidor - Talita BernardesiMasters
 
Backend performático além do "coloca mais máquina lá" - Diana Arnos
Backend performático além do "coloca mais máquina lá" - Diana ArnosBackend performático além do "coloca mais máquina lá" - Diana Arnos
Backend performático além do "coloca mais máquina lá" - Diana ArnosiMasters
 
Dicas para uma maior performance em APIs REST - Renato Groffe
Dicas para uma maior performance em APIs REST - Renato GroffeDicas para uma maior performance em APIs REST - Renato Groffe
Dicas para uma maior performance em APIs REST - Renato GroffeiMasters
 
7 dicas de desempenho que equivalem por 21 - Danielle Monteiro
7 dicas de desempenho que equivalem por 21 - Danielle Monteiro7 dicas de desempenho que equivalem por 21 - Danielle Monteiro
7 dicas de desempenho que equivalem por 21 - Danielle MonteiroiMasters
 
Quem se importa com acessibilidade Web? - Mauricio Maujor
Quem se importa com acessibilidade Web? - Mauricio MaujorQuem se importa com acessibilidade Web? - Mauricio Maujor
Quem se importa com acessibilidade Web? - Mauricio MaujoriMasters
 
Service Mesh com Istio e Kubernetes - Wellington Figueira da Silva
Service Mesh com Istio e Kubernetes - Wellington Figueira da SilvaService Mesh com Istio e Kubernetes - Wellington Figueira da Silva
Service Mesh com Istio e Kubernetes - Wellington Figueira da SilvaiMasters
 
Erros: Como eles vivem, se alimentam e se reproduzem? - Augusto Pascutti
Erros: Como eles vivem, se alimentam e se reproduzem? - Augusto PascuttiErros: Como eles vivem, se alimentam e se reproduzem? - Augusto Pascutti
Erros: Como eles vivem, se alimentam e se reproduzem? - Augusto PascuttiiMasters
 
Elasticidade e engenharia de banco de dados para alta performance - Rubens G...
Elasticidade e engenharia de banco de dados para alta performance  - Rubens G...Elasticidade e engenharia de banco de dados para alta performance  - Rubens G...
Elasticidade e engenharia de banco de dados para alta performance - Rubens G...iMasters
 
Construindo aplicações mais confiantes - Carolina Karklis
Construindo aplicações mais confiantes - Carolina KarklisConstruindo aplicações mais confiantes - Carolina Karklis
Construindo aplicações mais confiantes - Carolina KarklisiMasters
 
Monitoramento de Aplicações - Felipe Regalgo
Monitoramento de Aplicações - Felipe RegalgoMonitoramento de Aplicações - Felipe Regalgo
Monitoramento de Aplicações - Felipe RegalgoiMasters
 

Plus de iMasters (20)

O que você precisa saber para modelar bancos de dados NoSQL - Dani Monteiro
O que você precisa saber para modelar bancos de dados NoSQL - Dani MonteiroO que você precisa saber para modelar bancos de dados NoSQL - Dani Monteiro
O que você precisa saber para modelar bancos de dados NoSQL - Dani Monteiro
 
Postgres: wanted, beloved or dreaded? - Fabio Telles
Postgres: wanted, beloved or dreaded? - Fabio TellesPostgres: wanted, beloved or dreaded? - Fabio Telles
Postgres: wanted, beloved or dreaded? - Fabio Telles
 
Por que minha query esta lenta? - Suellen Moraes
Por que minha query esta lenta? - Suellen MoraesPor que minha query esta lenta? - Suellen Moraes
Por que minha query esta lenta? - Suellen Moraes
 
Relato das trincheiras: o dia a dia de uma consultoria de banco de dados - Ig...
Relato das trincheiras: o dia a dia de uma consultoria de banco de dados - Ig...Relato das trincheiras: o dia a dia de uma consultoria de banco de dados - Ig...
Relato das trincheiras: o dia a dia de uma consultoria de banco de dados - Ig...
 
ORMs heróis ou vilões dentro da arquitetura de dados? - Otávio gonçalves
ORMs heróis ou vilões dentro da arquitetura de dados? - Otávio gonçalvesORMs heróis ou vilões dentro da arquitetura de dados? - Otávio gonçalves
ORMs heróis ou vilões dentro da arquitetura de dados? - Otávio gonçalves
 
SQL e NoSQL trabalhando juntos: uma comparação para obter o melhor de ambos -...
SQL e NoSQL trabalhando juntos: uma comparação para obter o melhor de ambos -...SQL e NoSQL trabalhando juntos: uma comparação para obter o melhor de ambos -...
SQL e NoSQL trabalhando juntos: uma comparação para obter o melhor de ambos -...
 
Arquitetando seus dados na prática para a LGPD - Alessandra Martins
Arquitetando seus dados na prática para a LGPD - Alessandra MartinsArquitetando seus dados na prática para a LGPD - Alessandra Martins
Arquitetando seus dados na prática para a LGPD - Alessandra Martins
 
O papel do DBA no mundo de ciência de dados e machine learning - Mauro Pichil...
O papel do DBA no mundo de ciência de dados e machine learning - Mauro Pichil...O papel do DBA no mundo de ciência de dados e machine learning - Mauro Pichil...
O papel do DBA no mundo de ciência de dados e machine learning - Mauro Pichil...
 
Desenvolvimento Mobile Híbrido, Nativo ou Web: Quando usá-los - Juliana Chahoud
Desenvolvimento Mobile Híbrido, Nativo ou Web: Quando usá-los - Juliana ChahoudDesenvolvimento Mobile Híbrido, Nativo ou Web: Quando usá-los - Juliana Chahoud
Desenvolvimento Mobile Híbrido, Nativo ou Web: Quando usá-los - Juliana Chahoud
 
Use MDD e faça as máquinas trabalharem para você - Andreza Leite
 Use MDD e faça as máquinas trabalharem para você - Andreza Leite Use MDD e faça as máquinas trabalharem para você - Andreza Leite
Use MDD e faça as máquinas trabalharem para você - Andreza Leite
 
Entendendo os porquês do seu servidor - Talita Bernardes
Entendendo os porquês do seu servidor - Talita BernardesEntendendo os porquês do seu servidor - Talita Bernardes
Entendendo os porquês do seu servidor - Talita Bernardes
 
Backend performático além do "coloca mais máquina lá" - Diana Arnos
Backend performático além do "coloca mais máquina lá" - Diana ArnosBackend performático além do "coloca mais máquina lá" - Diana Arnos
Backend performático além do "coloca mais máquina lá" - Diana Arnos
 
Dicas para uma maior performance em APIs REST - Renato Groffe
Dicas para uma maior performance em APIs REST - Renato GroffeDicas para uma maior performance em APIs REST - Renato Groffe
Dicas para uma maior performance em APIs REST - Renato Groffe
 
7 dicas de desempenho que equivalem por 21 - Danielle Monteiro
7 dicas de desempenho que equivalem por 21 - Danielle Monteiro7 dicas de desempenho que equivalem por 21 - Danielle Monteiro
7 dicas de desempenho que equivalem por 21 - Danielle Monteiro
 
Quem se importa com acessibilidade Web? - Mauricio Maujor
Quem se importa com acessibilidade Web? - Mauricio MaujorQuem se importa com acessibilidade Web? - Mauricio Maujor
Quem se importa com acessibilidade Web? - Mauricio Maujor
 
Service Mesh com Istio e Kubernetes - Wellington Figueira da Silva
Service Mesh com Istio e Kubernetes - Wellington Figueira da SilvaService Mesh com Istio e Kubernetes - Wellington Figueira da Silva
Service Mesh com Istio e Kubernetes - Wellington Figueira da Silva
 
Erros: Como eles vivem, se alimentam e se reproduzem? - Augusto Pascutti
Erros: Como eles vivem, se alimentam e se reproduzem? - Augusto PascuttiErros: Como eles vivem, se alimentam e se reproduzem? - Augusto Pascutti
Erros: Como eles vivem, se alimentam e se reproduzem? - Augusto Pascutti
 
Elasticidade e engenharia de banco de dados para alta performance - Rubens G...
Elasticidade e engenharia de banco de dados para alta performance  - Rubens G...Elasticidade e engenharia de banco de dados para alta performance  - Rubens G...
Elasticidade e engenharia de banco de dados para alta performance - Rubens G...
 
Construindo aplicações mais confiantes - Carolina Karklis
Construindo aplicações mais confiantes - Carolina KarklisConstruindo aplicações mais confiantes - Carolina Karklis
Construindo aplicações mais confiantes - Carolina Karklis
 
Monitoramento de Aplicações - Felipe Regalgo
Monitoramento de Aplicações - Felipe RegalgoMonitoramento de Aplicações - Felipe Regalgo
Monitoramento de Aplicações - Felipe Regalgo
 

BigData

  • 1. Big Data Msc. Mauro C. Pichiliani (pichiliani@uol.com.br) @pichiliani 1
  • 2. Explosão de dados  Twitter:  1 bilhão de mensagens por semana  Recorde: 6.939 mensagens por segundo  WallMart: 1 milhão de transações de cliente por segundo  Facebook: 40 bilhões de fotos  IDC: universo digital terá 20 zettabytes de dados em 2020  1 zettabyte = 1 bilhão de terabyes  IBM: 2,5 quintilhões de dados por dia  90% dos dados do mundo criados no últimos 2 anos 2
  • 4. Fontes de dados  Principais áreas: metereologia, genômica, simulações, biologia, pesquisa ambiental, pesquisas na internet, finanças, dados de negócios, política, jornalismo e outras  Origem: dispositivos móveis, sensores, logs de software, câmeras, microfones, RFID e redes de sensores  Produção voluntária: Facebook, Twitter, Linkedin e outras mídias sociais  Produção automática: sensores  Características: variedades de dados e velocidade de geração  Nota: dados em excesso não é novidade  Porém tirar vantagem expressiva ao explorar grandes bases de dados é o foco do Big Data 4
  • 6. O que é Big Data?  Não é um produto, aplicação, plataforma, solução ou mesmo algo tangível. Está mais para um conceito. Algumas definições:  Wikipedia: “(…) big data consists of datasets that grow so large that they become awkward to work with using on-hand database management tools. Difficulties include capture, storage, search, sharing, analytics, and visualizing”  IBM: “The data that comes from everywhere: from sensors used to gather climate information, posts to social media sites, digital pictures and videos posted online, transaction records of online purchases, and from cell phone GPS”  Richard Dobbs e Jaques Bugin: “Big data refers to datasets whose size is beyond the ability of typical database software tools to capture, store, manage and analyze”  IMPORTANTE: Big Data não é apenas sobre tamanho dos dados!  Com certeza é uma buzzword! 6
  • 7. Explicação diática de Big Data  O vídeo “How big is Big Data?” produzido pela EMC explica com desenhos o que é Big Data  Fonte: http://www.youtube.com/watch?v=qD5S6yZXaVI 7
  • 8. Big Data – possibilidades  Desbloquear o potencial dos dados  Análise, mineração, descoberta de tendências, etc  Visualizações  Uso estratégico dos dados  Potencial é superior ao que se tinha antes  Exemplos:  Análise de dados do setor de automação residencial  Análise para campanhas políticas (case do Obama)  Aprofundamento do foco na pessoa por suas preferências (grafo do Facebook)  Novamente, foco na estratégia 8
  • 9. Trabalhando com Big Data  Resumindo o trabalho a ser feito com Big Data: 9
  • 10. Manipulando Big Data  Muitos argumentos indicando que tecnologias atuais não suportam novas tendências 10
  • 11. Problemas com o RDBMS 11
  • 12. Conclusão  Explosão de dados na era atual  Big Data foca em muitos dados de formatos variados  Há enorme potencial para estratégias e táticas fundamentais para o negócio/aplicação  Características indicam que RDBMS tradicional não suporta Big Data  Big Table é uma das abordagens que vem se despontando para trabalhar com Big Data  NoSQL classifica abordagens para armazenamento e manipulação de dados de forma diferente dos RDBMS  Big Data, Big Table e NoSQL são termos em evidência que ainda vão ser muito discutidos e analisados 12