SlideShare une entreprise Scribd logo
1  sur  31
Rio de Janeiro, 10 de julho de 2013
www.amtera.com.br
O que é Big Data
● Conjunto de tecnologias para captura,
armazenamento e análise de grandes
volumes de dados;
● Não é uma ideia nova;
● Os três V's:
– Volume
– Velocidade
– Variedade
O que é Big Data
● Definição da Gartner:
– Big Data são ativos de informação de
extremo volume, alta velocidade e
grande diversidade que demandam
formas inovadoras e econômicas de
processamento para melhores
tomadas de decisão e insights.
Volume
● 1.2 ZB de informações foram criadas em 2010 e até
2015 serão 7.9ZB (Fonte: EMC/IDC Extracting Value
from Chaos, June 2011);
● 1 ZB = 1 trilhão de gigabytes;
● Mudança de paradigma, armazenar primeiro e
perguntar depois;
Volume
Velocidade
● Walmart processa mais de 1 milhão de transações de
clientes a cada hora, aproximadamente 2.5 petabytes
de informações;
● A cada minuto (Fonte: DOMO):
– 48h de vídeos são enviados para o YouTube
– 571 novos sites são criados
– Mais de 100 mil tweets são enviados
– 2083 check-ins são realizados via FourSquare
Variedade
● Banco de dados, planilhas, documentos de texto,
audios, vídeos, tweets, dados de sensores, click
streams, arquivos de log, etc.
Veracidade
● 4° V?
● Dado o volume a variedade e
velocidade com que novos dados são
armazenados, você acredita neles?
Big Data
● World Economic Summit, Davos
Switzerland, 2012.
– “Data is a new class of economic asset,
like currency or gold.”
Arquitetura Big Data
● Principais desafios:
– Captura
– Curadoria
– Armazenamento
– Busca
– Compartilhamento
– Análise
– Visualização
Open Source Big Data
● Banco de dados NoSQL (Not Only SQL)
– MongoDB
– Cassandra
– Neo4j
– Virtuoso
– HBase
Open Source Big Data
● Processamento distribuído (Map Reduce)
– Apache Hadoop/HDFS
– Hive
– Impala
– Pig
● Análise
– R
– Pentaho
Big Data na Nuvem
● Recursos computacionais sob demanda,
elástico:
– Armazenamento
– Processamento
– Análise
Exemplo de Arquitetura Big Data
Exemplo de Aplicações Big Data
● Big Science
– LHC possui cerca de 150 milhões de
sensores gerando 40 milhões de
amostras por segundo.
– Com a tecnologia big data o genoma
humano pode ser decodificado em 1
semana, no passado demorou 10 anos.
Exemplo de Aplicações Big Data
● Aplicações Semânticas
– Análise de sentimento
– Extração de relações
– Processamento de linguagem natural (NLP)
– Busca e Recuperação da Informação
– Reconhecimento de padrões
– Aprendizado de máquina (Machine Learning)
Áreas Big Data
● Inteligência de negócios;
● Inteligência competitiva;
● Analytics
Análise Big Data
● Ferramentas especializadas, paradigma
Map Reduce (Hadoop);
● Novos insights e produtos podem ser
desvendados;
● E o mais importante: deve justificar o
investimento em Big Data;
Análise Big Data
● Caso famoso:
– Target, uma loja de departamentos nos
EUA, descobre que adolescente está
grávida antes do pai (Fonte: Forbes)
Investimentos em Big Data
● Inicialmente
– Mão de obra qualificada;
– Infraestrutura na nuvem;
● Ex: Amazon EC2
● A longo prazo
– Gestão / Governança;
– Treinamento de mão de obra;
– Infraestrutura própria?
Investimentos em Big Data
● Levantamento da Frost & Sullivan indica
que o mercado brasileiro representa
quase metade da receita de Big Data da
América Latina. Ele deve crescer 71% de
2012 para 2013, totalizando 576 milhões
em solo nacional, e 33% de 2013 para
2014.
Adoção do Big Data
● Crossing the Chasm;
● O mercado brasileiro é considerado
conservador na aplicação da tecnologia;
Barreiras para adoção do Big Data
● Falta de entendimento sobre o assunto;
● Escassez de profissionais qualificados;
● Preocupações com a privacidade;
● Segurança;
● Alto custo;
Profissionais Big Data
● Data Scientist, exige perfil multidisciplinar:
Data Scientist
● Data Science: Incorpora técnicas e teorias
de várias áreas de estudo como
matemática, estatística, modelagem,
reconhecimento de padrões, aprendizado
de máquina, data warehousing,
visualização de dados, computação de
alto desempenho e busca e recuperação
da informação com o objetivo de extrair
conhecimento e insights para novos
produtos.
Big Data Administrator - BigDBA
● Perfil operacional;
● Foco em escalabilidade;
● Domínio de ferramentas NoSQL;
● Administração dos recursos computacionais;
● Apoio ao sistemas de Big Data;
Big Data Software Engineer
● Arquiteto de soluções Big Data;
● Ecossistema Hadoop;
● Computação distribuída;
● Web Services;
● Aprendizado de máquina;
● Ferramentas NLP;
● Linguagens de programação funcional;
Big Data
● Dúvidas?
Conclusão
● Aproveite a oportunidade, qualifique-se!
● Rio Big Data Meetup, é gratuito.
http://www.meetup.com/Rio-Big-Data-Meetup
Referências
● EMC/IDC Extracting Value from Chaos, June 2011
● http://en.wikipedia.org/wiki/Big_data
● http://en.wikipedia.org/wiki/Data_science
● Crossing the Chasm: Marketing and Selling Disruptive Products to Mainstream Customers,
Geoffrey A. Moore
● http://infocus.emc.com/william_schmarzo/crossing-the-chasm-with-big-data/
● http://mike2.openmethodology.org/
● http://www.gartner.com/it-glossary/big-data/
● https://developers.google.com/bigquery/
● http://www.forbes.com/sites/kashmirhill/2012/02/16/how-target-figured-out-a-teen-girl-was-pregnant-be
● http://en.wikipedia.org/wiki/MapReduce
Rio de Janeiro, 9 de abril de 2013
www.amtera.com.br

Contenu connexe

Tendances

Aula 11 Criatividade e Inovação
Aula 11 Criatividade e InovaçãoAula 11 Criatividade e Inovação
Aula 11 Criatividade e Inovação
Carlos Alves
 

Tendances (20)

Aula 05 Briefing
Aula 05   BriefingAula 05   Briefing
Aula 05 Briefing
 
O que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidasO que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidas
 
Neuromarketing
Neuromarketing Neuromarketing
Neuromarketing
 
Design thinking - Aula 1 MFN 2014 UFRJ/FIRJAN - Bizzie
Design thinking - Aula 1 MFN 2014 UFRJ/FIRJAN - BizzieDesign thinking - Aula 1 MFN 2014 UFRJ/FIRJAN - Bizzie
Design thinking - Aula 1 MFN 2014 UFRJ/FIRJAN - Bizzie
 
Convergência de mídias e narrativa transmídia
Convergência de mídias e narrativa transmídiaConvergência de mídias e narrativa transmídia
Convergência de mídias e narrativa transmídia
 
Propaganda e composto promocional
Propaganda e composto promocionalPropaganda e composto promocional
Propaganda e composto promocional
 
Introdução ao Jornalismo de Dados
Introdução ao Jornalismo de DadosIntrodução ao Jornalismo de Dados
Introdução ao Jornalismo de Dados
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
Criação de Conteúdo Digital
Criação de Conteúdo DigitalCriação de Conteúdo Digital
Criação de Conteúdo Digital
 
Aula 11 Criatividade e Inovação
Aula 11 Criatividade e InovaçãoAula 11 Criatividade e Inovação
Aula 11 Criatividade e Inovação
 
Mercado da Comunicação Digital
Mercado da Comunicação DigitalMercado da Comunicação Digital
Mercado da Comunicação Digital
 
Transformacao digital
Transformacao digitalTransformacao digital
Transformacao digital
 
Narrativas Transmidiáticas
Narrativas TransmidiáticasNarrativas Transmidiáticas
Narrativas Transmidiáticas
 
Dicas básicas sobre LGPD - Lei Geral de Proteção de Dados Pessoais
Dicas básicas sobre LGPD - Lei Geral de Proteção de Dados PessoaisDicas básicas sobre LGPD - Lei Geral de Proteção de Dados Pessoais
Dicas básicas sobre LGPD - Lei Geral de Proteção de Dados Pessoais
 
Canvas do planejamento de comunicação
Canvas do planejamento de comunicaçãoCanvas do planejamento de comunicação
Canvas do planejamento de comunicação
 
Neurovendas - Como vender mais aplicando a neurociência na prática
Neurovendas - Como vender mais aplicando a neurociência na práticaNeurovendas - Como vender mais aplicando a neurociência na prática
Neurovendas - Como vender mais aplicando a neurociência na prática
 
Slide de aula comunicação empresarial und 1
Slide de aula comunicação empresarial und  1Slide de aula comunicação empresarial und  1
Slide de aula comunicação empresarial und 1
 
Aula 1 - Introdução ao marketing
Aula 1 - Introdução ao marketingAula 1 - Introdução ao marketing
Aula 1 - Introdução ao marketing
 
Comunicaçao eficiente em vendas e cobranças.ppt
 Comunicaçao eficiente em vendas e cobranças.ppt  Comunicaçao eficiente em vendas e cobranças.ppt
Comunicaçao eficiente em vendas e cobranças.ppt
 
Inteligência Artificial aplicada a negócios
Inteligência Artificial aplicada a negóciosInteligência Artificial aplicada a negócios
Inteligência Artificial aplicada a negócios
 

Similaire à Palestra Introdução a Big Data

Similaire à Palestra Introdução a Big Data (20)

PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com PentahoPostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
PostgreSQL em projetos de Business Analytics e Big Data Analytics com Pentaho
 
Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTI
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e Tecnologia
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
 
Big Data Latinoware 2014
Big Data Latinoware 2014Big Data Latinoware 2014
Big Data Latinoware 2014
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 
Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre Cientista de Dados – Dominando o Big Data com Software Livre
Cientista de Dados – Dominando o Big Data com Software Livre
 
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e PentahoBig Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...
 
Big Data para Leigos
Big Data para LeigosBig Data para Leigos
Big Data para Leigos
 
Pentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data LakesPentaho Hadoop Big Data e Data Lakes
Pentaho Hadoop Big Data e Data Lakes
 
Treinamento hadoop - dia1
Treinamento hadoop - dia1Treinamento hadoop - dia1
Treinamento hadoop - dia1
 
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - AngolaAula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 
Big Data
Big DataBig Data
Big Data
 
Treinamento hadoop - dia4
Treinamento hadoop - dia4Treinamento hadoop - dia4
Treinamento hadoop - dia4
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?
 
BigData
BigDataBigData
BigData
 

Palestra Introdução a Big Data

  • 1. Rio de Janeiro, 10 de julho de 2013 www.amtera.com.br
  • 2. O que é Big Data ● Conjunto de tecnologias para captura, armazenamento e análise de grandes volumes de dados; ● Não é uma ideia nova; ● Os três V's: – Volume – Velocidade – Variedade
  • 3. O que é Big Data ● Definição da Gartner: – Big Data são ativos de informação de extremo volume, alta velocidade e grande diversidade que demandam formas inovadoras e econômicas de processamento para melhores tomadas de decisão e insights.
  • 4. Volume ● 1.2 ZB de informações foram criadas em 2010 e até 2015 serão 7.9ZB (Fonte: EMC/IDC Extracting Value from Chaos, June 2011); ● 1 ZB = 1 trilhão de gigabytes; ● Mudança de paradigma, armazenar primeiro e perguntar depois;
  • 6. Velocidade ● Walmart processa mais de 1 milhão de transações de clientes a cada hora, aproximadamente 2.5 petabytes de informações; ● A cada minuto (Fonte: DOMO): – 48h de vídeos são enviados para o YouTube – 571 novos sites são criados – Mais de 100 mil tweets são enviados – 2083 check-ins são realizados via FourSquare
  • 7. Variedade ● Banco de dados, planilhas, documentos de texto, audios, vídeos, tweets, dados de sensores, click streams, arquivos de log, etc.
  • 8. Veracidade ● 4° V? ● Dado o volume a variedade e velocidade com que novos dados são armazenados, você acredita neles?
  • 9. Big Data ● World Economic Summit, Davos Switzerland, 2012. – “Data is a new class of economic asset, like currency or gold.”
  • 10. Arquitetura Big Data ● Principais desafios: – Captura – Curadoria – Armazenamento – Busca – Compartilhamento – Análise – Visualização
  • 11. Open Source Big Data ● Banco de dados NoSQL (Not Only SQL) – MongoDB – Cassandra – Neo4j – Virtuoso – HBase
  • 12. Open Source Big Data ● Processamento distribuído (Map Reduce) – Apache Hadoop/HDFS – Hive – Impala – Pig ● Análise – R – Pentaho
  • 13. Big Data na Nuvem ● Recursos computacionais sob demanda, elástico: – Armazenamento – Processamento – Análise
  • 15. Exemplo de Aplicações Big Data ● Big Science – LHC possui cerca de 150 milhões de sensores gerando 40 milhões de amostras por segundo. – Com a tecnologia big data o genoma humano pode ser decodificado em 1 semana, no passado demorou 10 anos.
  • 16. Exemplo de Aplicações Big Data ● Aplicações Semânticas – Análise de sentimento – Extração de relações – Processamento de linguagem natural (NLP) – Busca e Recuperação da Informação – Reconhecimento de padrões – Aprendizado de máquina (Machine Learning)
  • 17. Áreas Big Data ● Inteligência de negócios; ● Inteligência competitiva; ● Analytics
  • 18. Análise Big Data ● Ferramentas especializadas, paradigma Map Reduce (Hadoop); ● Novos insights e produtos podem ser desvendados; ● E o mais importante: deve justificar o investimento em Big Data;
  • 19. Análise Big Data ● Caso famoso: – Target, uma loja de departamentos nos EUA, descobre que adolescente está grávida antes do pai (Fonte: Forbes)
  • 20. Investimentos em Big Data ● Inicialmente – Mão de obra qualificada; – Infraestrutura na nuvem; ● Ex: Amazon EC2 ● A longo prazo – Gestão / Governança; – Treinamento de mão de obra; – Infraestrutura própria?
  • 21. Investimentos em Big Data ● Levantamento da Frost & Sullivan indica que o mercado brasileiro representa quase metade da receita de Big Data da América Latina. Ele deve crescer 71% de 2012 para 2013, totalizando 576 milhões em solo nacional, e 33% de 2013 para 2014.
  • 22. Adoção do Big Data ● Crossing the Chasm; ● O mercado brasileiro é considerado conservador na aplicação da tecnologia;
  • 23. Barreiras para adoção do Big Data ● Falta de entendimento sobre o assunto; ● Escassez de profissionais qualificados; ● Preocupações com a privacidade; ● Segurança; ● Alto custo;
  • 24. Profissionais Big Data ● Data Scientist, exige perfil multidisciplinar:
  • 25. Data Scientist ● Data Science: Incorpora técnicas e teorias de várias áreas de estudo como matemática, estatística, modelagem, reconhecimento de padrões, aprendizado de máquina, data warehousing, visualização de dados, computação de alto desempenho e busca e recuperação da informação com o objetivo de extrair conhecimento e insights para novos produtos.
  • 26. Big Data Administrator - BigDBA ● Perfil operacional; ● Foco em escalabilidade; ● Domínio de ferramentas NoSQL; ● Administração dos recursos computacionais; ● Apoio ao sistemas de Big Data;
  • 27. Big Data Software Engineer ● Arquiteto de soluções Big Data; ● Ecossistema Hadoop; ● Computação distribuída; ● Web Services; ● Aprendizado de máquina; ● Ferramentas NLP; ● Linguagens de programação funcional;
  • 29. Conclusão ● Aproveite a oportunidade, qualifique-se! ● Rio Big Data Meetup, é gratuito. http://www.meetup.com/Rio-Big-Data-Meetup
  • 30. Referências ● EMC/IDC Extracting Value from Chaos, June 2011 ● http://en.wikipedia.org/wiki/Big_data ● http://en.wikipedia.org/wiki/Data_science ● Crossing the Chasm: Marketing and Selling Disruptive Products to Mainstream Customers, Geoffrey A. Moore ● http://infocus.emc.com/william_schmarzo/crossing-the-chasm-with-big-data/ ● http://mike2.openmethodology.org/ ● http://www.gartner.com/it-glossary/big-data/ ● https://developers.google.com/bigquery/ ● http://www.forbes.com/sites/kashmirhill/2012/02/16/how-target-figured-out-a-teen-girl-was-pregnant-be ● http://en.wikipedia.org/wiki/MapReduce
  • 31. Rio de Janeiro, 9 de abril de 2013 www.amtera.com.br