SlideShare une entreprise Scribd logo
1  sur  18
Setembro, 2013
R, Big Data e Ciências Sociais
Seminário de integração CEBRAP-SESC
Estrutura da apresentação
• Big Data
– Tendências e definições
•R
– Exemplos
•R, Big Data e Ciências Sociais
– Possibilidades
Big Data: uma tendência
Google Trends: volume de buscas pela expressão
“big data” no mundo
Big Data: uma tendência
Big Data: uma tendência
Google Trends: volume de buscas pela expressão
“big data” no Brasil
Big Data: uma tendência
Big Data: uma tendência
Mundo
• Big data analytics
• Data analytics
• Hadoop
• Hadoop big data
• The big data
• Big data google
• Big data ibm
• Big data 2013
• Big data oracle
• Big data wiki
Brasil
• veja big data
Expressões e buscas relacionadas:
Big data: o que é?
1 ZETA BYTE = 1 073 741 824 TB (≅ 1 bilhão de terabytes)
90% dos dados existentes foram produzidos nos últimos 12 meses
Big data: o que é?
1. Texto: emails, posts, tweets, notícias, relatórios, artigos
acadêmicos, conteúdo de sites etc.
2. Registros da web: informações sobre o acesso (Google
Analytics, Blogger, WordPress, Facebook), tendências das
buscas (Google Trends) etc.
3. Dados governamentais: IBGE, saúde (DataSUS), educação
(Inep, MEC), Portal da
Transparência, Siconv, TSE, CadÚnico, Matriz de
Informações Sociais etc. (Lei de Acesso à Informação)
4. Repositórios públicos: CIS, CEM, Observatório das
Metrópoles, IpeaData, IPUMs, Amazon Public DataSets
(AWS), Freebase, DataVerse,
5. Dados geográficos: mapas
(shapes, ruas, imagens), imagens de
satélite, coordenadas, endereços etc.
6. Filmes, livros, vídeos caseiros, fotos, quadros, charges…
Big data: o que é?
Veracity / Validity / Reliability
Big data: o que é?
• Interesses comerciais
– Clientes, produtos, perfis de mercado...
• Interesses Políticos
– Eleições
– Opinião/aprovação
– Gestão de políticas
• Interesses acadêmicos
– Novas fontes empíricas para pesquisa
– Etc...
Big data: Big problem
– Fontes difusas / Múltiplas / Diversas
– Periodicidade irregular
– Problemas de codificação
• Inconsistência
• IDs não padronizados
• Dados faltantes (missing)
• Dados duplicados
– Falta de controle sobre a produção do dado
• Eventuais viéses
– Dificuldade de acesso a fontes não públicas
– Operações repetitivas e “infinitas”
Big data: Big problem
Dados, muitos dados…. Lixo, muito lixo…
Como tornar útil a informação disponível?
Big data: Big problem
“Big data is not about the data”
Gary King
Big data: Capacidade de Análise
Analytics
• Infraestrutura
– Softwares: SAS, RevolutionR, Hadoop,
– Hardware: multicore, servidores,
clusters etc…
• “Capital Humano”
– Programação estatística, programação
“mesmo”, alguma iniciação em Exatas…
(Fenomeno da TI)
R & Big Data
• Open Source
• Ferramentas de análise de dados (estatística)
– Quantidade abrangente de pacotes e funções
• Ferramentas para gerenciar dados
• Plataforma de programação (automação)
– Coleta de dados na internet (webscrapping)
– Criação de rotinas e funções pelos próprios usuários
• Ampla comunidade
(fóruns, grupos, blogs, sites, ajudas on-
line, exemplos etc.)
R, Big Data e Ciências Sociais
• Pensar “fora da caixa”: novos dados, novas questões
• Necessidade de novas capacidades
• Velocidade e automação
• Quanti + Quali
• Aproximação de outras áreas de conhecimento

Contenu connexe

Tendances

Ativando Inteligência com Big Data
Ativando Inteligência com Big DataAtivando Inteligência com Big Data
Ativando Inteligência com Big DataHélio Silva
 
Big Data, o que é isso?
Big Data, o que é isso?Big Data, o que é isso?
Big Data, o que é isso?Ambiente Livre
 
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Marcos Luiz Lins Filho
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RNMarcos Luiz Lins Filho
 
Novas ferramentas Python para Análise de Dados
Novas ferramentas Python para Análise de DadosNovas ferramentas Python para Análise de Dados
Novas ferramentas Python para Análise de DadosCiência e Dados
 
Ciência de Dados em Governo
Ciência de Dados em GovernoCiência de Dados em Governo
Ciência de Dados em GovernoSérgio Dias
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Carlos Barbieri
 

Tendances (10)

O que é Data Science?
O que é Data Science?O que é Data Science?
O que é Data Science?
 
Ativando Inteligência com Big Data
Ativando Inteligência com Big DataAtivando Inteligência com Big Data
Ativando Inteligência com Big Data
 
Business intelligence e Bigdata
Business intelligence e BigdataBusiness intelligence e Bigdata
Business intelligence e Bigdata
 
Big Data, o que é isso?
Big Data, o que é isso?Big Data, o que é isso?
Big Data, o que é isso?
 
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
 
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RNBig Data em 8 perguntas -  09.10.2014 - DATANORTE / GOV RN
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
 
Novas ferramentas Python para Análise de Dados
Novas ferramentas Python para Análise de DadosNovas ferramentas Python para Análise de Dados
Novas ferramentas Python para Análise de Dados
 
Big Data
Big DataBig Data
Big Data
 
Ciência de Dados em Governo
Ciência de Dados em GovernoCiência de Dados em Governo
Ciência de Dados em Governo
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02
 

Similaire à Slide cebrap

Como utilizar Bid Data na minha empres
Como utilizar Bid Data na minha empresComo utilizar Bid Data na minha empres
Como utilizar Bid Data na minha empresJosé Bringel Filho
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowareMarcos Vinicius Fidelis
 
aula1 - Bigdata.pdf
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdfCyberboy11
 
Data Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosData Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosDayane Cristine Leite
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataFabrício Barth
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big dataFelipe Ferraz
 
Introducão à Ciência de Dados
Introducão à Ciência de DadosIntroducão à Ciência de Dados
Introducão à Ciência de DadosJoão Pedro Albino
 
O que é a ciência de dados (data science). Discussão do conceito
O que é a ciência de dados (data science). Discussão do conceitoO que é a ciência de dados (data science). Discussão do conceito
O que é a ciência de dados (data science). Discussão do conceitoLuis Borges Gouveia
 
Apresentacao ForumRNP 2015 - Daniela Brauner
Apresentacao ForumRNP 2015 - Daniela BraunerApresentacao ForumRNP 2015 - Daniela Brauner
Apresentacao ForumRNP 2015 - Daniela BraunerDaniela Brauner
 
Bigdata alexandre v2
Bigdata alexandre v2Bigdata alexandre v2
Bigdata alexandre v2alexculpado
 
Big Data, seu novo paradigma para análise de dados e seus mitos
Big Data, seu novo paradigma para análise de dados e seus mitosBig Data, seu novo paradigma para análise de dados e seus mitos
Big Data, seu novo paradigma para análise de dados e seus mitosJose Augusto Sapienza Ramos
 
BIG DATA, de Fabiana Andrade
BIG DATA, de Fabiana AndradeBIG DATA, de Fabiana Andrade
BIG DATA, de Fabiana Andradebibliocampsp
 
Big Data: Desafios e Oportunidades
Big Data: Desafios e OportunidadesBig Data: Desafios e Oportunidades
Big Data: Desafios e OportunidadesGabriel Prado
 
Introdução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonIntrodução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonLuiz Eduardo Le Masson
 
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?Mauricio Cesar Santos da Purificação
 

Similaire à Slide cebrap (20)

Como utilizar Bid Data na minha empres
Como utilizar Bid Data na minha empresComo utilizar Bid Data na minha empres
Como utilizar Bid Data na minha empres
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
aula1 - Bigdata.pdf
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdf
 
Data Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dadosData Science - A arte de estudar e analisar dados
Data Science - A arte de estudar e analisar dados
 
BigData
BigDataBigData
BigData
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 
Futurecom - Big data
Futurecom - Big dataFuturecom - Big data
Futurecom - Big data
 
Introducão à Ciência de Dados
Introducão à Ciência de DadosIntroducão à Ciência de Dados
Introducão à Ciência de Dados
 
O que é a ciência de dados (data science). Discussão do conceito
O que é a ciência de dados (data science). Discussão do conceitoO que é a ciência de dados (data science). Discussão do conceito
O que é a ciência de dados (data science). Discussão do conceito
 
Apresentacao ForumRNP 2015 - Daniela Brauner
Apresentacao ForumRNP 2015 - Daniela BraunerApresentacao ForumRNP 2015 - Daniela Brauner
Apresentacao ForumRNP 2015 - Daniela Brauner
 
Bigdata alexandre v2
Bigdata alexandre v2Bigdata alexandre v2
Bigdata alexandre v2
 
BigData
BigDataBigData
BigData
 
Big Data, seu novo paradigma para análise de dados e seus mitos
Big Data, seu novo paradigma para análise de dados e seus mitosBig Data, seu novo paradigma para análise de dados e seus mitos
Big Data, seu novo paradigma para análise de dados e seus mitos
 
BIG DATA, de Fabiana Andrade
BIG DATA, de Fabiana AndradeBIG DATA, de Fabiana Andrade
BIG DATA, de Fabiana Andrade
 
Palestra do BI ao Big Data
Palestra do BI ao Big DataPalestra do BI ao Big Data
Palestra do BI ao Big Data
 
Big Data: Desafios e Oportunidades
Big Data: Desafios e OportunidadesBig Data: Desafios e Oportunidades
Big Data: Desafios e Oportunidades
 
Introdução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores PythonIntrodução ao Big Data para Desenvolvedores Python
Introdução ao Big Data para Desenvolvedores Python
 
BIG data
BIG dataBIG data
BIG data
 
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
Big Data Analytics e Social Mining - Inteligência Em Uma Montanha de Dados?
 

Slide cebrap

  • 1. Setembro, 2013 R, Big Data e Ciências Sociais Seminário de integração CEBRAP-SESC
  • 2. Estrutura da apresentação • Big Data – Tendências e definições •R – Exemplos •R, Big Data e Ciências Sociais – Possibilidades
  • 3. Big Data: uma tendência Google Trends: volume de buscas pela expressão “big data” no mundo
  • 4. Big Data: uma tendência
  • 5. Big Data: uma tendência Google Trends: volume de buscas pela expressão “big data” no Brasil
  • 6. Big Data: uma tendência
  • 7. Big Data: uma tendência Mundo • Big data analytics • Data analytics • Hadoop • Hadoop big data • The big data • Big data google • Big data ibm • Big data 2013 • Big data oracle • Big data wiki Brasil • veja big data Expressões e buscas relacionadas:
  • 8. Big data: o que é? 1 ZETA BYTE = 1 073 741 824 TB (≅ 1 bilhão de terabytes) 90% dos dados existentes foram produzidos nos últimos 12 meses
  • 9. Big data: o que é? 1. Texto: emails, posts, tweets, notícias, relatórios, artigos acadêmicos, conteúdo de sites etc. 2. Registros da web: informações sobre o acesso (Google Analytics, Blogger, WordPress, Facebook), tendências das buscas (Google Trends) etc. 3. Dados governamentais: IBGE, saúde (DataSUS), educação (Inep, MEC), Portal da Transparência, Siconv, TSE, CadÚnico, Matriz de Informações Sociais etc. (Lei de Acesso à Informação) 4. Repositórios públicos: CIS, CEM, Observatório das Metrópoles, IpeaData, IPUMs, Amazon Public DataSets (AWS), Freebase, DataVerse, 5. Dados geográficos: mapas (shapes, ruas, imagens), imagens de satélite, coordenadas, endereços etc. 6. Filmes, livros, vídeos caseiros, fotos, quadros, charges…
  • 10. Big data: o que é? Veracity / Validity / Reliability
  • 11. Big data: o que é? • Interesses comerciais – Clientes, produtos, perfis de mercado... • Interesses Políticos – Eleições – Opinião/aprovação – Gestão de políticas • Interesses acadêmicos – Novas fontes empíricas para pesquisa – Etc...
  • 12. Big data: Big problem – Fontes difusas / Múltiplas / Diversas – Periodicidade irregular – Problemas de codificação • Inconsistência • IDs não padronizados • Dados faltantes (missing) • Dados duplicados – Falta de controle sobre a produção do dado • Eventuais viéses – Dificuldade de acesso a fontes não públicas – Operações repetitivas e “infinitas”
  • 13. Big data: Big problem Dados, muitos dados…. Lixo, muito lixo… Como tornar útil a informação disponível?
  • 14. Big data: Big problem “Big data is not about the data” Gary King
  • 15. Big data: Capacidade de Análise Analytics • Infraestrutura – Softwares: SAS, RevolutionR, Hadoop, – Hardware: multicore, servidores, clusters etc… • “Capital Humano” – Programação estatística, programação “mesmo”, alguma iniciação em Exatas… (Fenomeno da TI)
  • 16.
  • 17. R & Big Data • Open Source • Ferramentas de análise de dados (estatística) – Quantidade abrangente de pacotes e funções • Ferramentas para gerenciar dados • Plataforma de programação (automação) – Coleta de dados na internet (webscrapping) – Criação de rotinas e funções pelos próprios usuários • Ampla comunidade (fóruns, grupos, blogs, sites, ajudas on- line, exemplos etc.)
  • 18. R, Big Data e Ciências Sociais • Pensar “fora da caixa”: novos dados, novas questões • Necessidade de novas capacidades • Velocidade e automação • Quanti + Quali • Aproximação de outras áreas de conhecimento