SlideShare une entreprise Scribd logo
1  sur  44
Télécharger pour lire hors ligne
Alessandro Binhara
Data Scientist & Mobile Expert
Mestre em Tecnologia (UTFPR)
Bacharel em TIC, Técnico Eletrônica (CEFET-PR)
Mono Hacker desde 2003
Fundador Projeto MonoBrasil
Linguagens Fluente: C#, Java, PIG, PHP, Ruby., ...
BigData: Hadoop, MapReduce Mahout, Hbase, Cassandra, Hive,
Sqoop,
Consultor Autorizado Xamarin
Armazena ?
Vende ?
Empresta?
Espiona ?
Divulga?
Não faz nada?
• Seus contatos
• Seus comentários
• Suas mensagens
• Seus postes
• Sua Localização
• Quanta informação o facebook sa
http://www.extremetech.com/extreme/178777-facebooks-facial-recognition-software-is-now-as-accurate-as-the-human-
brain-but-what-now
DeepFace pode olhar para duas fotos , e
independentemente da iluminação ou do
ângulo, pode-se dizer com precisão 97,25 % se
as fotos contêm o mesmo rosto.
Os seres humanos podem executar a mesma
tarefa com precisão 97,53 %.
Usa IA com redes neurais , consiste em um
grupo de neurônios nove camadas profundas , e
em seguida um processo de aprendizagem que
vê a criação de 120 milhões de conexões
(sinapses) entre esses neurônios , com base em
um corpus de quatro milhões de fotos de rostos
• Em janeiro de 2011
• “As pessoas celebraram o ano novo no Facebook enviando um número
recorde de fotos – 750 milhões somente no fim de semana!”, comunicou a
diretora via Twitter, nesta terça-feira (4/1).
• Simples, todos os dias o facebook recebe mais de 200 milhões de
fotos!!!
• Como armazena e consegue processar tudo isso???
• O cientista de dados é um especialista em análise
de informações. A característica mais importante
desse profissional é a capacidade analítica. Por
isso, quem tem uma sólida formação em
matemática e lógica, como engenheiros,
economistas, estatísticos e matemáticos, é forte
candidato a se sair bem na carreira.
• “Ter um consistente background em matemática é
fundamental, senão a pessoa tem que suar muito
para preencher a lacuna", Fundação Getúlio
Vargas do Rio de Janeiro (FGV-RJ), 2011.
Salário mediano anual em
milhares de dólares dividido
pelos grupos identificados.
Fonte: O'Reilly.
• O Apache Hadoop é um projeto desenvolvimento como open-
source software para escalável , confiável e com processamento
distribuído. Um sistema escalável e confiável para
armazenamento compartilhado e análises. Ele automaticamente
trata da replicação de dados e das falhas em cada nó. Ele faz o
trabalho duro, o desenvolvedor pode se concentrar em
processamento da lógica de dados Permite que os aplicativos
usem petabytes de dados em paralelo.
O que é Hadoop ?
Por que ?
• Requisitos
• 500M+ usuário únicos por mês
• Bilhões de eventos interessantes por dia
• Necessidade de scalabilidade massiva
• PB’s de storage, milhares de arquivos,
1000’s de nós
• Necessidade de ter baixo custo
• Uso de hardware comum
• Compartilhar recursos com vários
projetos
• Fornecer escala quando necessário
• Precisa de infraestrutura confiável
• Deve ser capaz de lidar com falhas -
hardware, software, networking
• A falha é esperada, e não uma exceção
• Transparente para as aplicações
• muito caro para construir confiabilidade em
cada aplicação
• A infra-estrutura do Hadoop prove
essas capacidade.
Hadoop no FaceBook
• Cluster em produção
• 4800 cores, 600 máquina, 16GB por máquina
• 8000 cores, 1000 máquinas, 32 GB por máquina
• 4 SATA discos de 1 TB por máquina
• 2 níveis de rede hierárquica, 40 máquinas por rack
• Total do tamanho do cluster 2 PB, projetado para 12 PB no Q3 2009
• Em 2010 - A 1100-machine cluster with 8800 cores and about 12 PB raw
storage.
• Atualmente eles moveram 30PB de para um novo Cluster
• Todos os dias o Facebook recebe 380milhões de novas fotos
• Atualmente o Yahoo tem um cluster com mais de 42mil máquinas de teste
HDFS – Hadoop File System
• Inspirado em GFS
• Projetado para
trabalhar com arquivos
muito grandes
• Executado
em hardware commodity
• Streaming de acesso a
dados
• Replicação e localidade
HDFS- MapReduce Data Flow
HDP: Enterprise Hadoop Distribution
Hortonworks
Data Platform (HDP)
Enterprise Hadoop
• A única 100% open
source e completa
• Classe empresarial,
provado e testado em
escala
• Ecossistema endossado
para garantir a
interoperabilidade
Caso você leia todos os contratos vai gastar 180h
Seria um 1mês inteiro de trabalho por ano.
Segundo ... WallStret jornal:
“Consumidores perdem 250bilhões de dólares ao ano
com clausulas escondidas em letras pequenas”
• Você da não exclusivamente, irrevogavelmente,
perpétuo, ilimitado, transferível sublicenciável,
livre de roaylties para copiar, preparar trabalhos
derivados de, molhorar, distribuir, publicar ,
manter,....
• O Linkedin se apropria de tudo para sempre.
• O Instagram se dá ao direito de vender as suas
fotos sem compensação posteriores para uso
comerciais.
• Para que fim essas informações seriam usadas ?
• E se as empresa fizesse mau uso dessas informações?
• E se o governo utiliza-se dessa informações para espionagem ?
• Somente por causa dos termos de uso e condições...
• Quanto vale essa informação ?
• Você está disposto a fornecer tuas informações para receber um
cachorro quente de graça?
• O Licenciamento do Iphone não menciaona a possibilidade de
grampear seu telefone .
• Mas o contrato da AT&T menciona :
• Para “Investigar, prevenir ou reagir em relação atividades ilegais”
Sistema de Recomendação
• Sistema de Recomendação de Produtos
• Vitrines inteligentes para lojas online
• Aumento em 60% o volume de faturamento das lojas
• Cluster com 70nós
• Mais de 1.5 milhões de transações por segundo
• Em 2001 , Mais de um dúzia leis fora criadas nos EUA para proteger a
privacidade dos usuários... Mas....7 meses depois ...
• Todas as leis foram revogadas
• ou abandonadas
Em Assinatura do Ato Patriota
A lei permite a vigilância de todas as
comunicações, email, internet,
telefones, etc...
• Uso de Cookies anônimos no passado
• Mudanças para cookies que podem ser
identificados.
• Os termos do google mudaram e lá está escrito
”..apesar de anônimos os dados, usuários
podem ser identificados quanto tiver
necessidade.”
• Em 2009, facebook tornou padrão como público
no facebook.
• Mesmo que você delete algo, continua lá.
• Google Esta cruzando todos os dados na internet
• Empresas de cartão de crédito estão usando para definir limite
de crédito. Caso de pessoas nos EUA que tiveram seus limites
de cartão reduzidos
• Bancos usam para aprovar ou não a abertura de contas.
• Um caso de um cidadão que começou a receber promoções de
produto para gestantes. E foi indignado a loja.
• Empresa de seguro estão usando seus hábitos de compras,
exemplo: Se você costuma comprar bebidas alcoólicas você
apresenta um risco maior
• Empresa de GPS
• Vendendo os hábitos dos motoristas para a policia local para chegar
em casa mais rápido
• A policia passou a colocar radares e fiscalizar essas rodas
• Aplicando multas aos motoristas
• Governo dos EUA esta digitalizando todas as informações disponíveis.
• Eles podem prever o que esta acontecendo no país e fora.
• NSA é 3X maior que a CIA
• E muito mais secreto que a CIA
O Carrier IQ é, em sua essência, um software que registra TODOS os
dados relacionados ao seu comportamento de uso de um celular. Abriu
o site do banco? Digitou palavrão no SMS? O Carrier IQ sabe. Abriu um
site pornográfico? Ele também sabe.
O Logging Test App, para Android, é o mais conhecido, pois oferece tanto a
função de identificação quanto a de remoção. O Voodoo Carrier IQ
Detector apenas localiza a posição do famigerado software em seu aparelho -
função esta também exercida pelo Carrier IQ Detector.
Binhara@azuris.com.br
@binhara
www.azuris.com.br
www.gucrossmobile.com.br
www.facebook.com/gucrossmobile
www.monobrasil.com/gux.html

Contenu connexe

Tendances

Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Bruno Rocha
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Carlos Barbieri
 
Introdução a data science
Introdução a data scienceIntrodução a data science
Introdução a data scienceCaio Gomes
 
Big data: Conceitos e Desafios
Big data: Conceitos e DesafiosBig data: Conceitos e Desafios
Big data: Conceitos e DesafiosFlávio Sousa
 
O que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidasO que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidasElaine Naomi
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro WanderleyLeandro Couto
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATALeonardo Dias
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataFabrício Barth
 
Data science e os físicos
Data science e os físicosData science e os físicos
Data science e os físicosCaio Gomes
 
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Marcos Luiz Lins Filho
 

Tendances (20)

Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
Data Developer - Engenharia de Dados em um time de Data Science - Uai python2015
 
Big data
Big dataBig data
Big data
 
Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02Governança de Dados e Big Data_v02
Governança de Dados e Big Data_v02
 
Big Data
Big DataBig Data
Big Data
 
Tecnologias de gestao_tema6
Tecnologias de gestao_tema6Tecnologias de gestao_tema6
Tecnologias de gestao_tema6
 
Introdução a data science
Introdução a data scienceIntrodução a data science
Introdução a data science
 
Big data: Conceitos e Desafios
Big data: Conceitos e DesafiosBig data: Conceitos e Desafios
Big data: Conceitos e Desafios
 
O que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidasO que é BIG DATA e como pode influenciar nossas vidas
O que é BIG DATA e como pode influenciar nossas vidas
 
Bigdata - Leandro Wanderley
Bigdata - Leandro WanderleyBigdata - Leandro Wanderley
Bigdata - Leandro Wanderley
 
Palestra Introdução a Big Data
Palestra Introdução a Big DataPalestra Introdução a Big Data
Palestra Introdução a Big Data
 
OS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATAOS CINCO Vs DO BIG DATA
OS CINCO Vs DO BIG DATA
 
Big Data
Big DataBig Data
Big Data
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
 
Data science e os físicos
Data science e os físicosData science e os físicos
Data science e os físicos
 
Clusters
ClustersClusters
Clusters
 
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
 
Big Data - Conceitos Básicos
Big Data - Conceitos BásicosBig Data - Conceitos Básicos
Big Data - Conceitos Básicos
 
Big Data
Big DataBig Data
Big Data
 
Bigdata gameverse
Bigdata gameverseBigdata gameverse
Bigdata gameverse
 
Big Data Latinoware 2014
Big Data Latinoware 2014Big Data Latinoware 2014
Big Data Latinoware 2014
 

En vedette

MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...Igor Steinmacher
 
De dev para data scientist 3 coisas que aprendi
De dev para data scientist  3 coisas que aprendiDe dev para data scientist  3 coisas que aprendi
De dev para data scientist 3 coisas que aprendiRodrigo Vieira
 
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abreBig Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abreVivaldo Jose Breternitz
 
Usabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na webUsabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na webRobson Santos
 
Palestra MVP living lab ms
Palestra MVP   living lab msPalestra MVP   living lab ms
Palestra MVP living lab msBonoBee
 
Mineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e WekaMineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e WekaJoão Gabriel Lima
 
Primeiros passos com o Cassandra
 Primeiros passos com o Cassandra  Primeiros passos com o Cassandra
Primeiros passos com o Cassandra Otávio Santana
 
Mantendo seu Tempo a salvo com Python e Git
Mantendo seu Tempo a salvo com Python e GitMantendo seu Tempo a salvo com Python e Git
Mantendo seu Tempo a salvo com Python e GitMatheus Pereira
 
Análise de Redes Sociais com Python
Análise de Redes Sociais com PythonAnálise de Redes Sociais com Python
Análise de Redes Sociais com PythonAna Paula Gomes
 
Mineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informaçãoMineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informaçãoDalton Martins
 
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...João Gabriel Lima
 
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013PentahoBrasil
 
Modelos analiticos crm
Modelos analiticos crmModelos analiticos crm
Modelos analiticos crmRamón Díaz
 
Desenvolvendo mvp com python
Desenvolvendo mvp com pythonDesenvolvendo mvp com python
Desenvolvendo mvp com pythonBruno Rocha
 
[TDC2016] Apache Cassandra Estratégias de Modelagem de Dados
[TDC2016]  Apache Cassandra Estratégias de Modelagem de Dados[TDC2016]  Apache Cassandra Estratégias de Modelagem de Dados
[TDC2016] Apache Cassandra Estratégias de Modelagem de DadosEiti Kimura
 
BIG DATA & IoT: Tecnologias e  Aplicações
BIG DATA & IoT: Tecnologias e  AplicaçõesBIG DATA & IoT: Tecnologias e  Aplicações
BIG DATA & IoT: Tecnologias e  AplicaçõesAlessandro Binhara
 

En vedette (20)

MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
MinerAll: Uma ferramenta para extração e mineração de dados de repositórios d...
 
De dev para data scientist 3 coisas que aprendi
De dev para data scientist  3 coisas que aprendiDe dev para data scientist  3 coisas que aprendi
De dev para data scientist 3 coisas que aprendi
 
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abreBig Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
Big Data, Analytics e o Cientista de Dados – um novo campo de trabalho se abre
 
Usabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na webUsabilidade de interface para busca e recuperação de informação na web
Usabilidade de interface para busca e recuperação de informação na web
 
Palestra MVP living lab ms
Palestra MVP   living lab msPalestra MVP   living lab ms
Palestra MVP living lab ms
 
Mineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e WekaMineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e Weka
 
Primeiros passos com o Cassandra
 Primeiros passos com o Cassandra  Primeiros passos com o Cassandra
Primeiros passos com o Cassandra
 
Mantendo seu Tempo a salvo com Python e Git
Mantendo seu Tempo a salvo com Python e GitMantendo seu Tempo a salvo com Python e Git
Mantendo seu Tempo a salvo com Python e Git
 
Análise de Redes Sociais com Python
Análise de Redes Sociais com PythonAnálise de Redes Sociais com Python
Análise de Redes Sociais com Python
 
Mineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informaçãoMineração de dados e novas oportunidades de análise para sistemas de informação
Mineração de dados e novas oportunidades de análise para sistemas de informação
 
Bigadata casese opotunidades
Bigadata casese opotunidadesBigadata casese opotunidades
Bigadata casese opotunidades
 
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
 
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
Criando soluções de BI com Pentaho e Dados Abertos @ Pentaho Day 2013
 
Cases big data
Cases big dataCases big data
Cases big data
 
Modelos analiticos crm
Modelos analiticos crmModelos analiticos crm
Modelos analiticos crm
 
Desenvolvendo mvp com python
Desenvolvendo mvp com pythonDesenvolvendo mvp com python
Desenvolvendo mvp com python
 
Relatório Utilização da Ferramenta Weka
Relatório Utilização da Ferramenta WekaRelatório Utilização da Ferramenta Weka
Relatório Utilização da Ferramenta Weka
 
[TDC2016] Apache Cassandra Estratégias de Modelagem de Dados
[TDC2016]  Apache Cassandra Estratégias de Modelagem de Dados[TDC2016]  Apache Cassandra Estratégias de Modelagem de Dados
[TDC2016] Apache Cassandra Estratégias de Modelagem de Dados
 
Análise de Problemas Big Data
Análise de Problemas Big DataAnálise de Problemas Big Data
Análise de Problemas Big Data
 
BIG DATA & IoT: Tecnologias e  Aplicações
BIG DATA & IoT: Tecnologias e  AplicaçõesBIG DATA & IoT: Tecnologias e  Aplicações
BIG DATA & IoT: Tecnologias e  Aplicações
 

Similaire à O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???

Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTIBruna Pereira
 
Big Data e suas Vertentes
Big Data e suas VertentesBig Data e suas Vertentes
Big Data e suas VertentesUnicamp
 
aula1 - Bigdata.pdf
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdfCyberboy11
 
Bigdata alexandre v2
Bigdata alexandre v2Bigdata alexandre v2
Bigdata alexandre v2alexculpado
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Arthur Souza
 
BigData e internte das coisas aplicada a engenharia
BigData e internte das coisas aplicada a engenhariaBigData e internte das coisas aplicada a engenharia
BigData e internte das coisas aplicada a engenhariaAlessandro Binhara
 
First Big Data Week
First Big Data Week First Big Data Week
First Big Data Week Hélio Silva
 
iOpera artigo o que é big data como surgiu o big data para que serve o big data
iOpera artigo o que é big data como surgiu o big data para que serve o big dataiOpera artigo o que é big data como surgiu o big data para que serve o big data
iOpera artigo o que é big data como surgiu o big data para que serve o big dataValêncio Garcia
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivreAmbiente Livre
 
Big Data Week São Paulo 2017
Big Data Week São Paulo 2017 Big Data Week São Paulo 2017
Big Data Week São Paulo 2017 Thiago Santiago
 
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - AngolaAula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angolaalexculpado
 
Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?Paulo Ricardo Santos
 

Similaire à O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ??? (20)

Big Data
Big DataBig Data
Big Data
 
Palestra Big Data SCTI
Palestra Big Data SCTIPalestra Big Data SCTI
Palestra Big Data SCTI
 
Big Data e suas Vertentes
Big Data e suas VertentesBig Data e suas Vertentes
Big Data e suas Vertentes
 
aula1 - Bigdata.pdf
aula1 - Bigdata.pdfaula1 - Bigdata.pdf
aula1 - Bigdata.pdf
 
Bigdata alexandre v2
Bigdata alexandre v2Bigdata alexandre v2
Bigdata alexandre v2
 
Treinamento hadoop - dia1
Treinamento hadoop - dia1Treinamento hadoop - dia1
Treinamento hadoop - dia1
 
Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...Big data - Uma visão geral da coisa...
Big data - Uma visão geral da coisa...
 
BigData e internte das coisas aplicada a engenharia
BigData e internte das coisas aplicada a engenhariaBigData e internte das coisas aplicada a engenharia
BigData e internte das coisas aplicada a engenharia
 
Aula CRP-0420-2016-04: Big Data 1
Aula CRP-0420-2016-04: Big Data 1Aula CRP-0420-2016-04: Big Data 1
Aula CRP-0420-2016-04: Big Data 1
 
First Big Data Week
First Big Data Week First Big Data Week
First Big Data Week
 
iOpera artigo o que é big data como surgiu o big data para que serve o big data
iOpera artigo o que é big data como surgiu o big data para que serve o big dataiOpera artigo o que é big data como surgiu o big data para que serve o big data
iOpera artigo o que é big data como surgiu o big data para que serve o big data
 
Big Data, JVM e Redes Sociais
Big Data, JVM e Redes SociaisBig Data, JVM e Redes Sociais
Big Data, JVM e Redes Sociais
 
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software LivrePalestra: Cientista de Dados – Dominando o Big Data com Software Livre
Palestra: Cientista de Dados – Dominando o Big Data com Software Livre
 
Hackathon UOL
Hackathon  UOL Hackathon  UOL
Hackathon UOL
 
Big Data Week São Paulo 2017
Big Data Week São Paulo 2017 Big Data Week São Paulo 2017
Big Data Week São Paulo 2017
 
BIG DATA
BIG DATABIG DATA
BIG DATA
 
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - AngolaAula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
 
Morse Talks: Mobile Meets Big Data
Morse Talks: Mobile Meets Big DataMorse Talks: Mobile Meets Big Data
Morse Talks: Mobile Meets Big Data
 
Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?Big Data: O que é? e por onde começar?
Big Data: O que é? e por onde começar?
 
Big data
Big dataBig data
Big data
 

Plus de Alessandro Binhara

Uma breve introdução ao Big Data e Inteligência Artificial.pptx
Uma breve introdução ao Big Data e Inteligência Artificial.pptxUma breve introdução ao Big Data e Inteligência Artificial.pptx
Uma breve introdução ao Big Data e Inteligência Artificial.pptxAlessandro Binhara
 
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnósticaCase RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnósticaAlessandro Binhara
 
Latinoware 2019 - DEsenvolvimento mobile em Nivel jedi
Latinoware 2019 - DEsenvolvimento mobile em Nivel jediLatinoware 2019 - DEsenvolvimento mobile em Nivel jedi
Latinoware 2019 - DEsenvolvimento mobile em Nivel jediAlessandro Binhara
 
2019 latinoware - O mundo novo da realidade virtual
2019 latinoware - O mundo novo da realidade virtual2019 latinoware - O mundo novo da realidade virtual
2019 latinoware - O mundo novo da realidade virtualAlessandro Binhara
 
Realidade Virtual e a Ciência de Dados -latinoware
Realidade Virtual e a Ciência de Dados -latinowareRealidade Virtual e a Ciência de Dados -latinoware
Realidade Virtual e a Ciência de Dados -latinowareAlessandro Binhara
 
Realidade Virtual e a Ciência de Dados
Realidade Virtual e a Ciência de DadosRealidade Virtual e a Ciência de Dados
Realidade Virtual e a Ciência de DadosAlessandro Binhara
 
A IMPORTÂNCIA DA PARTICIPAÇÃO NA GESTÃO DE PROJETOS TECNOLÓGICOS INOVADORES:...
A IMPORTÂNCIA DA PARTICIPAÇÃO NA  GESTÃO DE PROJETOS TECNOLÓGICOS INOVADORES:...A IMPORTÂNCIA DA PARTICIPAÇÃO NA  GESTÃO DE PROJETOS TECNOLÓGICOS INOVADORES:...
A IMPORTÂNCIA DA PARTICIPAÇÃO NA GESTÃO DE PROJETOS TECNOLÓGICOS INOVADORES:...Alessandro Binhara
 
Introduçãoo aws, escalando uma aplicação Web
Introduçãoo aws, escalando uma aplicação WebIntroduçãoo aws, escalando uma aplicação Web
Introduçãoo aws, escalando uma aplicação WebAlessandro Binhara
 
Desenvolvimento de Games para Mobile.
Desenvolvimento de Games para Mobile.Desenvolvimento de Games para Mobile.
Desenvolvimento de Games para Mobile.Alessandro Binhara
 
Curso C# em Mono - Orientação a Objeto Basico
Curso C# em Mono - Orientação a Objeto BasicoCurso C# em Mono - Orientação a Objeto Basico
Curso C# em Mono - Orientação a Objeto BasicoAlessandro Binhara
 
Apresentação Final a FINEP Projeto MonoBasic
Apresentação Final a FINEP Projeto MonoBasicApresentação Final a FINEP Projeto MonoBasic
Apresentação Final a FINEP Projeto MonoBasicAlessandro Binhara
 
App CrossMobile com C# para Android, Iphone e WindowsPhone
App CrossMobile com C# para Android, Iphone e WindowsPhoneApp CrossMobile com C# para Android, Iphone e WindowsPhone
App CrossMobile com C# para Android, Iphone e WindowsPhoneAlessandro Binhara
 
Xamarin Interop - hands on android -
Xamarin Interop - hands on android - Xamarin Interop - hands on android -
Xamarin Interop - hands on android - Alessandro Binhara
 

Plus de Alessandro Binhara (20)

Uma breve introdução ao Big Data e Inteligência Artificial.pptx
Uma breve introdução ao Big Data e Inteligência Artificial.pptxUma breve introdução ao Big Data e Inteligência Artificial.pptx
Uma breve introdução ao Big Data e Inteligência Artificial.pptx
 
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnósticaCase RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
Case RDStation: Construindo DataLakes com Apache Hadoop em cloud agnóstica
 
Latinoware 2019 - DEsenvolvimento mobile em Nivel jedi
Latinoware 2019 - DEsenvolvimento mobile em Nivel jediLatinoware 2019 - DEsenvolvimento mobile em Nivel jedi
Latinoware 2019 - DEsenvolvimento mobile em Nivel jedi
 
2019 latinoware - O mundo novo da realidade virtual
2019 latinoware - O mundo novo da realidade virtual2019 latinoware - O mundo novo da realidade virtual
2019 latinoware - O mundo novo da realidade virtual
 
Realidade Virtual e a Ciência de Dados -latinoware
Realidade Virtual e a Ciência de Dados -latinowareRealidade Virtual e a Ciência de Dados -latinoware
Realidade Virtual e a Ciência de Dados -latinoware
 
Realidade Virtual e a Ciência de Dados
Realidade Virtual e a Ciência de DadosRealidade Virtual e a Ciência de Dados
Realidade Virtual e a Ciência de Dados
 
A IMPORTÂNCIA DA PARTICIPAÇÃO NA GESTÃO DE PROJETOS TECNOLÓGICOS INOVADORES:...
A IMPORTÂNCIA DA PARTICIPAÇÃO NA  GESTÃO DE PROJETOS TECNOLÓGICOS INOVADORES:...A IMPORTÂNCIA DA PARTICIPAÇÃO NA  GESTÃO DE PROJETOS TECNOLÓGICOS INOVADORES:...
A IMPORTÂNCIA DA PARTICIPAÇÃO NA GESTÃO DE PROJETOS TECNOLÓGICOS INOVADORES:...
 
Curso de Férias - Robótica
Curso de Férias -  Robótica Curso de Férias -  Robótica
Curso de Férias - Robótica
 
Introduçãoo aws, escalando uma aplicação Web
Introduçãoo aws, escalando uma aplicação WebIntroduçãoo aws, escalando uma aplicação Web
Introduçãoo aws, escalando uma aplicação Web
 
Xamarin plataform
Xamarin plataformXamarin plataform
Xamarin plataform
 
Desenvolvimento de Games para Mobile.
Desenvolvimento de Games para Mobile.Desenvolvimento de Games para Mobile.
Desenvolvimento de Games para Mobile.
 
Games imersivos
Games imersivosGames imersivos
Games imersivos
 
Abertura - interopmix2014
Abertura - interopmix2014Abertura - interopmix2014
Abertura - interopmix2014
 
Curso C# em Mono - Orientação a Objeto Basico
Curso C# em Mono - Orientação a Objeto BasicoCurso C# em Mono - Orientação a Objeto Basico
Curso C# em Mono - Orientação a Objeto Basico
 
Treinamento csharp mono
Treinamento csharp monoTreinamento csharp mono
Treinamento csharp mono
 
Int305 projeto mono-final
Int305 projeto mono-finalInt305 projeto mono-final
Int305 projeto mono-final
 
Apresentação Final a FINEP Projeto MonoBasic
Apresentação Final a FINEP Projeto MonoBasicApresentação Final a FINEP Projeto MonoBasic
Apresentação Final a FINEP Projeto MonoBasic
 
App CrossMobile com C# para Android, Iphone e WindowsPhone
App CrossMobile com C# para Android, Iphone e WindowsPhoneApp CrossMobile com C# para Android, Iphone e WindowsPhone
App CrossMobile com C# para Android, Iphone e WindowsPhone
 
Xamarin Interop - hands on android -
Xamarin Interop - hands on android - Xamarin Interop - hands on android -
Xamarin Interop - hands on android -
 
Quarto Encontro GUX
Quarto Encontro GUX Quarto Encontro GUX
Quarto Encontro GUX
 

O queo facebook faz com minhas fotos??? E o que o BigData tem haver com isso ???

  • 1.
  • 2. Alessandro Binhara Data Scientist & Mobile Expert Mestre em Tecnologia (UTFPR) Bacharel em TIC, Técnico Eletrônica (CEFET-PR) Mono Hacker desde 2003 Fundador Projeto MonoBrasil Linguagens Fluente: C#, Java, PIG, PHP, Ruby., ... BigData: Hadoop, MapReduce Mahout, Hbase, Cassandra, Hive, Sqoop, Consultor Autorizado Xamarin
  • 3.
  • 4. Armazena ? Vende ? Empresta? Espiona ? Divulga? Não faz nada?
  • 5. • Seus contatos • Seus comentários • Suas mensagens • Seus postes • Sua Localização • Quanta informação o facebook sa
  • 6.
  • 7.
  • 8. http://www.extremetech.com/extreme/178777-facebooks-facial-recognition-software-is-now-as-accurate-as-the-human- brain-but-what-now DeepFace pode olhar para duas fotos , e independentemente da iluminação ou do ângulo, pode-se dizer com precisão 97,25 % se as fotos contêm o mesmo rosto. Os seres humanos podem executar a mesma tarefa com precisão 97,53 %. Usa IA com redes neurais , consiste em um grupo de neurônios nove camadas profundas , e em seguida um processo de aprendizagem que vê a criação de 120 milhões de conexões (sinapses) entre esses neurônios , com base em um corpus de quatro milhões de fotos de rostos
  • 9. • Em janeiro de 2011 • “As pessoas celebraram o ano novo no Facebook enviando um número recorde de fotos – 750 milhões somente no fim de semana!”, comunicou a diretora via Twitter, nesta terça-feira (4/1). • Simples, todos os dias o facebook recebe mais de 200 milhões de fotos!!! • Como armazena e consegue processar tudo isso???
  • 10.
  • 11. • O cientista de dados é um especialista em análise de informações. A característica mais importante desse profissional é a capacidade analítica. Por isso, quem tem uma sólida formação em matemática e lógica, como engenheiros, economistas, estatísticos e matemáticos, é forte candidato a se sair bem na carreira. • “Ter um consistente background em matemática é fundamental, senão a pessoa tem que suar muito para preencher a lacuna", Fundação Getúlio Vargas do Rio de Janeiro (FGV-RJ), 2011. Salário mediano anual em milhares de dólares dividido pelos grupos identificados. Fonte: O'Reilly.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17. • O Apache Hadoop é um projeto desenvolvimento como open- source software para escalável , confiável e com processamento distribuído. Um sistema escalável e confiável para armazenamento compartilhado e análises. Ele automaticamente trata da replicação de dados e das falhas em cada nó. Ele faz o trabalho duro, o desenvolvedor pode se concentrar em processamento da lógica de dados Permite que os aplicativos usem petabytes de dados em paralelo. O que é Hadoop ?
  • 18. Por que ? • Requisitos • 500M+ usuário únicos por mês • Bilhões de eventos interessantes por dia • Necessidade de scalabilidade massiva • PB’s de storage, milhares de arquivos, 1000’s de nós • Necessidade de ter baixo custo • Uso de hardware comum • Compartilhar recursos com vários projetos • Fornecer escala quando necessário • Precisa de infraestrutura confiável • Deve ser capaz de lidar com falhas - hardware, software, networking • A falha é esperada, e não uma exceção • Transparente para as aplicações • muito caro para construir confiabilidade em cada aplicação • A infra-estrutura do Hadoop prove essas capacidade.
  • 19. Hadoop no FaceBook • Cluster em produção • 4800 cores, 600 máquina, 16GB por máquina • 8000 cores, 1000 máquinas, 32 GB por máquina • 4 SATA discos de 1 TB por máquina • 2 níveis de rede hierárquica, 40 máquinas por rack • Total do tamanho do cluster 2 PB, projetado para 12 PB no Q3 2009 • Em 2010 - A 1100-machine cluster with 8800 cores and about 12 PB raw storage. • Atualmente eles moveram 30PB de para um novo Cluster • Todos os dias o Facebook recebe 380milhões de novas fotos • Atualmente o Yahoo tem um cluster com mais de 42mil máquinas de teste
  • 20. HDFS – Hadoop File System • Inspirado em GFS • Projetado para trabalhar com arquivos muito grandes • Executado em hardware commodity • Streaming de acesso a dados • Replicação e localidade
  • 22. HDP: Enterprise Hadoop Distribution Hortonworks Data Platform (HDP) Enterprise Hadoop • A única 100% open source e completa • Classe empresarial, provado e testado em escala • Ecossistema endossado para garantir a interoperabilidade
  • 23.
  • 24.
  • 25.
  • 26. Caso você leia todos os contratos vai gastar 180h Seria um 1mês inteiro de trabalho por ano. Segundo ... WallStret jornal: “Consumidores perdem 250bilhões de dólares ao ano com clausulas escondidas em letras pequenas”
  • 27. • Você da não exclusivamente, irrevogavelmente, perpétuo, ilimitado, transferível sublicenciável, livre de roaylties para copiar, preparar trabalhos derivados de, molhorar, distribuir, publicar , manter,.... • O Linkedin se apropria de tudo para sempre. • O Instagram se dá ao direito de vender as suas fotos sem compensação posteriores para uso comerciais.
  • 28. • Para que fim essas informações seriam usadas ? • E se as empresa fizesse mau uso dessas informações? • E se o governo utiliza-se dessa informações para espionagem ? • Somente por causa dos termos de uso e condições... • Quanto vale essa informação ? • Você está disposto a fornecer tuas informações para receber um cachorro quente de graça?
  • 29. • O Licenciamento do Iphone não menciaona a possibilidade de grampear seu telefone . • Mas o contrato da AT&T menciona : • Para “Investigar, prevenir ou reagir em relação atividades ilegais”
  • 30.
  • 31. Sistema de Recomendação • Sistema de Recomendação de Produtos • Vitrines inteligentes para lojas online • Aumento em 60% o volume de faturamento das lojas • Cluster com 70nós • Mais de 1.5 milhões de transações por segundo
  • 32. • Em 2001 , Mais de um dúzia leis fora criadas nos EUA para proteger a privacidade dos usuários... Mas....7 meses depois ... • Todas as leis foram revogadas • ou abandonadas Em Assinatura do Ato Patriota A lei permite a vigilância de todas as comunicações, email, internet, telefones, etc...
  • 33. • Uso de Cookies anônimos no passado • Mudanças para cookies que podem ser identificados. • Os termos do google mudaram e lá está escrito ”..apesar de anônimos os dados, usuários podem ser identificados quanto tiver necessidade.” • Em 2009, facebook tornou padrão como público no facebook. • Mesmo que você delete algo, continua lá.
  • 34. • Google Esta cruzando todos os dados na internet • Empresas de cartão de crédito estão usando para definir limite de crédito. Caso de pessoas nos EUA que tiveram seus limites de cartão reduzidos • Bancos usam para aprovar ou não a abertura de contas. • Um caso de um cidadão que começou a receber promoções de produto para gestantes. E foi indignado a loja. • Empresa de seguro estão usando seus hábitos de compras, exemplo: Se você costuma comprar bebidas alcoólicas você apresenta um risco maior
  • 35. • Empresa de GPS • Vendendo os hábitos dos motoristas para a policia local para chegar em casa mais rápido • A policia passou a colocar radares e fiscalizar essas rodas • Aplicando multas aos motoristas
  • 36. • Governo dos EUA esta digitalizando todas as informações disponíveis. • Eles podem prever o que esta acontecendo no país e fora. • NSA é 3X maior que a CIA • E muito mais secreto que a CIA
  • 37.
  • 38.
  • 39.
  • 40.
  • 41. O Carrier IQ é, em sua essência, um software que registra TODOS os dados relacionados ao seu comportamento de uso de um celular. Abriu o site do banco? Digitou palavrão no SMS? O Carrier IQ sabe. Abriu um site pornográfico? Ele também sabe. O Logging Test App, para Android, é o mais conhecido, pois oferece tanto a função de identificação quanto a de remoção. O Voodoo Carrier IQ Detector apenas localiza a posição do famigerado software em seu aparelho - função esta também exercida pelo Carrier IQ Detector.
  • 42.
  • 43.