SlideShare une entreprise Scribd logo
1  sur  22
Télécharger pour lire hors ligne
Data Mining



Hênio Carlos
Iessa Mota
Mariana Caroline Costa
Marcela Mayara Barbosa
Nilton Rodrigues Pereira
Data Mining



•   “Mineração de dados é a exploração e análise de
    dados, por meios automáticos ou semiautomáticos, em
    grandes quantidades de dados, com o objetivo de
    descobrir regras ou padrões interessantes.”



    Michael J. A. Berry; Gordon Linoff, “Data Mining Techiques for Marketing, Sales, and customer
Support”; John Wiley & Sons, Inc., 1997.
Data Mining
   Bancos de Dados

   Limpeza (consistência, preenchimento de
    informações, remoção de ruído e
    redundâncias)

   (Data Marts e Data Warehouses)

   Um analista refina e conduz o processo até
    que valiosos padrões apareçam.
Data Mining
Funcionalidade em Data Mining



   Funcionalidade em Data Mining

 Analise de Descritiva
 Análise de Prognóstico
Funcionalidade em Data Mining
Técnicas de exploração de dados




Técnicas de exploração de dados
•   Técnicas de estatísticas
•   Árvores de decisão
Técnicas de exploração de dados

Árvores de decisão
Técnicas de exploração de dados




Regras de associação
Técnicas de exploração de dados




Redes neurais artificiais
Algoritmos Genéticos


       Algoritmos Genéticos
“Quanto melhor um indivíduo se adaptar ao seu
   meio ambiente, maior será sua chance de
       sobreviver e gerar descendentes.”

              (DARWIN, 1859)
Algoritmos Genéticos


 Algoritmos Genéticos – O que são?

 Os Algoritmos Genéticos são uma classe de
  procedimentos, com passos distintos bem
  definidos.
 Essa classe se fundamenta em analogias a
  conceitos biológicos já testadas à exaustão.
 Cada passo distinto pode ter diversas versões
  diferentes.
Algoritmos Genéticos

   Algoritmos Genéticos – Para que
              servem?
 Busca e Otimização
 Amplamente utilizados, com sucesso,  em
  problemas de difícil manipulação pelas técnicas
  tradicionais
 Eficiência X Flexibilidade
Algoritmos Genéticos

Algoritmos Genéticos –
Funcionamento Fundamental
1.   Gerar População Inicial
2.   Descartar uma parte dos Indivíduos menos
     aptos
3.   Aplicar operadores de reprodução
4.   Aplicar operadores de mutação
5.   Se o critério de parada foi satisfeito, encerrar.
     Senão, voltar ao passo 2.
Algoritmos Genéticos



Algoritmos Genéticos - Desvantagens
 Desvantagens:
     Larga super produção de indivíduos;
     Envolve enorme quantidade de energia e tempo;
     Todo o processo parece ter pouco propósito, pois
      que o melhoramento das espécies depende do fator
      sorte
Algoritmos Genéticos


Algoritmos Genéticos - Vantagens

 Vantagens:
  Solidez e paralelismo inerente (o processo não fica
  preso em um local nem fica retido em soluções
  genéricas)
Algoritmos Genéticos



Algoritmos Genéticos – Aplicação
 Alocação de tarefas
 Configuração de sistemas complexos
 Seleção de Rotas
 Problemas de Otimização e de Aprendizagem de
  Máquina
 Problemas cuja solução seja um estado final e não
  um caminho
Data Mining

                 Conclusão
 Data mininig é um processo que
                              permite
  compreender o comportamento dos dados
 Pode ser bem aplicado em diversas   áreas de
  negócios
 Para que a mineração de dados seja bem sucedida
  é preciso, uma busca apropriada, analise e
  preparação dos dados encontrados
Exemplos
   Empresas de software para Data mining:

       SAS                     http://www.sas.com
       Information Havesting   http://www.convex.com
       Red Brick               http://www.redbrick.com
       Oracle                  http://www.oracle.com
       Sybase                  http://www.sybase.com
       Informix                http://www.informix.com
       IBM                     http://www.ibm.com
Data Mining
Ferramentas para Data Mining

 Os    softwares para data mining custam muito
    caro (uma licença single-user pode custar
    mais de 40.000 dólares).




Leia mais em: Data Mining – Novos Recursos nos Sistemas de Banco de Dados
http://www.devmedia.com.br/data-mining-novos-recursos-nos-sistemas-de-banco-de-
dados/5892#ixzz2Baq5JZfy
Referências

                           Referências
   Michael J. A. Berry; Gordon Linoff, “Data Mining Techiques for
    Marketing, Sales, and customer Support”; John Wiley & Sons, Inc., 1997
   http://www-pcc.qub.ac.uk/tec/courses/datamining
   http://www.santafe.edu/~kurt
   http://www.devmedia.com.br/data-mining-novos-recursos-nos-sistemas-
    de-banco-de-dados/5892#ixzz2Baq5JZfy
   http://www.infoescola.com/informatica/data-mining/
   http://amigonerd.net/trabalho/19327-data-mining
   http://www.mackenzie.br/7589.html
FIM

ALGUMA PERGUNTA??? NÃO NÉ...

Contenu connexe

Tendances

Modelo Relacional, Rede e Hierárquico
Modelo Relacional, Rede e HierárquicoModelo Relacional, Rede e Hierárquico
Modelo Relacional, Rede e Hierárquico
rosimaracorsino
 
Teoria Geral de Sistemas
Teoria Geral de SistemasTeoria Geral de Sistemas
Teoria Geral de Sistemas
paulocsm
 
Modelagem relacional e normalização de dados
Modelagem relacional e normalização de dadosModelagem relacional e normalização de dados
Modelagem relacional e normalização de dados
julianaveregue
 

Tendances (20)

Modelo Relacional, Rede e Hierárquico
Modelo Relacional, Rede e HierárquicoModelo Relacional, Rede e Hierárquico
Modelo Relacional, Rede e Hierárquico
 
Ferramentas de Gerenciamento de Rede
Ferramentas de Gerenciamento de RedeFerramentas de Gerenciamento de Rede
Ferramentas de Gerenciamento de Rede
 
Data science
Data scienceData science
Data science
 
Modelagem de Sistemas de Informação
Modelagem de Sistemas de InformaçãoModelagem de Sistemas de Informação
Modelagem de Sistemas de Informação
 
Metadados: dados a respeito de dados
Metadados: dados a respeito de dadosMetadados: dados a respeito de dados
Metadados: dados a respeito de dados
 
Análise, projeto e implementação de sistemas
Análise, projeto e implementação de sistemasAnálise, projeto e implementação de sistemas
Análise, projeto e implementação de sistemas
 
Capítulo 10 - Como melhorar a tomada de decisão e a gestão do conhecimento
Capítulo 10 - Como melhorar a tomada de decisão e a gestão do conhecimentoCapítulo 10 - Como melhorar a tomada de decisão e a gestão do conhecimento
Capítulo 10 - Como melhorar a tomada de decisão e a gestão do conhecimento
 
Bancos de dados NoSQL: uma visão geral
Bancos de dados NoSQL: uma visão geralBancos de dados NoSQL: uma visão geral
Bancos de dados NoSQL: uma visão geral
 
1.Introdução Banco de Dados
1.Introdução Banco de Dados1.Introdução Banco de Dados
1.Introdução Banco de Dados
 
Teoria Geral de Sistemas
Teoria Geral de SistemasTeoria Geral de Sistemas
Teoria Geral de Sistemas
 
Virtualização
VirtualizaçãoVirtualização
Virtualização
 
Apostila Java Web com JSF, JPA e Primefaces
Apostila Java Web com JSF, JPA e PrimefacesApostila Java Web com JSF, JPA e Primefaces
Apostila Java Web com JSF, JPA e Primefaces
 
Modelos de banco de dados
Modelos de banco de dadosModelos de banco de dados
Modelos de banco de dados
 
O que é framework
O que é frameworkO que é framework
O que é framework
 
Introdução a Arquitetura de Sistemas
Introdução a Arquitetura de SistemasIntrodução a Arquitetura de Sistemas
Introdução a Arquitetura de Sistemas
 
Gestão de Pessoas - Contexto atual e Gestão por Competências
Gestão de Pessoas - Contexto atual e Gestão por CompetênciasGestão de Pessoas - Contexto atual e Gestão por Competências
Gestão de Pessoas - Contexto atual e Gestão por Competências
 
Aula 01 - Fundamentos de Banco de Dados (2).pdf
Aula 01 - Fundamentos de Banco de Dados (2).pdfAula 01 - Fundamentos de Banco de Dados (2).pdf
Aula 01 - Fundamentos de Banco de Dados (2).pdf
 
Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)
Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)
Banco de Dados I - Aula 06 - Banco de Dados Relacional (Modelo Lógico)
 
Modelagem relacional e normalização de dados
Modelagem relacional e normalização de dadosModelagem relacional e normalização de dados
Modelagem relacional e normalização de dados
 
Modelos de base de dados
Modelos de base de dadosModelos de base de dados
Modelos de base de dados
 

En vedette

Seminário paty aula 9 04-05-2011
Seminário paty aula 9 04-05-2011Seminário paty aula 9 04-05-2011
Seminário paty aula 9 04-05-2011
Patricia Neubert
 
Custos e controle social bh. 22.04.12
Custos e controle social  bh. 22.04.12Custos e controle social  bh. 22.04.12
Custos e controle social bh. 22.04.12
ufumec
 
sci10lmu2-150623083448-lva1-app6891
sci10lmu2-150623083448-lva1-app6891sci10lmu2-150623083448-lva1-app6891
sci10lmu2-150623083448-lva1-app6891
Edgar Pural
 
Big Data e Data Science: admirável mundo novo - IV SIC IFNMG
Big Data e Data Science: admirável mundo novo - IV SIC IFNMGBig Data e Data Science: admirável mundo novo - IV SIC IFNMG
Big Data e Data Science: admirável mundo novo - IV SIC IFNMG
Petronio Candido
 

En vedette (20)

Data Mining
Data MiningData Mining
Data Mining
 
Data Mining
Data Mining Data Mining
Data Mining
 
Data warehouse & Data mining
Data warehouse & Data miningData warehouse & Data mining
Data warehouse & Data mining
 
Técnicas de data mining
Técnicas de data miningTécnicas de data mining
Técnicas de data mining
 
Data warehouse & data mining
Data warehouse & data miningData warehouse & data mining
Data warehouse & data mining
 
Seminário paty aula 9 04-05-2011
Seminário paty aula 9 04-05-2011Seminário paty aula 9 04-05-2011
Seminário paty aula 9 04-05-2011
 
Data mining
Data miningData mining
Data mining
 
Data mining
Data miningData mining
Data mining
 
Transparência em Belém: a hora é agora
Transparência em Belém: a hora é agora Transparência em Belém: a hora é agora
Transparência em Belém: a hora é agora
 
Big Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e TecnologiaBig Data Analytics - Data Science - Aplicação e Tecnologia
Big Data Analytics - Data Science - Aplicação e Tecnologia
 
Custos e controle social bh. 22.04.12
Custos e controle social  bh. 22.04.12Custos e controle social  bh. 22.04.12
Custos e controle social bh. 22.04.12
 
Painel 00 01 - wesley - Análise de dados como ferramenta estratégica para o...
Painel 00   01 - wesley - Análise de dados como ferramenta estratégica para o...Painel 00   01 - wesley - Análise de dados como ferramenta estratégica para o...
Painel 00 01 - wesley - Análise de dados como ferramenta estratégica para o...
 
Data Mining e Data Warehouse
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data Warehouse
 
Mineração de dados
Mineração de dadosMineração de dados
Mineração de dados
 
sci10lmu2-150623083448-lva1-app6891
sci10lmu2-150623083448-lva1-app6891sci10lmu2-150623083448-lva1-app6891
sci10lmu2-150623083448-lva1-app6891
 
Biwa summit 2015 oaa oracle data miner hands on lab
Biwa summit 2015 oaa oracle data miner hands on labBiwa summit 2015 oaa oracle data miner hands on lab
Biwa summit 2015 oaa oracle data miner hands on lab
 
Big Data e Data Science: admirável mundo novo - IV SIC IFNMG
Big Data e Data Science: admirável mundo novo - IV SIC IFNMGBig Data e Data Science: admirável mundo novo - IV SIC IFNMG
Big Data e Data Science: admirável mundo novo - IV SIC IFNMG
 
Plano contigência
Plano contigênciaPlano contigência
Plano contigência
 
La visión del ministerio de planificación- TCU
La visión del ministerio de planificación- TCULa visión del ministerio de planificación- TCU
La visión del ministerio de planificación- TCU
 
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big DataContexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
 

Similaire à Apresentação data mining

Similaire à Apresentação data mining (20)

Mineração
MineraçãoMineração
Mineração
 
Rene Seguranca Ai Agents
Rene Seguranca Ai AgentsRene Seguranca Ai Agents
Rene Seguranca Ai Agents
 
Clustering
ClusteringClustering
Clustering
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
Data mining
Data miningData mining
Data mining
 
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
 
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
Minicurso: O que o twitter está pensando? Extraindo informações do twitter ut...
 
Big Data x Data Mining - Hadoop
Big Data x Data Mining - HadoopBig Data x Data Mining - Hadoop
Big Data x Data Mining - Hadoop
 
Artigo 1-fraudes-agua-passini-seminco2002-6
Artigo 1-fraudes-agua-passini-seminco2002-6Artigo 1-fraudes-agua-passini-seminco2002-6
Artigo 1-fraudes-agua-passini-seminco2002-6
 
Weka pentaho day2014-fidelis
Weka pentaho day2014-fidelisWeka pentaho day2014-fidelis
Weka pentaho day2014-fidelis
 
Aula11-12 TESI UFS - Explroracao e Gestao de SI nas Empresas Digitais
Aula11-12 TESI UFS - Explroracao e Gestao de SI nas Empresas DigitaisAula11-12 TESI UFS - Explroracao e Gestao de SI nas Empresas Digitais
Aula11-12 TESI UFS - Explroracao e Gestao de SI nas Empresas Digitais
 
Big Data e suas Vertentes
Big Data e suas VertentesBig Data e suas Vertentes
Big Data e suas Vertentes
 
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine LearningPalestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
Palestra Cobisa-2019 - Desenvolvendo Cultura Analítica e Machine Learning
 
Big Data
Big DataBig Data
Big Data
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?Qual é o futuro da estratégia de dados?
Qual é o futuro da estratégia de dados?
 
Mineração Livre de Dados
Mineração Livre de DadosMineração Livre de Dados
Mineração Livre de Dados
 
Pentaho Weka latinoware
Pentaho Weka latinowarePentaho Weka latinoware
Pentaho Weka latinoware
 
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...
 
Big Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e MercadoBig Data e Data Science - Tecnologia e Mercado
Big Data e Data Science - Tecnologia e Mercado
 

Apresentação data mining

  • 1. Data Mining Hênio Carlos Iessa Mota Mariana Caroline Costa Marcela Mayara Barbosa Nilton Rodrigues Pereira
  • 2. Data Mining • “Mineração de dados é a exploração e análise de dados, por meios automáticos ou semiautomáticos, em grandes quantidades de dados, com o objetivo de descobrir regras ou padrões interessantes.” Michael J. A. Berry; Gordon Linoff, “Data Mining Techiques for Marketing, Sales, and customer Support”; John Wiley & Sons, Inc., 1997.
  • 3. Data Mining  Bancos de Dados  Limpeza (consistência, preenchimento de informações, remoção de ruído e redundâncias)  (Data Marts e Data Warehouses)  Um analista refina e conduz o processo até que valiosos padrões apareçam.
  • 5. Funcionalidade em Data Mining Funcionalidade em Data Mining  Analise de Descritiva  Análise de Prognóstico
  • 7. Técnicas de exploração de dados Técnicas de exploração de dados • Técnicas de estatísticas • Árvores de decisão
  • 8. Técnicas de exploração de dados Árvores de decisão
  • 9. Técnicas de exploração de dados Regras de associação
  • 10. Técnicas de exploração de dados Redes neurais artificiais
  • 11. Algoritmos Genéticos Algoritmos Genéticos “Quanto melhor um indivíduo se adaptar ao seu meio ambiente, maior será sua chance de sobreviver e gerar descendentes.” (DARWIN, 1859)
  • 12. Algoritmos Genéticos Algoritmos Genéticos – O que são?  Os Algoritmos Genéticos são uma classe de procedimentos, com passos distintos bem definidos.  Essa classe se fundamenta em analogias a conceitos biológicos já testadas à exaustão.  Cada passo distinto pode ter diversas versões diferentes.
  • 13. Algoritmos Genéticos Algoritmos Genéticos – Para que servem?  Busca e Otimização  Amplamente utilizados, com sucesso, em problemas de difícil manipulação pelas técnicas tradicionais  Eficiência X Flexibilidade
  • 14. Algoritmos Genéticos Algoritmos Genéticos – Funcionamento Fundamental 1. Gerar População Inicial 2. Descartar uma parte dos Indivíduos menos aptos 3. Aplicar operadores de reprodução 4. Aplicar operadores de mutação 5. Se o critério de parada foi satisfeito, encerrar. Senão, voltar ao passo 2.
  • 15. Algoritmos Genéticos Algoritmos Genéticos - Desvantagens  Desvantagens:  Larga super produção de indivíduos;  Envolve enorme quantidade de energia e tempo;  Todo o processo parece ter pouco propósito, pois que o melhoramento das espécies depende do fator sorte
  • 16. Algoritmos Genéticos Algoritmos Genéticos - Vantagens  Vantagens: Solidez e paralelismo inerente (o processo não fica preso em um local nem fica retido em soluções genéricas)
  • 17. Algoritmos Genéticos Algoritmos Genéticos – Aplicação  Alocação de tarefas  Configuração de sistemas complexos  Seleção de Rotas  Problemas de Otimização e de Aprendizagem de Máquina  Problemas cuja solução seja um estado final e não um caminho
  • 18. Data Mining Conclusão  Data mininig é um processo que permite compreender o comportamento dos dados  Pode ser bem aplicado em diversas áreas de negócios  Para que a mineração de dados seja bem sucedida é preciso, uma busca apropriada, analise e preparação dos dados encontrados
  • 19. Exemplos  Empresas de software para Data mining:  SAS http://www.sas.com  Information Havesting http://www.convex.com  Red Brick http://www.redbrick.com  Oracle http://www.oracle.com  Sybase http://www.sybase.com  Informix http://www.informix.com  IBM http://www.ibm.com
  • 20. Data Mining Ferramentas para Data Mining  Os softwares para data mining custam muito caro (uma licença single-user pode custar mais de 40.000 dólares). Leia mais em: Data Mining – Novos Recursos nos Sistemas de Banco de Dados http://www.devmedia.com.br/data-mining-novos-recursos-nos-sistemas-de-banco-de- dados/5892#ixzz2Baq5JZfy
  • 21. Referências Referências  Michael J. A. Berry; Gordon Linoff, “Data Mining Techiques for Marketing, Sales, and customer Support”; John Wiley & Sons, Inc., 1997  http://www-pcc.qub.ac.uk/tec/courses/datamining  http://www.santafe.edu/~kurt  http://www.devmedia.com.br/data-mining-novos-recursos-nos-sistemas- de-banco-de-dados/5892#ixzz2Baq5JZfy  http://www.infoescola.com/informatica/data-mining/  http://amigonerd.net/trabalho/19327-data-mining  http://www.mackenzie.br/7589.html