SlideShare une entreprise Scribd logo
1  sur  16
Data Mining
Autores
Breno Fernandes
(Bren0_fernandes@hotmail.com)
Fabio Pereira
(fabioeletrotec@hotmail.com)

Natal, 14/10/2013

1
Universidade Federal do Rio Grande do Norte (UFRN)
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
Roteiro
•Introdução
•Desenvolvimento
•Conceito.
•Comparações.
•Benefícios.
•Limitações.
•Aplicações.

•Conclusão
•Referência

•Aspectos do projeto.
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

2
Introdução
•Princípio: Possuir dados, não é o suficiente, é preciso saber
utilizá-los.
•Os sistemas computacionais iniciaram a era da informação – a
informação é composta por dados.
•A manipulação eficiente de dados, auxilia na tomada de
decisões mais rápidas.
•Na década de 80, surge o conceito de mineração de dados.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

3
Conceito
•O que é Data Mining?

•Em que se baseia?
•Por que se usar?

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

4
Conceito
• Utiliza as seguintes técnicas:
– Classificação.
– Regressão.
– Clustering.
– Regras de associação.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

5
Conceitos
• Classificação:
– Construção de um modelo de dados através de uma curva de
aprendizado e valores de atributos classificadores que
permitem determinar novas classes de dados.
Job
Engineer

Carpenter

Income
<30K

Bad

>50K

Good

Income
<40K

Bad

>90K

Good

Doctor

Income
>100K

<50K

Bad

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

Good

6
Conceitos

• Clustering
– Através dessa ferramenta podemos separar em dois grupos
todas os nossos dados, o primeiro grupo é composto daqueles
que são similares entre sim(alocamos no mesmo cluster) e os
que não são similares(alocados em outro cluster).

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

7
Conceitos

• Regressão
– Através de uma gama de dados podemos traçar uma função de
aprendizado que mapeia de forma os nosso dados.
– A partir desses dados podemos traçar a melhor curva que
representa essa função.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

8
Conceitos
• Regras de associação.
– Através da analise do nosso banco de dados encontra padrões
frequentes e correlações podemos definir regras que regem o
acesso aos dados presentes no nosso banco.
– Cria regras que descrevem como eventos diferentes ocorrem
dependentes do outro.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

9
Comparação entre modelos
• Sistema de gerenciamento de banco de dados – SGBD
- Tem como função organizar e manipular os dados.
- Utiliza apenas palavras chave para encontrar os dados desejados.
- Retorna todos os resultados possíveis.

• Data Warehouse
- Trata grandes volumes de dados.
- Normalmente aplicado a sistemas transacionais.
- Devido ao tipo de sistema de aplicação , trabalha com bancos estáticos.

• Data Mining
- Trata grandes volumes de dados.
- Trabalha com bancos dinâmicos.
- Tem como função desconsiderar padrões específicos para conseguir criar
padrões genéricos.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

10
Benefícios
• Necessidade acessar informação da ordem de Peta.
• Permite atribuir informação a um conjunto de dados existente.
• Conjuntos de informações antigas podem ser utilizadas para gerar
novos dados.
• Através do Data Mining as empresas podem prestar serviços com
maior qualidade e direcionamento aos seus clientes.
• Não possui limitação de aplicação, partindo desde o mundo de
P&D até aplicações em mercado, industria e saúde.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

11
Limitações
• Necessita de parâmetros-guia adequados.
– Caso contrário, o processo se torna lento.

• Necessita de um banco de dados altamente confiável.
– Sem redundâncias

• Custo para implementação é relativamente alto.
– Devido ao custo das ferramentas utilizadas na mineração.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

12
Aplicações

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

13
Conclusão
• A quantidade de dados só tende a crescer com o surgimento de
novas tecnologias.

• Cada vez mais será necessário a presença de ferramentas
como o Data Mining.
• Em telecomunicações não será diferente visto a presença de
sistemas smarts, estes que exigem uma grande carga de
metadados.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

14
Bibliografia
• Camilo, Cássio O.; Silva, João C.; Mineração de dados:
conceitos, tarefas, métodos e ferramentas. UFG, 2009.
• Cardoso,Olinda N. P.; Machado, RosaT. M. Gestão do
conhecimento usando Data Mining. FGV,2007.
• Cortês, Sérgio C.; Porcaro, Rosa M.; Lifschitz, Sérgio. Mineração
de dados. PUC-Rio, 2002.
• Goldschimidt, Ronaldo; Passos, Emmanuel. Data mining: um
guia prático. Ed. Campus.
• Navega, Sérgio. Princípios essenciais do data mining.
Infoimagem, 2002.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

15
Muito obrigado pela atenção 

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

16

Contenu connexe

En vedette (11)

Terborgseweg-2-nov-2016 - kopie
Terborgseweg-2-nov-2016 - kopieTerborgseweg-2-nov-2016 - kopie
Terborgseweg-2-nov-2016 - kopie
 
Aula produção
Aula produçãoAula produção
Aula produção
 
SK asisten dosen
SK asisten dosenSK asisten dosen
SK asisten dosen
 
ISO 9001 ENG
ISO 9001 ENGISO 9001 ENG
ISO 9001 ENG
 
O que é o design parte 1
O que é o design  parte 1O que é o design  parte 1
O que é o design parte 1
 
Appetite Stimulants in Cancer Patients
Appetite Stimulants in Cancer PatientsAppetite Stimulants in Cancer Patients
Appetite Stimulants in Cancer Patients
 
cv
cvcv
cv
 
Arquivos nas nuvens
Arquivos nas nuvensArquivos nas nuvens
Arquivos nas nuvens
 
морозиво (1)
морозиво (1)морозиво (1)
морозиво (1)
 
Plan
PlanPlan
Plan
 
Mintzberg's Power School
Mintzberg's Power School Mintzberg's Power School
Mintzberg's Power School
 

Similaire à Data Mining

Apostila redes locais de computadores
Apostila redes locais de computadoresApostila redes locais de computadores
Apostila redes locais de computadores
fernandao777
 
Apresentação Final - Redes e Telecomunicações
Apresentação Final - Redes e TelecomunicaçõesApresentação Final - Redes e Telecomunicações
Apresentação Final - Redes e Telecomunicações
Bruno Lins Alves
 
Informática – inf 1 unidade 1
Informática – inf 1 unidade 1Informática – inf 1 unidade 1
Informática – inf 1 unidade 1
Rita Porfirio Cunha
 
Mini-curso: Grades e nuvens
Mini-curso: Grades e nuvensMini-curso: Grades e nuvens
Mini-curso: Grades e nuvens
Deivid Martins
 
Apostila sistemas de conectividade
Apostila sistemas de conectividadeApostila sistemas de conectividade
Apostila sistemas de conectividade
fernandao777
 
SACOMP2014_EMBINST_v5
SACOMP2014_EMBINST_v5SACOMP2014_EMBINST_v5
SACOMP2014_EMBINST_v5
Ad Souza Jr
 

Similaire à Data Mining (20)

1 noções básicas de transmissão e meios físicos de rede
1 noções básicas de transmissão e meios físicos de rede1 noções básicas de transmissão e meios físicos de rede
1 noções básicas de transmissão e meios físicos de rede
 
Apresentação setel
Apresentação setelApresentação setel
Apresentação setel
 
Apostila redes locais de computadores
Apostila redes locais de computadoresApostila redes locais de computadores
Apostila redes locais de computadores
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
CHQAO - GTI Unid 02.pdf
CHQAO - GTI Unid 02.pdfCHQAO - GTI Unid 02.pdf
CHQAO - GTI Unid 02.pdf
 
Aula01 - conceitos iniciais de infraestrura de redes
Aula01 -  conceitos iniciais de infraestrura de redesAula01 -  conceitos iniciais de infraestrura de redes
Aula01 - conceitos iniciais de infraestrura de redes
 
Apresentação Final - Redes e Telecomunicações
Apresentação Final - Redes e TelecomunicaçõesApresentação Final - Redes e Telecomunicações
Apresentação Final - Redes e Telecomunicações
 
Questões de Informática Comentadas para Concurso do INSS
Questões de Informática Comentadas para Concurso do INSSQuestões de Informática Comentadas para Concurso do INSS
Questões de Informática Comentadas para Concurso do INSS
 
Informática – inf 1 unidade 1
Informática – inf 1 unidade 1Informática – inf 1 unidade 1
Informática – inf 1 unidade 1
 
Mini-curso: Grades e nuvens
Mini-curso: Grades e nuvensMini-curso: Grades e nuvens
Mini-curso: Grades e nuvens
 
CONCEITOS E APLICAÇÕES DE REDES MEC
CONCEITOS E APLICAÇÕES DE REDES MECCONCEITOS E APLICAÇÕES DE REDES MEC
CONCEITOS E APLICAÇÕES DE REDES MEC
 
Report - Network Design - CEFET / IFAL.
Report - Network Design - CEFET / IFAL.Report - Network Design - CEFET / IFAL.
Report - Network Design - CEFET / IFAL.
 
Aula01 conceitos iniciais de infraestrura de redes
Aula01   conceitos iniciais de infraestrura de redesAula01   conceitos iniciais de infraestrura de redes
Aula01 conceitos iniciais de infraestrura de redes
 
Apostila sistemas de conectividade
Apostila sistemas de conectividadeApostila sistemas de conectividade
Apostila sistemas de conectividade
 
Big Data e Análise de Dados Massivos
Big Data e Análise de Dados MassivosBig Data e Análise de Dados Massivos
Big Data e Análise de Dados Massivos
 
SACOMP2014_EMBINST_v5
SACOMP2014_EMBINST_v5SACOMP2014_EMBINST_v5
SACOMP2014_EMBINST_v5
 
Research Group on High Performance Computing - MDCC/UFC - Fortaleza, Brazil
Research Group on High Performance Computing - MDCC/UFC - Fortaleza, BrazilResearch Group on High Performance Computing - MDCC/UFC - Fortaleza, Brazil
Research Group on High Performance Computing - MDCC/UFC - Fortaleza, Brazil
 
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos Marconi
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos MarconiRioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos Marconi
RioInfo 2010 - Fórum de Negócios - Salão da Inovação - Marcos Marconi
 
Scratch - Ensinar a programar de forma divertida
Scratch - Ensinar a programar de forma divertidaScratch - Ensinar a programar de forma divertida
Scratch - Ensinar a programar de forma divertida
 
PETIC SEAD/SE 2.0
PETIC SEAD/SE 2.0PETIC SEAD/SE 2.0
PETIC SEAD/SE 2.0
 

Dernier

Dernier (8)

Boas práticas de programação com Object Calisthenics
Boas práticas de programação com Object CalisthenicsBoas práticas de programação com Object Calisthenics
Boas práticas de programação com Object Calisthenics
 
Padrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemploPadrões de Projeto: Proxy e Command com exemplo
Padrões de Projeto: Proxy e Command com exemplo
 
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docxATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
ATIVIDADE 1 - LOGÍSTICA EMPRESARIAL - 52_2024.docx
 
Programação Orientada a Objetos - 4 Pilares.pdf
Programação Orientada a Objetos - 4 Pilares.pdfProgramação Orientada a Objetos - 4 Pilares.pdf
Programação Orientada a Objetos - 4 Pilares.pdf
 
Luís Kitota AWS Discovery Day Ka Solution.pdf
Luís Kitota AWS Discovery Day Ka Solution.pdfLuís Kitota AWS Discovery Day Ka Solution.pdf
Luís Kitota AWS Discovery Day Ka Solution.pdf
 
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docxATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
ATIVIDADE 1 - GCOM - GESTÃO DA INFORMAÇÃO - 54_2024.docx
 
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docxATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
ATIVIDADE 1 - CUSTOS DE PRODUÇÃO - 52_2024.docx
 
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docxATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
ATIVIDADE 1 - ESTRUTURA DE DADOS II - 52_2024.docx
 

Data Mining

  • 1. Data Mining Autores Breno Fernandes (Bren0_fernandes@hotmail.com) Fabio Pereira (fabioeletrotec@hotmail.com) Natal, 14/10/2013 1 Universidade Federal do Rio Grande do Norte (UFRN) Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
  • 3. Introdução •Princípio: Possuir dados, não é o suficiente, é preciso saber utilizá-los. •Os sistemas computacionais iniciaram a era da informação – a informação é composta por dados. •A manipulação eficiente de dados, auxilia na tomada de decisões mais rápidas. •Na década de 80, surge o conceito de mineração de dados. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 3
  • 4. Conceito •O que é Data Mining? •Em que se baseia? •Por que se usar? Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 4
  • 5. Conceito • Utiliza as seguintes técnicas: – Classificação. – Regressão. – Clustering. – Regras de associação. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 5
  • 6. Conceitos • Classificação: – Construção de um modelo de dados através de uma curva de aprendizado e valores de atributos classificadores que permitem determinar novas classes de dados. Job Engineer Carpenter Income <30K Bad >50K Good Income <40K Bad >90K Good Doctor Income >100K <50K Bad Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN Good 6
  • 7. Conceitos • Clustering – Através dessa ferramenta podemos separar em dois grupos todas os nossos dados, o primeiro grupo é composto daqueles que são similares entre sim(alocamos no mesmo cluster) e os que não são similares(alocados em outro cluster). Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 7
  • 8. Conceitos • Regressão – Através de uma gama de dados podemos traçar uma função de aprendizado que mapeia de forma os nosso dados. – A partir desses dados podemos traçar a melhor curva que representa essa função. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 8
  • 9. Conceitos • Regras de associação. – Através da analise do nosso banco de dados encontra padrões frequentes e correlações podemos definir regras que regem o acesso aos dados presentes no nosso banco. – Cria regras que descrevem como eventos diferentes ocorrem dependentes do outro. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 9
  • 10. Comparação entre modelos • Sistema de gerenciamento de banco de dados – SGBD - Tem como função organizar e manipular os dados. - Utiliza apenas palavras chave para encontrar os dados desejados. - Retorna todos os resultados possíveis. • Data Warehouse - Trata grandes volumes de dados. - Normalmente aplicado a sistemas transacionais. - Devido ao tipo de sistema de aplicação , trabalha com bancos estáticos. • Data Mining - Trata grandes volumes de dados. - Trabalha com bancos dinâmicos. - Tem como função desconsiderar padrões específicos para conseguir criar padrões genéricos. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 10
  • 11. Benefícios • Necessidade acessar informação da ordem de Peta. • Permite atribuir informação a um conjunto de dados existente. • Conjuntos de informações antigas podem ser utilizadas para gerar novos dados. • Através do Data Mining as empresas podem prestar serviços com maior qualidade e direcionamento aos seus clientes. • Não possui limitação de aplicação, partindo desde o mundo de P&D até aplicações em mercado, industria e saúde. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 11
  • 12. Limitações • Necessita de parâmetros-guia adequados. – Caso contrário, o processo se torna lento. • Necessita de um banco de dados altamente confiável. – Sem redundâncias • Custo para implementação é relativamente alto. – Devido ao custo das ferramentas utilizadas na mineração. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 12
  • 13. Aplicações Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 13
  • 14. Conclusão • A quantidade de dados só tende a crescer com o surgimento de novas tecnologias. • Cada vez mais será necessário a presença de ferramentas como o Data Mining. • Em telecomunicações não será diferente visto a presença de sistemas smarts, estes que exigem uma grande carga de metadados. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 14
  • 15. Bibliografia • Camilo, Cássio O.; Silva, João C.; Mineração de dados: conceitos, tarefas, métodos e ferramentas. UFG, 2009. • Cardoso,Olinda N. P.; Machado, RosaT. M. Gestão do conhecimento usando Data Mining. FGV,2007. • Cortês, Sérgio C.; Porcaro, Rosa M.; Lifschitz, Sérgio. Mineração de dados. PUC-Rio, 2002. • Goldschimidt, Ronaldo; Passos, Emmanuel. Data mining: um guia prático. Ed. Campus. • Navega, Sérgio. Princípios essenciais do data mining. Infoimagem, 2002. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 15
  • 16. Muito obrigado pela atenção  Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 16