SlideShare une entreprise Scribd logo
1  sur  16
Télécharger pour lire hors ligne
III Workshop on Computational Intelligence




      Avaliação de Partições vs
        Avaliação de Clusters
     Gustavo Henrique Rodrigues Pinto Tomas
                 Dra. Katti Faceli
             Projeto financiado por:
    Programa Institucional de Bolsas de Iniciação Cientifica – PIBIC
Conselho Nacional de Desenvolvimento Científico e Tecnológico – CNPq
       Universidade Federal de São Carlos – Campus Sorocaba
Motivação
• Definição de cluster;
• Abordagens tradicionais: cada algoritmo
  segue um critério diferente;
• Abordagens multi-objetivos: Ex.: MOCLE.
• Nova Abordagem: Análise de Clusters
  Individualmente.



       Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Motivação


Preparação dos
                                      Agrupamento                                  Validação
    Dados




                                                   Critérios de Agrupamento



          Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Critérios de Agrupamento
• Compactação:
   – Pequena variação intra-cluster;
   – Clusters esféricos e/ou bem separados;
• Encadeamento:
   – Objetos vizinhos tem que compartilhar o mesmo cluster;
   – Adequado para clusters com forma arbitrária;
   – Ruim quando há pouca separação entre os clusters;
• Separação:
   – Somente a separação espacial fornece pouca informação;
   – Aplicada em associação com outros critérios.
         Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Abordagens



  Estrutura Real                                                 K-Means




    Single Link                                                  Average
Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Índices Relativos
     Índice                          Critério                              Característica

  Desvio Total                   Compactação                       Avalia a qualidade de um
  (Adaptado)                                                      agrupamento em termos da
                                                                   compactação dos clusters
 Conectividade                  Encadeamento                  Reflete o grau com que os objetos
  (Adaptado)                                                  vizinhos são colocados no mesmo
                                                                            cluster
    Silhueta                    Compactação e                Baseia-se na proximidade entre os
                                  Separação                 objetos de um cluster e na distância
                                                            dos objetos de um cluster ao cluster
                                                                       mais próximo
Consistência-KNN                Encadeamento                    Os objetos de cada classe são
  (Adaptado)                                                  distribuídos de forma consistente.


              Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Experimento Realizado
1. Preparação dos dados artificiais FCPS;
2. Execução para vários conjuntos de dados, utilizando
   a distância Euclideana como função de
   proximidade;
3. Tratamento dos resultados;
4. Plotagem de gráficos;
5. Análise dos índices.

        Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Experimento Realizado
                                              -Normalizar: Silhueta, Desvio Total
1. Preparação dos dados artificiais Conectividade
                                  e
                                    FCPS;
                            - Alterar melhor valor: Silhueta e
2.   Execução para vários conjuntos de dados, utilizando
                                    Consistência-KNN
     a distância Euclideana como função de
     proximidade;
3. Tratamento dos resultados;
4. Plotagem de gráficos;
5. Análise dos índices.

          Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Conjunto de Dados
       Fundamental Clustering Problems Suite (FCPS)




Wing Nut                                                      Atom




  LSun                                                       Target


Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Resultados: Wing Nut
1,0
0,9
0,8
0,7
0,6                                                                                              sil
0,5                                                                                              dev
             0,39                           0,39                          0,39
0,4                                                                                              con
      0,28                           0,28                          0,28
0,3                                                                                              cknn
0,2                        0,12                    0,13 0,11                     0,13 0,14
0,1                 0,01
0,0
              Real                            C1                            C2
              Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Resultados: Atom
                                            1,00
1,0
0,9
0,8
0,7                                  0,62
0,6          0,55
                                                                                                 sil
0,5                                                                                              dev
0,4   0,34                                                                                       con
0,3                                                                                              cknn
0,2
                                                                          0,10
                                                                                        0,08
0,1                     0,04                              0,01
                                                                   0,07
                    0,00                           0,00                          0,00
0,0
              Real                            C1                            C2
              Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Resultados: LSun
1,0
0,9
0,8
0,7
0,6                                                                                               sil
0,5                                                                                               dev
0,4                                                                                               con
                            0,29 0,29              0,32 0,29
0,3   0,26
             0,24
                                                                                        0,26      cknn
                                                                          0,16
0,2                 0,13                                        0,13             0,13
0,1
               0,01                  0,00 0,00              0,00                   0,01
0,0
             Real                  C1                     C2                      C3
               Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Resultados: Target
                                                         1,00          1,00          1,00          1,00
1,0
0,9
0,8
               0,67                               0,70
0,7                                                             0,65          0,65          0,65

0,6
                                 0,61
                                                                                                          sil
0,5      0,44                                                                                             dev
                                      0,41
0,4   0,35                                                                                                con
0,3                                                                                                       cknn
0,2                   0,13
        0,09
0,1                      0,08
                                               0,02        0,02           0,02          0,02
                          0,00 0,00    0,00 0,00 0,01         0,01          0,01           0,01
0,0
        Real             C1            C2          C3           C4            C5             C6
                 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Considerações Finais
• Análise de clusters individualmente é uma abordagem
  promissora;

• Conjunto de índices complementares para avaliar
  estruturas heterogêneas;

• Qualidade baixa de um cluster influência
  negativamente o resultado da partição.


        Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Considerações Finais
• As estruturas destes conjuntos de dados
  favorecem os critérios baseados em
  encadeamento;
• O índice consistência-KNN obteve em média bom
  desempenho;
• Índices com mesmo critério podem se comportar
  de maneira diferente.
        Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Dúvidas?

Gustavo Henrique Rodrigues Pinto Tomas
 Email: gustavoh_rodrigues@hotmail.com

                       Katti Faceli
                    Email: katti@ufscar.br


                            Obrigado!

Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba

Contenu connexe

En vedette

Контекстная реклама для медицинских клиник. Итоги 2014. тренды и прогнозы на ...
Контекстная реклама для медицинских клиник. Итоги 2014. тренды и прогнозы на ...Контекстная реклама для медицинских клиник. Итоги 2014. тренды и прогнозы на ...
Контекстная реклама для медицинских клиник. Итоги 2014. тренды и прогнозы на ...Maxim Samoylenko
 
εναλλακτικη μεταφραση στα κερκυραϊκα του θουκυδιδη
εναλλακτικη μεταφραση στα κερκυραϊκα του θουκυδιδηεναλλακτικη μεταφραση στα κερκυραϊκα του θουκυδιδη
εναλλακτικη μεταφραση στα κερκυραϊκα του θουκυδιδηEleni Kots
 
WSSFN Welcome letter
WSSFN Welcome letterWSSFN Welcome letter
WSSFN Welcome letterAmit Ghosh
 
DLIFLC Diploma
DLIFLC DiplomaDLIFLC Diploma
DLIFLC DiplomaMatt Beard
 
Autoevaluacion capitulo 1
Autoevaluacion capitulo 1Autoevaluacion capitulo 1
Autoevaluacion capitulo 1Mayra R H
 
Im Simply Saying Corregit
Im Simply Saying CorregitIm Simply Saying Corregit
Im Simply Saying CorregitOreto Masià
 
La Granja De Don Botijo[1][1]
La Granja De Don Botijo[1][1]La Granja De Don Botijo[1][1]
La Granja De Don Botijo[1][1]hedone
 
english-mini-brochure6
english-mini-brochure6english-mini-brochure6
english-mini-brochure6Julia Sevy
 
13 march 2015 ram deep
13 march 2015 ram deep13 march 2015 ram deep
13 march 2015 ram deepSantosh Tiwari
 

En vedette (19)

Контекстная реклама для медицинских клиник. Итоги 2014. тренды и прогнозы на ...
Контекстная реклама для медицинских клиник. Итоги 2014. тренды и прогнозы на ...Контекстная реклама для медицинских клиник. Итоги 2014. тренды и прогнозы на ...
Контекстная реклама для медицинских клиник. Итоги 2014. тренды и прогнозы на ...
 
Søk 5
Søk 5Søk 5
Søk 5
 
João Sem Medo na Ajudada 2
João Sem Medo na Ajudada 2João Sem Medo na Ajudada 2
João Sem Medo na Ajudada 2
 
εναλλακτικη μεταφραση στα κερκυραϊκα του θουκυδιδη
εναλλακτικη μεταφραση στα κερκυραϊκα του θουκυδιδηεναλλακτικη μεταφραση στα κερκυραϊκα του θουκυδιδη
εναλλακτικη μεταφραση στα κερκυραϊκα του θουκυδιδη
 
WSSFN Welcome letter
WSSFN Welcome letterWSSFN Welcome letter
WSSFN Welcome letter
 
DLIFLC Diploma
DLIFLC DiplomaDLIFLC Diploma
DLIFLC Diploma
 
Autoevaluacion capitulo 1
Autoevaluacion capitulo 1Autoevaluacion capitulo 1
Autoevaluacion capitulo 1
 
Babock Ref Letter
Babock Ref LetterBabock Ref Letter
Babock Ref Letter
 
Web services
Web  servicesWeb  services
Web services
 
RRD_Case_L2
RRD_Case_L2RRD_Case_L2
RRD_Case_L2
 
diploma medic
diploma medicdiploma medic
diploma medic
 
DiferenciaS
DiferenciaSDiferenciaS
DiferenciaS
 
Im Simply Saying Corregit
Im Simply Saying CorregitIm Simply Saying Corregit
Im Simply Saying Corregit
 
La Granja De Don Botijo[1][1]
La Granja De Don Botijo[1][1]La Granja De Don Botijo[1][1]
La Granja De Don Botijo[1][1]
 
Como ter ligação permanente com quem visita o meu site 24-05-2013
Como ter ligação permanente com quem visita o meu site   24-05-2013Como ter ligação permanente com quem visita o meu site   24-05-2013
Como ter ligação permanente com quem visita o meu site 24-05-2013
 
Apostila fundamentos de rede
Apostila fundamentos de redeApostila fundamentos de rede
Apostila fundamentos de rede
 
english-mini-brochure6
english-mini-brochure6english-mini-brochure6
english-mini-brochure6
 
کتاب فرهنگ فارسی آموز پیشرو آریان پور
کتاب فرهنگ فارسی آموز پیشرو آریان پورکتاب فرهنگ فارسی آموز پیشرو آریان پور
کتاب فرهنگ فارسی آموز پیشرو آریان پور
 
13 march 2015 ram deep
13 march 2015 ram deep13 march 2015 ram deep
13 march 2015 ram deep
 

Plus de Gustavo Henrique Rodrigues Pinto Tomas

Plus de Gustavo Henrique Rodrigues Pinto Tomas (7)

[Status Report 11/06] Uma arquitetura para Smart Cities baseada na Internet o...
[Status Report 11/06] Uma arquitetura para Smart Cities baseada na Internet o...[Status Report 11/06] Uma arquitetura para Smart Cities baseada na Internet o...
[Status Report 11/06] Uma arquitetura para Smart Cities baseada na Internet o...
 
O que o mercado espera de um [recém formado | formando]?
O que o mercado espera de um [recém formado | formando]?O que o mercado espera de um [recém formado | formando]?
O que o mercado espera de um [recém formado | formando]?
 
Uma arquitetura para Smart Cities baseada em Internet of Things - Status Report
Uma arquitetura para Smart Cities baseada em Internet of Things - Status ReportUma arquitetura para Smart Cities baseada em Internet of Things - Status Report
Uma arquitetura para Smart Cities baseada em Internet of Things - Status Report
 
Internet of Things and Smart Cities
Internet of Things and Smart CitiesInternet of Things and Smart Cities
Internet of Things and Smart Cities
 
Android: Intent, Broadcast Receiver e Notifications
Android: Intent, Broadcast Receiver e NotificationsAndroid: Intent, Broadcast Receiver e Notifications
Android: Intent, Broadcast Receiver e Notifications
 
Eucalyptus uma plataforma de cloud computing para qualquer tipo de usuário - ...
Eucalyptus uma plataforma de cloud computing para qualquer tipo de usuário - ...Eucalyptus uma plataforma de cloud computing para qualquer tipo de usuário - ...
Eucalyptus uma plataforma de cloud computing para qualquer tipo de usuário - ...
 
Eucalyptus uma plataforma de cloud computing para qualquer tipo de usuário
Eucalyptus uma plataforma de cloud computing para qualquer tipo de usuárioEucalyptus uma plataforma de cloud computing para qualquer tipo de usuário
Eucalyptus uma plataforma de cloud computing para qualquer tipo de usuário
 

Avaliacao de particao vs avaliacao de clusters wci 2010

  • 1. III Workshop on Computational Intelligence Avaliação de Partições vs Avaliação de Clusters Gustavo Henrique Rodrigues Pinto Tomas Dra. Katti Faceli Projeto financiado por: Programa Institucional de Bolsas de Iniciação Cientifica – PIBIC Conselho Nacional de Desenvolvimento Científico e Tecnológico – CNPq Universidade Federal de São Carlos – Campus Sorocaba
  • 2. Motivação • Definição de cluster; • Abordagens tradicionais: cada algoritmo segue um critério diferente; • Abordagens multi-objetivos: Ex.: MOCLE. • Nova Abordagem: Análise de Clusters Individualmente. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 3. Motivação Preparação dos Agrupamento Validação Dados Critérios de Agrupamento Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 4. Critérios de Agrupamento • Compactação: – Pequena variação intra-cluster; – Clusters esféricos e/ou bem separados; • Encadeamento: – Objetos vizinhos tem que compartilhar o mesmo cluster; – Adequado para clusters com forma arbitrária; – Ruim quando há pouca separação entre os clusters; • Separação: – Somente a separação espacial fornece pouca informação; – Aplicada em associação com outros critérios. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 5. Abordagens Estrutura Real K-Means Single Link Average Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 6. Índices Relativos Índice Critério Característica Desvio Total Compactação Avalia a qualidade de um (Adaptado) agrupamento em termos da compactação dos clusters Conectividade Encadeamento Reflete o grau com que os objetos (Adaptado) vizinhos são colocados no mesmo cluster Silhueta Compactação e Baseia-se na proximidade entre os Separação objetos de um cluster e na distância dos objetos de um cluster ao cluster mais próximo Consistência-KNN Encadeamento Os objetos de cada classe são (Adaptado) distribuídos de forma consistente. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 7. Experimento Realizado 1. Preparação dos dados artificiais FCPS; 2. Execução para vários conjuntos de dados, utilizando a distância Euclideana como função de proximidade; 3. Tratamento dos resultados; 4. Plotagem de gráficos; 5. Análise dos índices. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 8. Experimento Realizado -Normalizar: Silhueta, Desvio Total 1. Preparação dos dados artificiais Conectividade e FCPS; - Alterar melhor valor: Silhueta e 2. Execução para vários conjuntos de dados, utilizando Consistência-KNN a distância Euclideana como função de proximidade; 3. Tratamento dos resultados; 4. Plotagem de gráficos; 5. Análise dos índices. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 9. Conjunto de Dados Fundamental Clustering Problems Suite (FCPS) Wing Nut Atom LSun Target Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 10. Resultados: Wing Nut 1,0 0,9 0,8 0,7 0,6 sil 0,5 dev 0,39 0,39 0,39 0,4 con 0,28 0,28 0,28 0,3 cknn 0,2 0,12 0,13 0,11 0,13 0,14 0,1 0,01 0,0 Real C1 C2 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 11. Resultados: Atom 1,00 1,0 0,9 0,8 0,7 0,62 0,6 0,55 sil 0,5 dev 0,4 0,34 con 0,3 cknn 0,2 0,10 0,08 0,1 0,04 0,01 0,07 0,00 0,00 0,00 0,0 Real C1 C2 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 12. Resultados: LSun 1,0 0,9 0,8 0,7 0,6 sil 0,5 dev 0,4 con 0,29 0,29 0,32 0,29 0,3 0,26 0,24 0,26 cknn 0,16 0,2 0,13 0,13 0,13 0,1 0,01 0,00 0,00 0,00 0,01 0,0 Real C1 C2 C3 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 13. Resultados: Target 1,00 1,00 1,00 1,00 1,0 0,9 0,8 0,67 0,70 0,7 0,65 0,65 0,65 0,6 0,61 sil 0,5 0,44 dev 0,41 0,4 0,35 con 0,3 cknn 0,2 0,13 0,09 0,1 0,08 0,02 0,02 0,02 0,02 0,00 0,00 0,00 0,00 0,01 0,01 0,01 0,01 0,0 Real C1 C2 C3 C4 C5 C6 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 14. Considerações Finais • Análise de clusters individualmente é uma abordagem promissora; • Conjunto de índices complementares para avaliar estruturas heterogêneas; • Qualidade baixa de um cluster influência negativamente o resultado da partição. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 15. Considerações Finais • As estruturas destes conjuntos de dados favorecem os critérios baseados em encadeamento; • O índice consistência-KNN obteve em média bom desempenho; • Índices com mesmo critério podem se comportar de maneira diferente. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 16. Dúvidas? Gustavo Henrique Rodrigues Pinto Tomas Email: gustavoh_rodrigues@hotmail.com Katti Faceli Email: katti@ufscar.br Obrigado! Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba