III Workshop on Computational Intelligence




      Avaliação de Partições vs
        Avaliação de Clusters
     Gustavo Henrique Rodrigues Pinto Tomas
                 Dra. Katti Faceli
             Projeto financiado por:
    Programa Institucional de Bolsas de Iniciação Cientifica – PIBIC
Conselho Nacional de Desenvolvimento Científico e Tecnológico – CNPq
       Universidade Federal de São Carlos – Campus Sorocaba
Motivação
• Definição de cluster;
• Abordagens tradicionais: cada algoritmo
  segue um critério diferente;
• Abordagens multi-objetivos: Ex.: MOCLE.
• Nova Abordagem: Análise de Clusters
  Individualmente.



       Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Motivação


Preparação dos
                                      Agrupamento                                  Validação
    Dados




                                                   Critérios de Agrupamento



          Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Critérios de Agrupamento
• Compactação:
   – Pequena variação intra-cluster;
   – Clusters esféricos e/ou bem separados;
• Encadeamento:
   – Objetos vizinhos tem que compartilhar o mesmo cluster;
   – Adequado para clusters com forma arbitrária;
   – Ruim quando há pouca separação entre os clusters;
• Separação:
   – Somente a separação espacial fornece pouca informação;
   – Aplicada em associação com outros critérios.
         Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Abordagens



  Estrutura Real                                                 K-Means




    Single Link                                                  Average
Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Índices Relativos
     Índice                          Critério                              Característica

  Desvio Total                   Compactação                       Avalia a qualidade de um
  (Adaptado)                                                      agrupamento em termos da
                                                                   compactação dos clusters
 Conectividade                  Encadeamento                  Reflete o grau com que os objetos
  (Adaptado)                                                  vizinhos são colocados no mesmo
                                                                            cluster
    Silhueta                    Compactação e                Baseia-se na proximidade entre os
                                  Separação                 objetos de um cluster e na distância
                                                            dos objetos de um cluster ao cluster
                                                                       mais próximo
Consistência-KNN                Encadeamento                    Os objetos de cada classe são
  (Adaptado)                                                  distribuídos de forma consistente.


              Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Experimento Realizado
1. Preparação dos dados artificiais FCPS;
2. Execução para vários conjuntos de dados, utilizando
   a distância Euclideana como função de
   proximidade;
3. Tratamento dos resultados;
4. Plotagem de gráficos;
5. Análise dos índices.

        Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Experimento Realizado
                                              -Normalizar: Silhueta, Desvio Total
1. Preparação dos dados artificiais Conectividade
                                  e
                                    FCPS;
                            - Alterar melhor valor: Silhueta e
2.   Execução para vários conjuntos de dados, utilizando
                                    Consistência-KNN
     a distância Euclideana como função de
     proximidade;
3. Tratamento dos resultados;
4. Plotagem de gráficos;
5. Análise dos índices.

          Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Conjunto de Dados
       Fundamental Clustering Problems Suite (FCPS)




Wing Nut                                                      Atom




  LSun                                                       Target


Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Resultados: Wing Nut
1,0
0,9
0,8
0,7
0,6                                                                                              sil
0,5                                                                                              dev
             0,39                           0,39                          0,39
0,4                                                                                              con
      0,28                           0,28                          0,28
0,3                                                                                              cknn
0,2                        0,12                    0,13 0,11                     0,13 0,14
0,1                 0,01
0,0
              Real                            C1                            C2
              Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Resultados: Atom
                                            1,00
1,0
0,9
0,8
0,7                                  0,62
0,6          0,55
                                                                                                 sil
0,5                                                                                              dev
0,4   0,34                                                                                       con
0,3                                                                                              cknn
0,2
                                                                          0,10
                                                                                        0,08
0,1                     0,04                              0,01
                                                                   0,07
                    0,00                           0,00                          0,00
0,0
              Real                            C1                            C2
              Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Resultados: LSun
1,0
0,9
0,8
0,7
0,6                                                                                               sil
0,5                                                                                               dev
0,4                                                                                               con
                            0,29 0,29              0,32 0,29
0,3   0,26
             0,24
                                                                                        0,26      cknn
                                                                          0,16
0,2                 0,13                                        0,13             0,13
0,1
               0,01                  0,00 0,00              0,00                   0,01
0,0
             Real                  C1                     C2                      C3
               Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Resultados: Target
                                                         1,00          1,00          1,00          1,00
1,0
0,9
0,8
               0,67                               0,70
0,7                                                             0,65          0,65          0,65

0,6
                                 0,61
                                                                                                          sil
0,5      0,44                                                                                             dev
                                      0,41
0,4   0,35                                                                                                con
0,3                                                                                                       cknn
0,2                   0,13
        0,09
0,1                      0,08
                                               0,02        0,02           0,02          0,02
                          0,00 0,00    0,00 0,00 0,01         0,01          0,01           0,01
0,0
        Real             C1            C2          C3           C4            C5             C6
                 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Considerações Finais
• Análise de clusters individualmente é uma abordagem
  promissora;

• Conjunto de índices complementares para avaliar
  estruturas heterogêneas;

• Qualidade baixa de um cluster influência
  negativamente o resultado da partição.


        Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Considerações Finais
• As estruturas destes conjuntos de dados
  favorecem os critérios baseados em
  encadeamento;
• O índice consistência-KNN obteve em média bom
  desempenho;
• Índices com mesmo critério podem se comportar
  de maneira diferente.
        Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
Dúvidas?

Gustavo Henrique Rodrigues Pinto Tomas
 Email: gustavoh_rodrigues@hotmail.com

                       Katti Faceli
                    Email: katti@ufscar.br


                            Obrigado!

Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba

Mais conteúdo relacionado

PPT
3주차 ppt용
PPT
웹기획
PPTX
웹기획 V090522
PPTX
소셜웹 협업과 이벤트 실습
PPT
4주차 발표자료(100927)
PPT
1주차 발표자료 20100707 ver1.0
PDF
2주차 발표자료 v5(100909)
PDF
반응형, 적응형 웹, 그 다음은? (지훈 Ux pd)
3주차 ppt용
웹기획
웹기획 V090522
소셜웹 협업과 이벤트 실습
4주차 발표자료(100927)
1주차 발표자료 20100707 ver1.0
2주차 발표자료 v5(100909)
반응형, 적응형 웹, 그 다음은? (지훈 Ux pd)

Destaque (19)

PDF
Контекстная реклама для медицинских клиник. Итоги 2014. тренды и прогнозы на ...
PPTX
Søk 5
DOCX
εναλλακτικη μεταφραση στα κερκυραϊκα του θουκυδιδη
PDF
WSSFN Welcome letter
PDF
DLIFLC Diploma
DOC
Autoevaluacion capitulo 1
PDF
Babock Ref Letter
DOCX
Web services
PDF
RRD_Case_L2
PDF
diploma medic
DOCX
DiferenciaS
PPT
Im Simply Saying Corregit
PPT
La Granja De Don Botijo[1][1]
PDF
Como ter ligação permanente com quem visita o meu site 24-05-2013
PDF
Apostila fundamentos de rede
PDF
english-mini-brochure6
PDF
کتاب فرهنگ فارسی آموز پیشرو آریان پور
PDF
13 march 2015 ram deep
Контекстная реклама для медицинских клиник. Итоги 2014. тренды и прогнозы на ...
Søk 5
εναλλακτικη μεταφραση στα κερκυραϊκα του θουκυδιδη
WSSFN Welcome letter
DLIFLC Diploma
Autoevaluacion capitulo 1
Babock Ref Letter
Web services
RRD_Case_L2
diploma medic
DiferenciaS
Im Simply Saying Corregit
La Granja De Don Botijo[1][1]
Como ter ligação permanente com quem visita o meu site 24-05-2013
Apostila fundamentos de rede
english-mini-brochure6
کتاب فرهنگ فارسی آموز پیشرو آریان پور
13 march 2015 ram deep
Anúncio

Mais de Gustavo Henrique Rodrigues Pinto Tomas (7)

PPTX
[Status Report 11/06] Uma arquitetura para Smart Cities baseada na Internet o...
PPTX
O que o mercado espera de um [recém formado | formando]?
PPTX
Uma arquitetura para Smart Cities baseada em Internet of Things - Status Report
PDF
Internet of Things and Smart Cities
PDF
Android: Intent, Broadcast Receiver e Notifications
PDF
Eucalyptus uma plataforma de cloud computing para qualquer tipo de usuário - ...
PDF
Eucalyptus uma plataforma de cloud computing para qualquer tipo de usuário
[Status Report 11/06] Uma arquitetura para Smart Cities baseada na Internet o...
O que o mercado espera de um [recém formado | formando]?
Uma arquitetura para Smart Cities baseada em Internet of Things - Status Report
Internet of Things and Smart Cities
Android: Intent, Broadcast Receiver e Notifications
Eucalyptus uma plataforma de cloud computing para qualquer tipo de usuário - ...
Eucalyptus uma plataforma de cloud computing para qualquer tipo de usuário
Anúncio

Último (20)

PPTX
3b - Bradesco Lean Agile Training Plan - Ritos Operacionais (1).pptx
PPTX
Aula 7 - Listas em Python (Introdução à Ciencia da Computação)
PPT
Apresentacao Do Trabalho de Inteligencia
PDF
resumo de instalação de placa arduino em jardim vertical para fertirrigação
PDF
Visão geral da SAP, SAP01 Col18, Introdução sistema SAP,
PDF
SEMINÁRIO DE IHC - A interface Homem-Máquina
PDF
Processamento da remessa no SAP ERP, SCM610 Col15
PPT
Padrões de Beleza I - Estética Corporal e Saúde
PPT
inteligencia_artificial REPRESENTAÇÃO DO CONHECECIMENTO
PPTX
Aula 9 - Funções em Python (Introdução à Ciência da Computação)
PPTX
ccursoammaiacursoammaiacursoammaia123456
PDF
Processos no SAP Extended Warehouse Management, EWM100 Col26
PPTX
RCSOFTdfsdfrvadfvdfvargfvevevrervevqer.pptx
PDF
ASCENSÃO E QUEDA DO SOFTWARE LIVRE NO ESTADO BRASILEIRO
PDF
Aula 9 - Funções 202yttvrcrg5-1.pptx.pdf
PDF
Administração de qualidade no SAP Extended Warehouse Management, EWM140 Col26
PDF
instalacoes eletricas para industria apressentacao basicas
PDF
Metodologia Scrumban-XP - Um Guia Rápido (MrSomebody19).pdf
PDF
Customizing básico em SAP Extended Warehouse Management, EWM110 Col26
PPTX
Analise Estatica de Compiladores para criar uma nova LP
3b - Bradesco Lean Agile Training Plan - Ritos Operacionais (1).pptx
Aula 7 - Listas em Python (Introdução à Ciencia da Computação)
Apresentacao Do Trabalho de Inteligencia
resumo de instalação de placa arduino em jardim vertical para fertirrigação
Visão geral da SAP, SAP01 Col18, Introdução sistema SAP,
SEMINÁRIO DE IHC - A interface Homem-Máquina
Processamento da remessa no SAP ERP, SCM610 Col15
Padrões de Beleza I - Estética Corporal e Saúde
inteligencia_artificial REPRESENTAÇÃO DO CONHECECIMENTO
Aula 9 - Funções em Python (Introdução à Ciência da Computação)
ccursoammaiacursoammaiacursoammaia123456
Processos no SAP Extended Warehouse Management, EWM100 Col26
RCSOFTdfsdfrvadfvdfvargfvevevrervevqer.pptx
ASCENSÃO E QUEDA DO SOFTWARE LIVRE NO ESTADO BRASILEIRO
Aula 9 - Funções 202yttvrcrg5-1.pptx.pdf
Administração de qualidade no SAP Extended Warehouse Management, EWM140 Col26
instalacoes eletricas para industria apressentacao basicas
Metodologia Scrumban-XP - Um Guia Rápido (MrSomebody19).pdf
Customizing básico em SAP Extended Warehouse Management, EWM110 Col26
Analise Estatica de Compiladores para criar uma nova LP

Avaliacao de particao vs avaliacao de clusters wci 2010

  • 1. III Workshop on Computational Intelligence Avaliação de Partições vs Avaliação de Clusters Gustavo Henrique Rodrigues Pinto Tomas Dra. Katti Faceli Projeto financiado por: Programa Institucional de Bolsas de Iniciação Cientifica – PIBIC Conselho Nacional de Desenvolvimento Científico e Tecnológico – CNPq Universidade Federal de São Carlos – Campus Sorocaba
  • 2. Motivação • Definição de cluster; • Abordagens tradicionais: cada algoritmo segue um critério diferente; • Abordagens multi-objetivos: Ex.: MOCLE. • Nova Abordagem: Análise de Clusters Individualmente. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 3. Motivação Preparação dos Agrupamento Validação Dados Critérios de Agrupamento Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 4. Critérios de Agrupamento • Compactação: – Pequena variação intra-cluster; – Clusters esféricos e/ou bem separados; • Encadeamento: – Objetos vizinhos tem que compartilhar o mesmo cluster; – Adequado para clusters com forma arbitrária; – Ruim quando há pouca separação entre os clusters; • Separação: – Somente a separação espacial fornece pouca informação; – Aplicada em associação com outros critérios. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 5. Abordagens Estrutura Real K-Means Single Link Average Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 6. Índices Relativos Índice Critério Característica Desvio Total Compactação Avalia a qualidade de um (Adaptado) agrupamento em termos da compactação dos clusters Conectividade Encadeamento Reflete o grau com que os objetos (Adaptado) vizinhos são colocados no mesmo cluster Silhueta Compactação e Baseia-se na proximidade entre os Separação objetos de um cluster e na distância dos objetos de um cluster ao cluster mais próximo Consistência-KNN Encadeamento Os objetos de cada classe são (Adaptado) distribuídos de forma consistente. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 7. Experimento Realizado 1. Preparação dos dados artificiais FCPS; 2. Execução para vários conjuntos de dados, utilizando a distância Euclideana como função de proximidade; 3. Tratamento dos resultados; 4. Plotagem de gráficos; 5. Análise dos índices. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 8. Experimento Realizado -Normalizar: Silhueta, Desvio Total 1. Preparação dos dados artificiais Conectividade e FCPS; - Alterar melhor valor: Silhueta e 2. Execução para vários conjuntos de dados, utilizando Consistência-KNN a distância Euclideana como função de proximidade; 3. Tratamento dos resultados; 4. Plotagem de gráficos; 5. Análise dos índices. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 9. Conjunto de Dados Fundamental Clustering Problems Suite (FCPS) Wing Nut Atom LSun Target Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 10. Resultados: Wing Nut 1,0 0,9 0,8 0,7 0,6 sil 0,5 dev 0,39 0,39 0,39 0,4 con 0,28 0,28 0,28 0,3 cknn 0,2 0,12 0,13 0,11 0,13 0,14 0,1 0,01 0,0 Real C1 C2 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 11. Resultados: Atom 1,00 1,0 0,9 0,8 0,7 0,62 0,6 0,55 sil 0,5 dev 0,4 0,34 con 0,3 cknn 0,2 0,10 0,08 0,1 0,04 0,01 0,07 0,00 0,00 0,00 0,0 Real C1 C2 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 12. Resultados: LSun 1,0 0,9 0,8 0,7 0,6 sil 0,5 dev 0,4 con 0,29 0,29 0,32 0,29 0,3 0,26 0,24 0,26 cknn 0,16 0,2 0,13 0,13 0,13 0,1 0,01 0,00 0,00 0,00 0,01 0,0 Real C1 C2 C3 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 13. Resultados: Target 1,00 1,00 1,00 1,00 1,0 0,9 0,8 0,67 0,70 0,7 0,65 0,65 0,65 0,6 0,61 sil 0,5 0,44 dev 0,41 0,4 0,35 con 0,3 cknn 0,2 0,13 0,09 0,1 0,08 0,02 0,02 0,02 0,02 0,00 0,00 0,00 0,00 0,01 0,01 0,01 0,01 0,0 Real C1 C2 C3 C4 C5 C6 Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 14. Considerações Finais • Análise de clusters individualmente é uma abordagem promissora; • Conjunto de índices complementares para avaliar estruturas heterogêneas; • Qualidade baixa de um cluster influência negativamente o resultado da partição. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 15. Considerações Finais • As estruturas destes conjuntos de dados favorecem os critérios baseados em encadeamento; • O índice consistência-KNN obteve em média bom desempenho; • Índices com mesmo critério podem se comportar de maneira diferente. Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba
  • 16. Dúvidas? Gustavo Henrique Rodrigues Pinto Tomas Email: [email protected] Katti Faceli Email: [email protected] Obrigado! Análise de Partições vs Avaliação de Clusters – III WCI – UFSCar Campus Sorocaba