SlideShare une entreprise Scribd logo
1  sur  25
K-Means & K-Medoids
Kümeleme Algoritmaları



                     Hazırlayan:
                Sinem Altan
                Fatih Dartıcı
K-Means Algoritması Nedir?

 En    eski kümeleme algoritmalarından olan
    K-Means, 1967 yılında J.B. MacQueen
    tarafından geliştirilmiştir.
    K-Means’in atama mekanizması, her
    verinin sadece bir kümeye ait
    olabilmesine izin verir.
 Merkez     noktanın kümeyi temsil etmesi
    ana fikrine dayalı bir metottur.
K-Means Algoritması Nedir? -2-

 Verileribelirlenen küme sayısına göre, her küme için
  belirlenen ortalama değer doğrultusunda
  kümelenmesi üzerine çalışır. K-Means algoritması
  eldeki verileri k adet kümede ve kümelerin
  ortalamalarına göre kümelere ayırır. K küme sayısı
  kullanıcı tarafından verilir.
 Kısaca n tane nesneyi –küme içi benzerlik
  maksimum, kümeler arası benzerlik minimum
  olacak şekilde- k tane kümeye böler.
K-Means algoritması Nasıl Çalışır?

 K-Means algoritmasının çalışma mekanizmasına göre öncelikle her
 kümenin merkez noktasını (centroid) veya ortalamasını temsil etmek
 üzere k adet nesne -rasgele- seçilir.
 Kalandiğer nesneler, kümelerin ortalama değerlerine olan uzaklıkları
 dikkate alınarak en benzer oldukları kümelere dahil edilir.
 Daha sonra, her bir kümenin ortalama değeri hesaplanarak yeni
 küme merkezleri belirlenir ve tekrar nesne-merkez uzaklıkları
 incelenir. Herhangi bir değişim olmayıncaya kadar algoritma
 ötelenmeye devam eder.
 Enyaygın olarak kullanılan uzaklık hesaplama formülü Öklit uzaklık
 formülüdür.
K-Means algoritması Nasıl Çalışır?
-2-
Merkez Noktaların Belirlenmesi

Başlangıç küme merkezlerinin seçimi k-means’in sonucunu önemli
oranda etkiler. Başlangıç noktalarının belirlenmesinde çeşitli teknikler
vardır. Bu tekniklerden bazıları:
1)   k sayısı kadar rastgele veri seçilip küme merkezleri olarak atanır.
2)    Veriler rastgele k tane kümeye atanır ve küme ortalamaları alınarak
     başlangıç küme merkezleri belirlenir.
3)   En uç değerlere sahip veriler küme merkezleri olarak seçilir.
4)   Veri setinin merkezine en yakın noktalar başlangıç noktaları olarak
     seçilir.
K-Means Kümeleme Adımları
K-Means Kümeleme Örneği -1
K-Means Kümeleme Örneği -2
K-Means Kümeleme Örneği -3
K-Means Kümeleme Örneği -4
K-Means Kümeleme Örneği -5
Açıklama:
K- Means Algoritmasına göre kümeleme yapılırken,
 İlk   olarak karışık halde verilmiş olan veri seti sıralanır.   (K-Means Kümeleme Örneği
  -2)
 Sıralama işleminden sonra, her verinin başlangıçta rastgele belirlenmiş olan
  merkez noktalarına göre uzaklığı alınır. Veriler en yakın olduğu merkez
  noktasının kümesine dahil olur .(K-Means Kümeleme Örneği -3)
 Bu  adımdan sonra her küme için küme elemanlarının ortalaması alınır. Bu
  ortalama yeni merkez noktasıdır.(K-Means Kümeleme Örneği -4’de merkez noktalarının
  değerleri değişiyor.)
 Sonraki  adımda, tekrar her verinin merkez noktalarına olan uzaklığı hesaplanır ve
  veriler en yakın olduğu merkez noktasının kümesine dahil edilir. Küme
  elemanlarının ortalaması alınıp yeni merkez noktaları belirlenir.
 Kümeleme       işleminin sonucu, bir sonraki adımda aynı çıkına kadar bu işlem
  tekrarlanır.
K-means Algoritmasının Avantajları
ve Dezavantajları
Avantajı:
 Uygulanabilirliğikolaydır ve büyük veri kümelerinde hızlı çalışabilir.
 Veri sayısı çok fazla olan hesaplamalarda, K-Means, küme sayısı
 küçük ise hesaplamaları, hiyerarşik kümelemeden daha hızlı yapar.
Dezavantajı:
 K-Means algoritması k küme sayısını tespit edememektedir. Bu
 nedenle uygun k sayısını bulana kadar bir deneme yanılma süreci
 gerçekleşmektedir.
 Gürültülü   verilere duyarlıdır. Bu veriler de kümelere dahil edilir.
K-Medoids Algoritması Nedir?

 K-Medoids algoritmasının temeli, verinin çeşitli yapısal özelliklerini temsil
 eden k tane temsilci nesneyi bulma esasına dayanır.
 Bir
    grup nesneyi k tane kümeye bölerken esas amaç, birbirine çok
 benzeyen nesnelerin bir arada olduğu ve farklı kümelerdeki nesnelerin
 mümkün olduğunca birbirinden benzersiz olduğu kümeleri bulmaktır.
 En
   yaygın kullanılan K-Medoids algoritması, 1987 yılında Kaufman and
 Rousseeuw tarafından geliştirilmiştir.
 Amacın k tane nesneyi bulmak olmasından dolayı, K-Medoids metodu
 olarak adlandırılmaktadır.
Temsilci Nesne Nedir?

 Temsilcinesne diğer nesnelere olan ortalama
 uzaklığı minimum yapan kümenin en merkezi
 nesnesidir. Bu nedenle, bu bölünme metodu her
 bir nesne ve onun referans noktası arasındaki
 benzersizliklerin(uzaklıkların) toplamını
 küçültme mantığı esas alınarak uygulanır.
 Kümeleme literatüründe temsilci nesnelere
 çoğunlukla merkeztipler (centrotypes)
 denilmektedir.
K-Medoids Algoritması Nasıl
Çalışır?
k adet temsilci nesne tespit edildikten sonra
 her bir nesne en yakın olduğu temsilciye
 atanarak k tane küme oluşturulur. Sonraki
 adımlarda her bir temsilci nesne temsilci
 olmayan nesne ile değiştirilerek kümelemenin
 kalitesi yükseltilinceye kadar ötelenir. Bu kalite
 nesne ile ait olduğu kümenin temsilci nesnesi
 arasındaki ortalama benzersizliğe göre
 değişir.
K-Medoids Kümeleme Adımları

   K-Medoids algoritmasında birinci aşama yapılandırma aşamasıdır. Bu
aşama kümelemenin başlangıç aşamasıdır, k adet temsilci nesne
seçilene kadar devam eder. Başlangıç merkezleri rastgele atanabileceği
gibi çeşitli işlemler sonucu da belirlenebilir. Algoritmanın ikinci aşaması
değiştirme ( Swap ) aşamasıdır. Bu aşama temsilci nesneleri geliştirerek
kümeleme işleminin verimini arttırmak için uygulanır. Her bir nesne
merkez nokta çifti için hesaplama yapılır. Değişim ihtimallerinin
kümelemeye nasıl bir etkisi olduğu incelenerek her bir kombinasyon için
kümeleme kalitesi hesaplanır.
K-Means kümeleme örneğini
hatırlayalım..
K-Medoids Kümeleme Örneği
Açıklama:
K- Medoids Algoritmasına göre kümeleme yapılırken,
 İlk   olarak karışık halde verilmiş olan veri seti sıralanır.
 Sıralama  işleminden sonra, her verinin başlangıçta rastgele
  belirlenmiş olan merkez noktalarına göre uzaklığı alınır. Veriler en
  yakın olduğu merkez noktasının kümesine dahil olur.
 Bu adımdan sonra her küme için küme elemanlarının ortalaması alınır. K-
  Medoids algoritmasında küme elemanı olmayan bir değer merkez
  noktası olamaz. Bu nedenle küme ortalamasına en yakın olan nokta
  yeni merkez noktası olur.
 Sonraki   adımda, tekrar her verinin merkez noktalarına olan uzaklığı
  hesaplanır ve veriler en yakın olduğu merkez noktasının kümesine dahil
  edilir. Küme elemanlarının ortalaması alınıp, ortalamaya en yakın noktalar
  yeni merkez noktaları olarak belirlenir.
 Kümeleme    işleminin sonucu, bir sonraki adımda aynı çıkına kadar bu
  işlem tekrarlanır.
Not**

   Görüldüğü gibi K-Medoids kümeleme
algoritmasını K-Means kümeleme
algoritmasından ayıran özellik, merkez
noktalarının belirlenme şeklidir. Küme
elemanı olmayan bir değerin merkez
noktası kabul edilmemesi ise gürültülü
verilerin kümelere dahil edilmesine rağmen,
küme üzerindeki etkilerini ortadan kaldırır.
K-Medoids Algoritmasının
Avantajları ve Dezavantajları
Avantajı:
   Bölünmeli metotlar içinde K-Medoids daha iyi ve kararlı kümeleme sonuçları
    üreten bir algoritmadır. Verilerin işleniş sırası ve ilk atamadaki merkez
    noktaların kümeleme üzerinde etkisi yoktur.(Çünkü ilerideki adımlarda kümenin
    elemanı olmayan hiçbir nokta merkez noktası olamaz.)
   Ayrıca en merkezi elemanların kümeyi temsil etmesi özelliği örnekte görüldüğü
    gibi gürültülü verilerin kümeleme üzerindeki etkisini ortadan kaldırır.
• 2, 4, 6, 8, 10 ortalama: 6
• 2, 4, 6, 8 , 10, 1002 ortalama: 172
• 2, 4, 6, 8 ,10, 1002 orta nokta: 6
Dezavantajı:
   K-medoids, k-means’de olduğu gibi küme sayısının başlangıçta tanımlanmasını
    gerektiren bir metottur. Veriye uygun k sayısının belirlenmesi için birden fazla
    denemenin yapılması gerekir.
K-Medoids Algoriymasının K-Means Algoritması ile
Karşılaştırılması


K-Medoids                                K-Means

   K-Medoids algoritmasında her
    küme, kümede bulunan bir                K-means her küme kendi
    nesneyle temsil edilir.
                                             merkeziyle temsil edilir.
   K-Medoids algoritması gürültülü
    verilerden etkilenmez.                  K-Means algoritması
   Medoid (Merkez nokta) küme               gürültülü verilerden
    içerisinde en merkezi veridir.           etkilenir.
   Küçük verilerde daha güvenilirdir.
                                            K-Means algoritması
   K-Medoids’in K-means’e
    üstünlüğü benzemezlik değerini
                                             büyük verilerde de
    en aza indirmesidir.                     güvenilirdir.
Kaynaklar:
   http://
    www.belgeler.com/blg/of1/blnmeli-kmeleme-yntemleri-ile-veri-madenci
    lii-uygulamalari-data-mining-applications-using-partitional-cluster
    ing-methods
   http://www.iticu.edu.tr/uploads/Kutuphane/dergi/f11/M00176.pdf
   http://web.itu.edu.tr/kiris/08%20Firat%202012.pdf

Contenu connexe

Tendances

AtCoder Beginner Contest 003 解説
AtCoder Beginner Contest 003 解説AtCoder Beginner Contest 003 解説
AtCoder Beginner Contest 003 解説
AtCoder Inc.
 
20101016 嵌入式系統開發之道講座
20101016 嵌入式系統開發之道講座20101016 嵌入式系統開發之道講座
20101016 嵌入式系統開發之道講座
黑狗 大
 
『データ解析におけるプライバシー保護』勉強会 #2
『データ解析におけるプライバシー保護』勉強会 #2『データ解析におけるプライバシー保護』勉強会 #2
『データ解析におけるプライバシー保護』勉強会 #2
MITSUNARI Shigeo
 

Tendances (20)

AtCoder Beginner Contest 030 解説
AtCoder Beginner Contest 030 解説AtCoder Beginner Contest 030 解説
AtCoder Beginner Contest 030 解説
 
AtCoder Beginner Contest 015 解説
AtCoder Beginner Contest 015 解説AtCoder Beginner Contest 015 解説
AtCoder Beginner Contest 015 解説
 
AtCoder Beginner Contest 023 解説
AtCoder Beginner Contest 023 解説AtCoder Beginner Contest 023 解説
AtCoder Beginner Contest 023 解説
 
AtCoder Beginner Contest 024 解説
AtCoder Beginner Contest 024 解説AtCoder Beginner Contest 024 解説
AtCoder Beginner Contest 024 解説
 
abc032
abc032abc032
abc032
 
解説:デバッグ
解説:デバッグ解説:デバッグ
解説:デバッグ
 
AtCoder167Dをダブリングで解く
AtCoder167Dをダブリングで解くAtCoder167Dをダブリングで解く
AtCoder167Dをダブリングで解く
 
Nimとgrundy数の大雑把な説明
Nimとgrundy数の大雑把な説明Nimとgrundy数の大雑把な説明
Nimとgrundy数の大雑把な説明
 
AtCoder Beginner Contest 018 解説
AtCoder Beginner Contest 018 解説AtCoder Beginner Contest 018 解説
AtCoder Beginner Contest 018 解説
 
AtCoder Beginner Contest 003 解説
AtCoder Beginner Contest 003 解説AtCoder Beginner Contest 003 解説
AtCoder Beginner Contest 003 解説
 
クラウドを支えるこれからの暗号技術
クラウドを支えるこれからの暗号技術クラウドを支えるこれからの暗号技術
クラウドを支えるこれからの暗号技術
 
充足可能性問題のいろいろ
充足可能性問題のいろいろ充足可能性問題のいろいろ
充足可能性問題のいろいろ
 
20101016 嵌入式系統開發之道講座
20101016 嵌入式系統開發之道講座20101016 嵌入式系統開發之道講座
20101016 嵌入式系統開發之道講座
 
AtCoder Regular Contest 019 解説
AtCoder Regular Contest 019 解説AtCoder Regular Contest 019 解説
AtCoder Regular Contest 019 解説
 
AtCoder Beginner Contest 006 解説
AtCoder Beginner Contest 006 解説AtCoder Beginner Contest 006 解説
AtCoder Beginner Contest 006 解説
 
『データ解析におけるプライバシー保護』勉強会 #2
『データ解析におけるプライバシー保護』勉強会 #2『データ解析におけるプライバシー保護』勉強会 #2
『データ解析におけるプライバシー保護』勉強会 #2
 
AtCoderに毎回参加したくなる仕組み
AtCoderに毎回参加したくなる仕組みAtCoderに毎回参加したくなる仕組み
AtCoderに毎回参加したくなる仕組み
 
Основни структури за управление на изчислителния процес
Основни структури за управление на изчислителния процесОсновни структури за управление на изчислителния процес
Основни структури за управление на изчислителния процес
 
AtCoder Beginner Contest 020 解説
AtCoder Beginner Contest 020 解説AtCoder Beginner Contest 020 解説
AtCoder Beginner Contest 020 解説
 
k medoid clustering.pptx
k medoid clustering.pptxk medoid clustering.pptx
k medoid clustering.pptx
 

En vedette

K means Clustering
K means ClusteringK means Clustering
K means Clustering
Edureka!
 
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİ
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİGINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİ
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİ
Arma?an ?ahin
 

En vedette (18)

Veri Madenciliği (Data Mining)
Veri Madenciliği (Data Mining)Veri Madenciliği (Data Mining)
Veri Madenciliği (Data Mining)
 
İşlemciler
İşlemciler İşlemciler
İşlemciler
 
Naive Bayes Sınıflandırma Uygulaması
Naive Bayes Sınıflandırma UygulamasıNaive Bayes Sınıflandırma Uygulaması
Naive Bayes Sınıflandırma Uygulaması
 
K means cluster
K means clusterK means cluster
K means cluster
 
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...
 
K-MEDOIDS CLUSTERING USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...
K-MEDOIDS CLUSTERING  USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...K-MEDOIDS CLUSTERING  USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...
K-MEDOIDS CLUSTERING USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...
 
Apriori algoritması
Apriori algoritmasıApriori algoritması
Apriori algoritması
 
Destek vektör makineleri
Destek vektör makineleriDestek vektör makineleri
Destek vektör makineleri
 
Yapay Sinir Ağları
Yapay Sinir AğlarıYapay Sinir Ağları
Yapay Sinir Ağları
 
Apriori algoritması
Apriori algoritmasıApriori algoritması
Apriori algoritması
 
K means Clustering
K means ClusteringK means Clustering
K means Clustering
 
K-means Clustering with Scikit-Learn
K-means Clustering with Scikit-LearnK-means Clustering with Scikit-Learn
K-means Clustering with Scikit-Learn
 
Clustering
ClusteringClustering
Clustering
 
K mean-clustering algorithm
K mean-clustering algorithmK mean-clustering algorithm
K mean-clustering algorithm
 
Simulation/Simülasyon
Simulation/SimülasyonSimulation/Simülasyon
Simulation/Simülasyon
 
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİ
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİGINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİ
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİ
 
Apriori Algorithm
Apriori AlgorithmApriori Algorithm
Apriori Algorithm
 
Metin Madenciliği ile Cümleleri Kategorilendirme
Metin Madenciliği ile Cümleleri KategorilendirmeMetin Madenciliği ile Cümleleri Kategorilendirme
Metin Madenciliği ile Cümleleri Kategorilendirme
 

K-Means & K-Medoids Algoritması

  • 1. K-Means & K-Medoids Kümeleme Algoritmaları Hazırlayan: Sinem Altan Fatih Dartıcı
  • 2. K-Means Algoritması Nedir?  En eski kümeleme algoritmalarından olan K-Means, 1967 yılında J.B. MacQueen tarafından geliştirilmiştir.  K-Means’in atama mekanizması, her verinin sadece bir kümeye ait olabilmesine izin verir.  Merkez noktanın kümeyi temsil etmesi ana fikrine dayalı bir metottur.
  • 3. K-Means Algoritması Nedir? -2-  Verileribelirlenen küme sayısına göre, her küme için belirlenen ortalama değer doğrultusunda kümelenmesi üzerine çalışır. K-Means algoritması eldeki verileri k adet kümede ve kümelerin ortalamalarına göre kümelere ayırır. K küme sayısı kullanıcı tarafından verilir.  Kısaca n tane nesneyi –küme içi benzerlik maksimum, kümeler arası benzerlik minimum olacak şekilde- k tane kümeye böler.
  • 4. K-Means algoritması Nasıl Çalışır?  K-Means algoritmasının çalışma mekanizmasına göre öncelikle her kümenin merkez noktasını (centroid) veya ortalamasını temsil etmek üzere k adet nesne -rasgele- seçilir.  Kalandiğer nesneler, kümelerin ortalama değerlerine olan uzaklıkları dikkate alınarak en benzer oldukları kümelere dahil edilir.  Daha sonra, her bir kümenin ortalama değeri hesaplanarak yeni küme merkezleri belirlenir ve tekrar nesne-merkez uzaklıkları incelenir. Herhangi bir değişim olmayıncaya kadar algoritma ötelenmeye devam eder.  Enyaygın olarak kullanılan uzaklık hesaplama formülü Öklit uzaklık formülüdür.
  • 5. K-Means algoritması Nasıl Çalışır? -2-
  • 6. Merkez Noktaların Belirlenmesi Başlangıç küme merkezlerinin seçimi k-means’in sonucunu önemli oranda etkiler. Başlangıç noktalarının belirlenmesinde çeşitli teknikler vardır. Bu tekniklerden bazıları: 1) k sayısı kadar rastgele veri seçilip küme merkezleri olarak atanır. 2) Veriler rastgele k tane kümeye atanır ve küme ortalamaları alınarak başlangıç küme merkezleri belirlenir. 3) En uç değerlere sahip veriler küme merkezleri olarak seçilir. 4) Veri setinin merkezine en yakın noktalar başlangıç noktaları olarak seçilir.
  • 13. Açıklama: K- Means Algoritmasına göre kümeleme yapılırken,  İlk olarak karışık halde verilmiş olan veri seti sıralanır. (K-Means Kümeleme Örneği -2)  Sıralama işleminden sonra, her verinin başlangıçta rastgele belirlenmiş olan merkez noktalarına göre uzaklığı alınır. Veriler en yakın olduğu merkez noktasının kümesine dahil olur .(K-Means Kümeleme Örneği -3)  Bu adımdan sonra her küme için küme elemanlarının ortalaması alınır. Bu ortalama yeni merkez noktasıdır.(K-Means Kümeleme Örneği -4’de merkez noktalarının değerleri değişiyor.)  Sonraki adımda, tekrar her verinin merkez noktalarına olan uzaklığı hesaplanır ve veriler en yakın olduğu merkez noktasının kümesine dahil edilir. Küme elemanlarının ortalaması alınıp yeni merkez noktaları belirlenir.  Kümeleme işleminin sonucu, bir sonraki adımda aynı çıkına kadar bu işlem tekrarlanır.
  • 14. K-means Algoritmasının Avantajları ve Dezavantajları Avantajı:  Uygulanabilirliğikolaydır ve büyük veri kümelerinde hızlı çalışabilir. Veri sayısı çok fazla olan hesaplamalarda, K-Means, küme sayısı küçük ise hesaplamaları, hiyerarşik kümelemeden daha hızlı yapar. Dezavantajı:  K-Means algoritması k küme sayısını tespit edememektedir. Bu nedenle uygun k sayısını bulana kadar bir deneme yanılma süreci gerçekleşmektedir.  Gürültülü verilere duyarlıdır. Bu veriler de kümelere dahil edilir.
  • 15. K-Medoids Algoritması Nedir?  K-Medoids algoritmasının temeli, verinin çeşitli yapısal özelliklerini temsil eden k tane temsilci nesneyi bulma esasına dayanır.  Bir grup nesneyi k tane kümeye bölerken esas amaç, birbirine çok benzeyen nesnelerin bir arada olduğu ve farklı kümelerdeki nesnelerin mümkün olduğunca birbirinden benzersiz olduğu kümeleri bulmaktır.  En yaygın kullanılan K-Medoids algoritması, 1987 yılında Kaufman and Rousseeuw tarafından geliştirilmiştir.  Amacın k tane nesneyi bulmak olmasından dolayı, K-Medoids metodu olarak adlandırılmaktadır.
  • 16. Temsilci Nesne Nedir?  Temsilcinesne diğer nesnelere olan ortalama uzaklığı minimum yapan kümenin en merkezi nesnesidir. Bu nedenle, bu bölünme metodu her bir nesne ve onun referans noktası arasındaki benzersizliklerin(uzaklıkların) toplamını küçültme mantığı esas alınarak uygulanır. Kümeleme literatüründe temsilci nesnelere çoğunlukla merkeztipler (centrotypes) denilmektedir.
  • 17. K-Medoids Algoritması Nasıl Çalışır? k adet temsilci nesne tespit edildikten sonra her bir nesne en yakın olduğu temsilciye atanarak k tane küme oluşturulur. Sonraki adımlarda her bir temsilci nesne temsilci olmayan nesne ile değiştirilerek kümelemenin kalitesi yükseltilinceye kadar ötelenir. Bu kalite nesne ile ait olduğu kümenin temsilci nesnesi arasındaki ortalama benzersizliğe göre değişir.
  • 18. K-Medoids Kümeleme Adımları K-Medoids algoritmasında birinci aşama yapılandırma aşamasıdır. Bu aşama kümelemenin başlangıç aşamasıdır, k adet temsilci nesne seçilene kadar devam eder. Başlangıç merkezleri rastgele atanabileceği gibi çeşitli işlemler sonucu da belirlenebilir. Algoritmanın ikinci aşaması değiştirme ( Swap ) aşamasıdır. Bu aşama temsilci nesneleri geliştirerek kümeleme işleminin verimini arttırmak için uygulanır. Her bir nesne merkez nokta çifti için hesaplama yapılır. Değişim ihtimallerinin kümelemeye nasıl bir etkisi olduğu incelenerek her bir kombinasyon için kümeleme kalitesi hesaplanır.
  • 21. Açıklama: K- Medoids Algoritmasına göre kümeleme yapılırken,  İlk olarak karışık halde verilmiş olan veri seti sıralanır.  Sıralama işleminden sonra, her verinin başlangıçta rastgele belirlenmiş olan merkez noktalarına göre uzaklığı alınır. Veriler en yakın olduğu merkez noktasının kümesine dahil olur.  Bu adımdan sonra her küme için küme elemanlarının ortalaması alınır. K- Medoids algoritmasında küme elemanı olmayan bir değer merkez noktası olamaz. Bu nedenle küme ortalamasına en yakın olan nokta yeni merkez noktası olur.  Sonraki adımda, tekrar her verinin merkez noktalarına olan uzaklığı hesaplanır ve veriler en yakın olduğu merkez noktasının kümesine dahil edilir. Küme elemanlarının ortalaması alınıp, ortalamaya en yakın noktalar yeni merkez noktaları olarak belirlenir.  Kümeleme işleminin sonucu, bir sonraki adımda aynı çıkına kadar bu işlem tekrarlanır.
  • 22. Not** Görüldüğü gibi K-Medoids kümeleme algoritmasını K-Means kümeleme algoritmasından ayıran özellik, merkez noktalarının belirlenme şeklidir. Küme elemanı olmayan bir değerin merkez noktası kabul edilmemesi ise gürültülü verilerin kümelere dahil edilmesine rağmen, küme üzerindeki etkilerini ortadan kaldırır.
  • 23. K-Medoids Algoritmasının Avantajları ve Dezavantajları Avantajı:  Bölünmeli metotlar içinde K-Medoids daha iyi ve kararlı kümeleme sonuçları üreten bir algoritmadır. Verilerin işleniş sırası ve ilk atamadaki merkez noktaların kümeleme üzerinde etkisi yoktur.(Çünkü ilerideki adımlarda kümenin elemanı olmayan hiçbir nokta merkez noktası olamaz.)  Ayrıca en merkezi elemanların kümeyi temsil etmesi özelliği örnekte görüldüğü gibi gürültülü verilerin kümeleme üzerindeki etkisini ortadan kaldırır. • 2, 4, 6, 8, 10 ortalama: 6 • 2, 4, 6, 8 , 10, 1002 ortalama: 172 • 2, 4, 6, 8 ,10, 1002 orta nokta: 6 Dezavantajı:  K-medoids, k-means’de olduğu gibi küme sayısının başlangıçta tanımlanmasını gerektiren bir metottur. Veriye uygun k sayısının belirlenmesi için birden fazla denemenin yapılması gerekir.
  • 24. K-Medoids Algoriymasının K-Means Algoritması ile Karşılaştırılması K-Medoids K-Means  K-Medoids algoritmasında her küme, kümede bulunan bir  K-means her küme kendi nesneyle temsil edilir. merkeziyle temsil edilir.  K-Medoids algoritması gürültülü verilerden etkilenmez.  K-Means algoritması  Medoid (Merkez nokta) küme gürültülü verilerden içerisinde en merkezi veridir. etkilenir.  Küçük verilerde daha güvenilirdir.  K-Means algoritması  K-Medoids’in K-means’e üstünlüğü benzemezlik değerini büyük verilerde de en aza indirmesidir. güvenilirdir.
  • 25. Kaynaklar:  http:// www.belgeler.com/blg/of1/blnmeli-kmeleme-yntemleri-ile-veri-madenci lii-uygulamalari-data-mining-applications-using-partitional-cluster ing-methods  http://www.iticu.edu.tr/uploads/Kutuphane/dergi/f11/M00176.pdf  http://web.itu.edu.tr/kiris/08%20Firat%202012.pdf