SlideShare a Scribd company logo
K-Means & K-Medoids
Kümeleme Algoritmaları



                     Hazırlayan:
                Sinem Altan
                Fatih Dartıcı
K-Means Algoritması Nedir?

 En    eski kümeleme algoritmalarından olan
    K-Means, 1967 yılında J.B. MacQueen
    tarafından geliştirilmiştir.
    K-Means’in atama mekanizması, her
    verinin sadece bir kümeye ait
    olabilmesine izin verir.
 Merkez     noktanın kümeyi temsil etmesi
    ana fikrine dayalı bir metottur.
K-Means Algoritması Nedir? -2-

 Verileribelirlenen küme sayısına göre, her küme için
  belirlenen ortalama değer doğrultusunda
  kümelenmesi üzerine çalışır. K-Means algoritması
  eldeki verileri k adet kümede ve kümelerin
  ortalamalarına göre kümelere ayırır. K küme sayısı
  kullanıcı tarafından verilir.
 Kısaca n tane nesneyi –küme içi benzerlik
  maksimum, kümeler arası benzerlik minimum
  olacak şekilde- k tane kümeye böler.
K-Means algoritması Nasıl Çalışır?

 K-Means algoritmasının çalışma mekanizmasına göre öncelikle her
 kümenin merkez noktasını (centroid) veya ortalamasını temsil etmek
 üzere k adet nesne -rasgele- seçilir.
 Kalandiğer nesneler, kümelerin ortalama değerlerine olan uzaklıkları
 dikkate alınarak en benzer oldukları kümelere dahil edilir.
 Daha sonra, her bir kümenin ortalama değeri hesaplanarak yeni
 küme merkezleri belirlenir ve tekrar nesne-merkez uzaklıkları
 incelenir. Herhangi bir değişim olmayıncaya kadar algoritma
 ötelenmeye devam eder.
 Enyaygın olarak kullanılan uzaklık hesaplama formülü Öklit uzaklık
 formülüdür.
K-Means algoritması Nasıl Çalışır?
-2-
Merkez Noktaların Belirlenmesi

Başlangıç küme merkezlerinin seçimi k-means’in sonucunu önemli
oranda etkiler. Başlangıç noktalarının belirlenmesinde çeşitli teknikler
vardır. Bu tekniklerden bazıları:
1)   k sayısı kadar rastgele veri seçilip küme merkezleri olarak atanır.
2)    Veriler rastgele k tane kümeye atanır ve küme ortalamaları alınarak
     başlangıç küme merkezleri belirlenir.
3)   En uç değerlere sahip veriler küme merkezleri olarak seçilir.
4)   Veri setinin merkezine en yakın noktalar başlangıç noktaları olarak
     seçilir.
K-Means Kümeleme Adımları
K-Means Kümeleme Örneği -1
K-Means Kümeleme Örneği -2
K-Means Kümeleme Örneği -3
K-Means Kümeleme Örneği -4
K-Means Kümeleme Örneği -5
Açıklama:
K- Means Algoritmasına göre kümeleme yapılırken,
 İlk   olarak karışık halde verilmiş olan veri seti sıralanır.   (K-Means Kümeleme Örneği
  -2)
 Sıralama işleminden sonra, her verinin başlangıçta rastgele belirlenmiş olan
  merkez noktalarına göre uzaklığı alınır. Veriler en yakın olduğu merkez
  noktasının kümesine dahil olur .(K-Means Kümeleme Örneği -3)
 Bu  adımdan sonra her küme için küme elemanlarının ortalaması alınır. Bu
  ortalama yeni merkez noktasıdır.(K-Means Kümeleme Örneği -4’de merkez noktalarının
  değerleri değişiyor.)
 Sonraki  adımda, tekrar her verinin merkez noktalarına olan uzaklığı hesaplanır ve
  veriler en yakın olduğu merkez noktasının kümesine dahil edilir. Küme
  elemanlarının ortalaması alınıp yeni merkez noktaları belirlenir.
 Kümeleme       işleminin sonucu, bir sonraki adımda aynı çıkına kadar bu işlem
  tekrarlanır.
K-means Algoritmasının Avantajları
ve Dezavantajları
Avantajı:
 Uygulanabilirliğikolaydır ve büyük veri kümelerinde hızlı çalışabilir.
 Veri sayısı çok fazla olan hesaplamalarda, K-Means, küme sayısı
 küçük ise hesaplamaları, hiyerarşik kümelemeden daha hızlı yapar.
Dezavantajı:
 K-Means algoritması k küme sayısını tespit edememektedir. Bu
 nedenle uygun k sayısını bulana kadar bir deneme yanılma süreci
 gerçekleşmektedir.
 Gürültülü   verilere duyarlıdır. Bu veriler de kümelere dahil edilir.
K-Medoids Algoritması Nedir?

 K-Medoids algoritmasının temeli, verinin çeşitli yapısal özelliklerini temsil
 eden k tane temsilci nesneyi bulma esasına dayanır.
 Bir
    grup nesneyi k tane kümeye bölerken esas amaç, birbirine çok
 benzeyen nesnelerin bir arada olduğu ve farklı kümelerdeki nesnelerin
 mümkün olduğunca birbirinden benzersiz olduğu kümeleri bulmaktır.
 En
   yaygın kullanılan K-Medoids algoritması, 1987 yılında Kaufman and
 Rousseeuw tarafından geliştirilmiştir.
 Amacın k tane nesneyi bulmak olmasından dolayı, K-Medoids metodu
 olarak adlandırılmaktadır.
Temsilci Nesne Nedir?

 Temsilcinesne diğer nesnelere olan ortalama
 uzaklığı minimum yapan kümenin en merkezi
 nesnesidir. Bu nedenle, bu bölünme metodu her
 bir nesne ve onun referans noktası arasındaki
 benzersizliklerin(uzaklıkların) toplamını
 küçültme mantığı esas alınarak uygulanır.
 Kümeleme literatüründe temsilci nesnelere
 çoğunlukla merkeztipler (centrotypes)
 denilmektedir.
K-Medoids Algoritması Nasıl
Çalışır?
k adet temsilci nesne tespit edildikten sonra
 her bir nesne en yakın olduğu temsilciye
 atanarak k tane küme oluşturulur. Sonraki
 adımlarda her bir temsilci nesne temsilci
 olmayan nesne ile değiştirilerek kümelemenin
 kalitesi yükseltilinceye kadar ötelenir. Bu kalite
 nesne ile ait olduğu kümenin temsilci nesnesi
 arasındaki ortalama benzersizliğe göre
 değişir.
K-Medoids Kümeleme Adımları

   K-Medoids algoritmasında birinci aşama yapılandırma aşamasıdır. Bu
aşama kümelemenin başlangıç aşamasıdır, k adet temsilci nesne
seçilene kadar devam eder. Başlangıç merkezleri rastgele atanabileceği
gibi çeşitli işlemler sonucu da belirlenebilir. Algoritmanın ikinci aşaması
değiştirme ( Swap ) aşamasıdır. Bu aşama temsilci nesneleri geliştirerek
kümeleme işleminin verimini arttırmak için uygulanır. Her bir nesne
merkez nokta çifti için hesaplama yapılır. Değişim ihtimallerinin
kümelemeye nasıl bir etkisi olduğu incelenerek her bir kombinasyon için
kümeleme kalitesi hesaplanır.
K-Means kümeleme örneğini
hatırlayalım..
K-Medoids Kümeleme Örneği
Açıklama:
K- Medoids Algoritmasına göre kümeleme yapılırken,
 İlk   olarak karışık halde verilmiş olan veri seti sıralanır.
 Sıralama  işleminden sonra, her verinin başlangıçta rastgele
  belirlenmiş olan merkez noktalarına göre uzaklığı alınır. Veriler en
  yakın olduğu merkez noktasının kümesine dahil olur.
 Bu adımdan sonra her küme için küme elemanlarının ortalaması alınır. K-
  Medoids algoritmasında küme elemanı olmayan bir değer merkez
  noktası olamaz. Bu nedenle küme ortalamasına en yakın olan nokta
  yeni merkez noktası olur.
 Sonraki   adımda, tekrar her verinin merkez noktalarına olan uzaklığı
  hesaplanır ve veriler en yakın olduğu merkez noktasının kümesine dahil
  edilir. Küme elemanlarının ortalaması alınıp, ortalamaya en yakın noktalar
  yeni merkez noktaları olarak belirlenir.
 Kümeleme    işleminin sonucu, bir sonraki adımda aynı çıkına kadar bu
  işlem tekrarlanır.
Not**

   Görüldüğü gibi K-Medoids kümeleme
algoritmasını K-Means kümeleme
algoritmasından ayıran özellik, merkez
noktalarının belirlenme şeklidir. Küme
elemanı olmayan bir değerin merkez
noktası kabul edilmemesi ise gürültülü
verilerin kümelere dahil edilmesine rağmen,
küme üzerindeki etkilerini ortadan kaldırır.
K-Medoids Algoritmasının
Avantajları ve Dezavantajları
Avantajı:
   Bölünmeli metotlar içinde K-Medoids daha iyi ve kararlı kümeleme sonuçları
    üreten bir algoritmadır. Verilerin işleniş sırası ve ilk atamadaki merkez
    noktaların kümeleme üzerinde etkisi yoktur.(Çünkü ilerideki adımlarda kümenin
    elemanı olmayan hiçbir nokta merkez noktası olamaz.)
   Ayrıca en merkezi elemanların kümeyi temsil etmesi özelliği örnekte görüldüğü
    gibi gürültülü verilerin kümeleme üzerindeki etkisini ortadan kaldırır.
• 2, 4, 6, 8, 10 ortalama: 6
• 2, 4, 6, 8 , 10, 1002 ortalama: 172
• 2, 4, 6, 8 ,10, 1002 orta nokta: 6
Dezavantajı:
   K-medoids, k-means’de olduğu gibi küme sayısının başlangıçta tanımlanmasını
    gerektiren bir metottur. Veriye uygun k sayısının belirlenmesi için birden fazla
    denemenin yapılması gerekir.
K-Medoids Algoriymasının K-Means Algoritması ile
Karşılaştırılması


K-Medoids                                K-Means

   K-Medoids algoritmasında her
    küme, kümede bulunan bir                K-means her küme kendi
    nesneyle temsil edilir.
                                             merkeziyle temsil edilir.
   K-Medoids algoritması gürültülü
    verilerden etkilenmez.                  K-Means algoritması
   Medoid (Merkez nokta) küme               gürültülü verilerden
    içerisinde en merkezi veridir.           etkilenir.
   Küçük verilerde daha güvenilirdir.
                                            K-Means algoritması
   K-Medoids’in K-means’e
    üstünlüğü benzemezlik değerini
                                             büyük verilerde de
    en aza indirmesidir.                     güvenilirdir.
Kaynaklar:
   http://
    www.belgeler.com/blg/of1/blnmeli-kmeleme-yntemleri-ile-veri-madenci
    lii-uygulamalari-data-mining-applications-using-partitional-cluster
    ing-methods
   http://www.iticu.edu.tr/uploads/Kutuphane/dergi/f11/M00176.pdf
   http://web.itu.edu.tr/kiris/08%20Firat%202012.pdf

More Related Content

PPTX
Bilgi Güvenliği Farkındalık Eğitimi Sunumu
PPT
Destek Vektör Makineleri - Support Vector Machine
PPTX
Karar ağaçlari
PDF
Model bias in AI
PPTX
Parametrik ve Parametrik Olmayan İstatistikler
PPTX
Yeni Nesil Sosyal Mühendislik Saldırıları ve Siber İstihbarat
PPTX
Aes Şifreleme
PDF
How do we train AI to be Ethical and Unbiased?
Bilgi Güvenliği Farkındalık Eğitimi Sunumu
Destek Vektör Makineleri - Support Vector Machine
Karar ağaçlari
Model bias in AI
Parametrik ve Parametrik Olmayan İstatistikler
Yeni Nesil Sosyal Mühendislik Saldırıları ve Siber İstihbarat
Aes Şifreleme
How do we train AI to be Ethical and Unbiased?

What's hot (20)

PPTX
Log Yönetimi ve Saldırı Analizi Eğitimi -1
PPTX
Aile anayasası ve aile meclisi 1.grup
PPTX
Responsible AI in Industry (ICML 2021 Tutorial)
PPTX
Fairness and Privacy in AI/ML Systems
PDF
Bilgi Güvenliği Farkındalık Eğitim Sunumu
PDF
Fairness-aware Machine Learning: Practical Challenges and Lessons Learned (KD...
PDF
Bilgi Güvenliği Farkındalık Eğitimi
PPTX
Responsible AI in Industry (Tutorials at AAAI 2021, FAccT 2021, and WWW 2021)
PPTX
Random Forest Algoritması
PDF
Siber Tehdit Avcılığı (Threat Hunting)
PDF
DNS Protokolüne Yönelik Güncel Saldırı Teknikleri & Çözüm Önerileri
PDF
Etkin Siber Savunma i̇çin Tehdit Avcılığı
PPTX
Beyaz Şapkalı Hacker CEH Eğitimi - Bölüm 16, 17, 18
PDF
ÖRNEK - İŞE BAŞLAMA EĞİTİM KATILIM BELGESİ
PPTX
SOC Architecture Workshop - Part 1
PPTX
Log Yönetimi ve Saldırı Analizi Eğitimi - 2
PDF
Ekrem ÇAKMAK Kişisel Koruyucu Donanımlar Temel Sunumu
PDF
Yerel Ağda Gerçekleştirilebilecek Sadırılar ve Türleri
PDF
BT Güvenlik ve Kariyer Klavuzu
PDF
Generative AI and Security (1).pptx.pdf
Log Yönetimi ve Saldırı Analizi Eğitimi -1
Aile anayasası ve aile meclisi 1.grup
Responsible AI in Industry (ICML 2021 Tutorial)
Fairness and Privacy in AI/ML Systems
Bilgi Güvenliği Farkındalık Eğitim Sunumu
Fairness-aware Machine Learning: Practical Challenges and Lessons Learned (KD...
Bilgi Güvenliği Farkındalık Eğitimi
Responsible AI in Industry (Tutorials at AAAI 2021, FAccT 2021, and WWW 2021)
Random Forest Algoritması
Siber Tehdit Avcılığı (Threat Hunting)
DNS Protokolüne Yönelik Güncel Saldırı Teknikleri & Çözüm Önerileri
Etkin Siber Savunma i̇çin Tehdit Avcılığı
Beyaz Şapkalı Hacker CEH Eğitimi - Bölüm 16, 17, 18
ÖRNEK - İŞE BAŞLAMA EĞİTİM KATILIM BELGESİ
SOC Architecture Workshop - Part 1
Log Yönetimi ve Saldırı Analizi Eğitimi - 2
Ekrem ÇAKMAK Kişisel Koruyucu Donanımlar Temel Sunumu
Yerel Ağda Gerçekleştirilebilecek Sadırılar ve Türleri
BT Güvenlik ve Kariyer Klavuzu
Generative AI and Security (1).pptx.pdf
Ad

Viewers also liked (18)

PDF
Veri Madenciliği (Data Mining)
PDF
İşlemciler
PPTX
Naive Bayes Sınıflandırma Uygulaması
PPTX
K means cluster
PPTX
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...
DOC
K-MEDOIDS CLUSTERING USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...
PPTX
Apriori algoritması
PPTX
Destek vektör makineleri
PDF
Yapay Sinir Ağları
PDF
Apriori algoritması
PDF
K means Clustering
PPTX
K-means Clustering with Scikit-Learn
PPT
Clustering
PPT
K mean-clustering algorithm
PDF
Simulation/Simülasyon
DOCX
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİ
PPTX
Metin Madenciliği ile Cümleleri Kategorilendirme
Veri Madenciliği (Data Mining)
İşlemciler
Naive Bayes Sınıflandırma Uygulaması
K means cluster
Birliktelik Kuralları Kullanılarak Pazar Sepeti Analizi (Market Basket Analys...
K-MEDOIDS CLUSTERING USING PARTITIONING AROUND MEDOIDS FOR PERFORMING FACE R...
Apriori algoritması
Destek vektör makineleri
Yapay Sinir Ağları
Apriori algoritması
K means Clustering
K-means Clustering with Scikit-Learn
Clustering
K mean-clustering algorithm
Simulation/Simülasyon
GINI KATSAYISI ve UYGULAMADAKİ ÖRNEKLERİ
Metin Madenciliği ile Cümleleri Kategorilendirme
Ad

K-Means & K-Medoids Algoritması

  • 1. K-Means & K-Medoids Kümeleme Algoritmaları Hazırlayan: Sinem Altan Fatih Dartıcı
  • 2. K-Means Algoritması Nedir?  En eski kümeleme algoritmalarından olan K-Means, 1967 yılında J.B. MacQueen tarafından geliştirilmiştir.  K-Means’in atama mekanizması, her verinin sadece bir kümeye ait olabilmesine izin verir.  Merkez noktanın kümeyi temsil etmesi ana fikrine dayalı bir metottur.
  • 3. K-Means Algoritması Nedir? -2-  Verileribelirlenen küme sayısına göre, her küme için belirlenen ortalama değer doğrultusunda kümelenmesi üzerine çalışır. K-Means algoritması eldeki verileri k adet kümede ve kümelerin ortalamalarına göre kümelere ayırır. K küme sayısı kullanıcı tarafından verilir.  Kısaca n tane nesneyi –küme içi benzerlik maksimum, kümeler arası benzerlik minimum olacak şekilde- k tane kümeye böler.
  • 4. K-Means algoritması Nasıl Çalışır?  K-Means algoritmasının çalışma mekanizmasına göre öncelikle her kümenin merkez noktasını (centroid) veya ortalamasını temsil etmek üzere k adet nesne -rasgele- seçilir.  Kalandiğer nesneler, kümelerin ortalama değerlerine olan uzaklıkları dikkate alınarak en benzer oldukları kümelere dahil edilir.  Daha sonra, her bir kümenin ortalama değeri hesaplanarak yeni küme merkezleri belirlenir ve tekrar nesne-merkez uzaklıkları incelenir. Herhangi bir değişim olmayıncaya kadar algoritma ötelenmeye devam eder.  Enyaygın olarak kullanılan uzaklık hesaplama formülü Öklit uzaklık formülüdür.
  • 5. K-Means algoritması Nasıl Çalışır? -2-
  • 6. Merkez Noktaların Belirlenmesi Başlangıç küme merkezlerinin seçimi k-means’in sonucunu önemli oranda etkiler. Başlangıç noktalarının belirlenmesinde çeşitli teknikler vardır. Bu tekniklerden bazıları: 1) k sayısı kadar rastgele veri seçilip küme merkezleri olarak atanır. 2) Veriler rastgele k tane kümeye atanır ve küme ortalamaları alınarak başlangıç küme merkezleri belirlenir. 3) En uç değerlere sahip veriler küme merkezleri olarak seçilir. 4) Veri setinin merkezine en yakın noktalar başlangıç noktaları olarak seçilir.
  • 13. Açıklama: K- Means Algoritmasına göre kümeleme yapılırken,  İlk olarak karışık halde verilmiş olan veri seti sıralanır. (K-Means Kümeleme Örneği -2)  Sıralama işleminden sonra, her verinin başlangıçta rastgele belirlenmiş olan merkez noktalarına göre uzaklığı alınır. Veriler en yakın olduğu merkez noktasının kümesine dahil olur .(K-Means Kümeleme Örneği -3)  Bu adımdan sonra her küme için küme elemanlarının ortalaması alınır. Bu ortalama yeni merkez noktasıdır.(K-Means Kümeleme Örneği -4’de merkez noktalarının değerleri değişiyor.)  Sonraki adımda, tekrar her verinin merkez noktalarına olan uzaklığı hesaplanır ve veriler en yakın olduğu merkez noktasının kümesine dahil edilir. Küme elemanlarının ortalaması alınıp yeni merkez noktaları belirlenir.  Kümeleme işleminin sonucu, bir sonraki adımda aynı çıkına kadar bu işlem tekrarlanır.
  • 14. K-means Algoritmasının Avantajları ve Dezavantajları Avantajı:  Uygulanabilirliğikolaydır ve büyük veri kümelerinde hızlı çalışabilir. Veri sayısı çok fazla olan hesaplamalarda, K-Means, küme sayısı küçük ise hesaplamaları, hiyerarşik kümelemeden daha hızlı yapar. Dezavantajı:  K-Means algoritması k küme sayısını tespit edememektedir. Bu nedenle uygun k sayısını bulana kadar bir deneme yanılma süreci gerçekleşmektedir.  Gürültülü verilere duyarlıdır. Bu veriler de kümelere dahil edilir.
  • 15. K-Medoids Algoritması Nedir?  K-Medoids algoritmasının temeli, verinin çeşitli yapısal özelliklerini temsil eden k tane temsilci nesneyi bulma esasına dayanır.  Bir grup nesneyi k tane kümeye bölerken esas amaç, birbirine çok benzeyen nesnelerin bir arada olduğu ve farklı kümelerdeki nesnelerin mümkün olduğunca birbirinden benzersiz olduğu kümeleri bulmaktır.  En yaygın kullanılan K-Medoids algoritması, 1987 yılında Kaufman and Rousseeuw tarafından geliştirilmiştir.  Amacın k tane nesneyi bulmak olmasından dolayı, K-Medoids metodu olarak adlandırılmaktadır.
  • 16. Temsilci Nesne Nedir?  Temsilcinesne diğer nesnelere olan ortalama uzaklığı minimum yapan kümenin en merkezi nesnesidir. Bu nedenle, bu bölünme metodu her bir nesne ve onun referans noktası arasındaki benzersizliklerin(uzaklıkların) toplamını küçültme mantığı esas alınarak uygulanır. Kümeleme literatüründe temsilci nesnelere çoğunlukla merkeztipler (centrotypes) denilmektedir.
  • 17. K-Medoids Algoritması Nasıl Çalışır? k adet temsilci nesne tespit edildikten sonra her bir nesne en yakın olduğu temsilciye atanarak k tane küme oluşturulur. Sonraki adımlarda her bir temsilci nesne temsilci olmayan nesne ile değiştirilerek kümelemenin kalitesi yükseltilinceye kadar ötelenir. Bu kalite nesne ile ait olduğu kümenin temsilci nesnesi arasındaki ortalama benzersizliğe göre değişir.
  • 18. K-Medoids Kümeleme Adımları K-Medoids algoritmasında birinci aşama yapılandırma aşamasıdır. Bu aşama kümelemenin başlangıç aşamasıdır, k adet temsilci nesne seçilene kadar devam eder. Başlangıç merkezleri rastgele atanabileceği gibi çeşitli işlemler sonucu da belirlenebilir. Algoritmanın ikinci aşaması değiştirme ( Swap ) aşamasıdır. Bu aşama temsilci nesneleri geliştirerek kümeleme işleminin verimini arttırmak için uygulanır. Her bir nesne merkez nokta çifti için hesaplama yapılır. Değişim ihtimallerinin kümelemeye nasıl bir etkisi olduğu incelenerek her bir kombinasyon için kümeleme kalitesi hesaplanır.
  • 21. Açıklama: K- Medoids Algoritmasına göre kümeleme yapılırken,  İlk olarak karışık halde verilmiş olan veri seti sıralanır.  Sıralama işleminden sonra, her verinin başlangıçta rastgele belirlenmiş olan merkez noktalarına göre uzaklığı alınır. Veriler en yakın olduğu merkez noktasının kümesine dahil olur.  Bu adımdan sonra her küme için küme elemanlarının ortalaması alınır. K- Medoids algoritmasında küme elemanı olmayan bir değer merkez noktası olamaz. Bu nedenle küme ortalamasına en yakın olan nokta yeni merkez noktası olur.  Sonraki adımda, tekrar her verinin merkez noktalarına olan uzaklığı hesaplanır ve veriler en yakın olduğu merkez noktasının kümesine dahil edilir. Küme elemanlarının ortalaması alınıp, ortalamaya en yakın noktalar yeni merkez noktaları olarak belirlenir.  Kümeleme işleminin sonucu, bir sonraki adımda aynı çıkına kadar bu işlem tekrarlanır.
  • 22. Not** Görüldüğü gibi K-Medoids kümeleme algoritmasını K-Means kümeleme algoritmasından ayıran özellik, merkez noktalarının belirlenme şeklidir. Küme elemanı olmayan bir değerin merkez noktası kabul edilmemesi ise gürültülü verilerin kümelere dahil edilmesine rağmen, küme üzerindeki etkilerini ortadan kaldırır.
  • 23. K-Medoids Algoritmasının Avantajları ve Dezavantajları Avantajı:  Bölünmeli metotlar içinde K-Medoids daha iyi ve kararlı kümeleme sonuçları üreten bir algoritmadır. Verilerin işleniş sırası ve ilk atamadaki merkez noktaların kümeleme üzerinde etkisi yoktur.(Çünkü ilerideki adımlarda kümenin elemanı olmayan hiçbir nokta merkez noktası olamaz.)  Ayrıca en merkezi elemanların kümeyi temsil etmesi özelliği örnekte görüldüğü gibi gürültülü verilerin kümeleme üzerindeki etkisini ortadan kaldırır. • 2, 4, 6, 8, 10 ortalama: 6 • 2, 4, 6, 8 , 10, 1002 ortalama: 172 • 2, 4, 6, 8 ,10, 1002 orta nokta: 6 Dezavantajı:  K-medoids, k-means’de olduğu gibi küme sayısının başlangıçta tanımlanmasını gerektiren bir metottur. Veriye uygun k sayısının belirlenmesi için birden fazla denemenin yapılması gerekir.
  • 24. K-Medoids Algoriymasının K-Means Algoritması ile Karşılaştırılması K-Medoids K-Means  K-Medoids algoritmasında her küme, kümede bulunan bir  K-means her küme kendi nesneyle temsil edilir. merkeziyle temsil edilir.  K-Medoids algoritması gürültülü verilerden etkilenmez.  K-Means algoritması  Medoid (Merkez nokta) küme gürültülü verilerden içerisinde en merkezi veridir. etkilenir.  Küçük verilerde daha güvenilirdir.  K-Means algoritması  K-Medoids’in K-means’e üstünlüğü benzemezlik değerini büyük verilerde de en aza indirmesidir. güvenilirdir.
  • 25. Kaynaklar:  http:// www.belgeler.com/blg/of1/blnmeli-kmeleme-yntemleri-ile-veri-madenci lii-uygulamalari-data-mining-applications-using-partitional-cluster ing-methods  http://www.iticu.edu.tr/uploads/Kutuphane/dergi/f11/M00176.pdf  http://web.itu.edu.tr/kiris/08%20Firat%202012.pdf