机器学习：层次聚类算法详解

DOCX文件

下载需积分: 9 | 171KB | 更新于2024-08-31 | 69 浏览量 | 举报收藏

立即下载

"这篇文档是关于机器学习中基于层次的聚类算法的总结，主要讨论了层次聚类的原理和具体实现，包括自下而上的合并法，并详细介绍了距离矩阵和几种不同的链接方法，如单链接、全链接和平均链接。" 在机器学习领域，聚类是一种无监督学习方法，用于发现数据中的自然群体或类别。基于层次的聚类算法是一种聚类技术，它通过构建一个层次结构，也就是所谓的聚类树来组织数据。这种算法分为两种类型：自下而上的凝聚层次聚类和自上而下的分裂层次聚类。本文档重点讲解了凝聚层次聚类，它通过逐步合并距离最近的样本点或已形成的簇来构建聚类树。算法的核心在于计算样本点之间的相似性，通常用距离来度量。在层次聚类中，计算类别之间的距离是一个关键步骤。首先，需要构建一个距离矩阵D，其中D(i,j)表示类别i到类别j的距离，且D(i,j) = D(j,i)。距离矩阵的对角线元素D(i,i)始终为0，表示一个类别到自身的距离为0。在实际操作中，随着聚类过程的推进，类别可能会合并，这时需要定义新的类别间距离。文档中提到了四种链接方法： 1. 单链接（Single Linkage）：选取两个类别中最接近的两个数据点之间的距离作为两个类别的距离。这种方法容易受到离群值的影响，可能导致聚类不稳定。 2. 完全链接（Complete Linkage）：恰好与单链接相反，选取两个类别中最远的两个数据点之间的距离。这种方式相对稳健，但可能过于保守，导致聚类过于紧密。 3. 平均链接（Average Linkage）：计算两个类别中所有数据点与其他所有数据点的平均距离。平均链接通常提供更合理的聚类结果，但计算成本较高。 4. 中心链接（Center Linkage）：计算类别中心之间的距离，这需要事先知道类别的中心点。通过迭代这些链接方法，层次聚类算法继续合并最近的类别，直到所有样本点都归入同一个簇，形成一个层次聚类树。这个树状结构可以帮助分析和理解数据的层次关系，是探索性数据分析中的有力工具。这份文档是面向初学者的，详细解释了层次聚类的基本概念和计算过程，特别关注了距离矩阵的构建和不同链接策略的选择，对于理解和应用层次聚类算法具有很高的参考价值。

一些前提的约定，还是沿用上篇文章的哈。先来致敬下男神。

一：层次聚类介绍

它也是聚类算法的一种，也是我学习的第三种聚类算法，通过计算样本点之间的相似

性，也可以理解成距离，构建出一个嵌套层次聚类树，有两种方式，一个是自下而上的合

并法，一个是自上而下的分裂法，本文讲解更容易理解的合并法。

如上图所示，不断地将样本汇聚成小的簇，再将晓得簇不断重复该过程汇聚成更大簇。

二：算法介绍

简单的说层次聚类的合并算法是通过计算每一个类别的数据点与所有数据点之间的距

离来确定它们之间的相似性，距离越小，相似度越高。并将距离最近的两个数据点或类别

进行组合，生成聚类树。然后不断迭代这一过程，直到最后所有的样本都在一个类别内。

算法详细过程如下：

：距离矩阵

现在我们需要描述类别和类别之间的相似性，也可以用距离来衡量，我们这里还是用

欧氏距离来计算。给定两个样本点 







。



‖

(i )

−x

( j )

‖



√

(i)

−x

( j )

)

+( x

(i)

−x

( j)

)

+(x

(i)

−x

( j)

)

+…+(x

(i)

−x

( j)

)

下载后可阅读完整内容，剩余6页未读，继续阅读

开通会员，免费下载（低至0.43元/天)

成为会员后, 你将解锁

下载资源随意下

优质VIP博文免费学

优质文库回答免费看

付费资源9折优惠

星海千寻

粉丝: 307

机器学习：层次聚类算法详解

每天进步一点点《ML - DBSCAN》.docx

每天进步一点点《ML - K-Means》.docx

层次聚类.docx

转载 层次聚类.docx

基于类簇规模不均衡度量的粗糙模糊K-means聚类算法.docx

聚类分析K-means算法综述.docx

基于密度峰值算法的三支聚类.docx

1-时空事件聚类方法研究.docx

数据挖掘中聚类算法的新发展-2019年文档.docx

基于层次的聚类算法.docx

实证分析 方法与软件6-聚类分析.docx

CLOPE-快速有效的聚类算法..docx

聚类算法概述， K-Means 聚类算法详解.docx

5聚类之1. 层次聚类基于划分的聚类(k.docx

面向立木识别的有效K-均值聚类算法研究.docx

K-means聚类数据.rar

聚类算法-基础篇.docx

k-means 聚类算法研究综述.docx

WinCE Overlay - 示例:mosquito

QTableWidget编辑单元格后按回车键焦点跳转至下一单元格

最新资源

转载层次聚类.docx

实证分析方法与软件6-聚类分析.docx