K均值聚类是最基础的一种聚类方法。K均值聚类,就是把看起来最集中、最不分散的簇标签分配到输入训练样本
里。具体而言,通过下式计算簇y的分散情况。
在这里,表示的是满足
的y的和。
上式的为簇y的中心,
为属于簇y的样本总数。利用上述定义,对于所有的簇
的下式和为最小时,决定其所属的簇标签。
K均值聚类是最基础的一种聚类方法。K均值聚类,就是把看起来最集中、最不分散的簇标签分配到输入训练样本
里。具体而言,通过下式计算簇y的分散情况。
在这里,表示的是满足
的y的和。
上式的为簇y的中心,
为属于簇y的样本总数。利用上述定义,对于所有的簇
的下式和为最小时,决定其所属的簇标签。