K-Means Clustering


随机生成点集,并让点集有一定的规律聚合规律。
K-Means 算法是一种cluster analysis算法,主要通过不断地迭代求取离种子点最近均值的算法。
迭代执行以下两步直至收敛:
找到最近的centroid
求图中所有点到种子点的距离, 如果点Pi离种子点Si最近,那么Pi属于Si点群。
更新centroid
移动种子点到属于他的“点群”的中心,也就是平均正中心。
找到最近的centroid
点集的数量
:

初始数据大致分类
:

centroid的个数
:

待聚类的点集
无规律程度递增

随机设置生成的点集位置 随机设置centroids位置