K-Means Clustering
随机生成点集,并让点集有一定的规律聚合规律。
K-Means 算法是一种cluster analysis算法,主要通过不断地迭代求取离种子点最近均值的算法。
迭代
执行以下两步直至
收敛
:
找到最近的centroid
求图中所有点到种子点的距离, 如果点Pi离种子点Si最近,那么Pi属于Si点群。
更新centroid
移动种子点到属于他的“点群”的中心,也就是平均正中心。
找到最近的centroid
点集的数量
:
初始数据大致分类
:
centroid的个数
:
待聚类的点集
无规律程度递增
随机设置生成的点集位置
随机设置centroids位置