聚类算法有很多种,比如K-Means,AP聚类,层次聚类(Hierarchical clustering)等等,主要说一下K-Means.
kmeans简介
K-Means之所以很受欢迎,就是其速度很快并且有很好的可扩展性。K-Means算法是一个重复移动类中心点的过程,把类的中心点,也称重心(centroids),移动到其包含成员的平均位置,然后重新划分其内部成员。
在博文K-Means聚类中有一个很好的里子说明了kmeans的具体工作原理。
kmeans库的使用
在scikit_learn库中就有kmeans算法的具体实现,官方说明见连接sklearn.cluster.KMeans
more >>