聚类算法有很多种,比如K-Means,AP聚类,层次聚类(Hierarchical clustering)等等,主要说一下K-Means.
kmeans简介
K-Means之所以很受欢迎,就是其速度很快并且有很好的可扩展性。K-Means算法是一个重复移动类中心点的过程,把类的中心点,也称重心(centroids),移动到其包含成员的平均位置,然后重新划分其内部成员。
在博文K-Means聚类中有一个很好的里子说明了kmeans的具体工作原理。
kmeans库的使用
在scikit_learn库中就有kmeans算法的具体实现,官方说明见连接sklearn.cluster.KMeans
下面代码是具体的使用的方法:
|
|
本文总阅读量 次
本文由 Yu Zhang 发表于 Yu Zhang's Blog ,采用署名-非商业性使用-禁止演绎 3.0进行许可。
非商业转载请注明作者及出处。商业转载请联系作者本人。