一、简介
较为详细介绍了聚类分析的各种算法和评价指标,本文将简单介绍如何用python里的库实现它们。
二、k-means算法
和其它机器学习算法一样,实现聚类分析也可以调用sklearn中的接口。...# 这里和KMeans类意义稍有不同,KMeans类里的n_init是从相同训练集数据中随机初始化质心。...':挑选两个簇来合并,使得所有簇中的方差增加最小
# 'complete':将簇中点之间最大距离最小的两个簇合并
# 'average':将簇中所有点之间平均距离最小的两个簇合并
# 'single...fit(X)——对数据X进行聚类- labels_——获取训练数据所属的类别,比设置的聚类中心个数少1- n_leaves_——层次树中的叶子数- children_——一个大小为[n_samples..., 0, 0, 2, 1, 1, 0, 2, 0, 2, 2, 1, 0, 0, 0, 0,
2, 0, 1, 0, 0, 2, 2, 1, 1, 0, 1, 0])
4.3.1 获取层次树中的叶子数