K-means聚类算法采用的是将N*P的矩阵X划分為K个类使得类内对象之间的距离最大,而类之间的距离最小。
K 表示将X划分为几类为整数
Idx N*1的向量,存储的是每个点的聚类标号
C K*P的矩阵存儲的是K个聚类质心位置
sumD 1*K的和向量,存储的是类间所有点与该类质心点距离之和
D N*K的矩阵存储的是每个点与所有质心的距离
这其中的参数Param1、Param2等,主要可以设置为如下:
‘sqEuclidean’ 欧式距离(默认时采用此距离方式)
‘Hamming’ 只针对二进制数据
2. ‘Start’(初始质心位置选择方法)
‘sample’ 从X中随機选取K个质心点
‘uniform’ 根据X的分布范围均匀的随机生成K个质心
‘cluster’ 初始聚类阶段随机选择10%的X的子样本(此方法初始使用’sample’方法)
matrix 提供一K*P的矩阵,作为初始质心位置集合