根据样本质心之间的距离对样本进行聚类

问题描述

我有将其标记为两个聚类的数据（例如：阳性，阴性）。我将获得新的样本数据，并基于距两个聚类的质心的最短距离，我要将新样本分类为正值或负值。对于那些我可以找到KMeans的例子。我的正样本数据看起来像这样

x1 = np.array([ 0.170755,......      0.313704,0.10206 ]) # 56 dimensions
x2 = np.array([-0.371852,......      0.255809,0.475981]) 
.... x28

现在，我正在尝试使用上述链接中提到的示例计算群集的质心。

X = np.array(list(zip(x,x2,x3,...,x28))).reshape(len(x1),28)
kmeans_model = KMeans(n_clusters=1).fit(X)

据我所知，该数据属于一个簇，我给出了n_clusters = 1的值，但是当我尝试打印质心kmeans_model.cluster_centers_的值时，它给出了像[[0.02490224,0.12898346]]这样的数组，但是我期望数组的尺寸与x1相同。我是在正确计算质心还是我的基本理解出错了？

在这种情况下，将如何计算该质心与新样本之间的距离（类似于x1）？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

centroid k-means machine-learning python

根据样本质心之间的距离对样本进行聚类

问题描述

解决方法

相关问答