K-均值表现

问题描述

我有一个很大的数据集,每个样本都有一个从0到8的特定类号。我使用了sklearn python包中的K-means算法。当我多次运行代码时,K-means的输出是不同的。例如,第246个样本在第一次运行中属于群集3,在第二次运行中属于群集0。我还附有一张图片供您考虑。

我认为这是因为集群中心的随机初始化,但我需要在多次运行中获得恒定的结果。我该如何解决

enter image description here

解决方法

簇的数量不是真实数据,是一个随机数,表示一个与另一个的簇不同。 那不是要稳定号码。

要知道类别的真实类型,需要将已知的类别和助记符编号关联起来。

您的样本:

1:246是#3

2:246是#0

您需要命名为[246]