K-均值表现

我有一个很大的数据集，每个样本都有一个从0到8的特定类号。我使用了sklearn python包中的K-means算法。当我多次运行代码时，K-means的输出是不同的。例如，第246个样本在第一次运行中属于群集3，在第二次运行中属于群集0。我还附有一张图片供您考虑。

我认为这是因为集群中心的随机初始化，但我需要在多次运行中获得恒定的结果。我该如何解决？

簇的数量不是真实数据，是一个随机数，表示一个与另一个的簇不同。那不是要稳定号码。

要知道类别的真实类型，需要将已知的类别和助记符编号关联起来。

您的样本：

1：246是＃3

2：246是＃0

您需要命名为[246]