问题描述
我有一个很大的数据集,每个样本都有一个从0到8的特定类号。我使用了sklearn python包中的K-means算法。当我多次运行代码时,K-means的输出是不同的。例如,第246个样本在第一次运行中属于群集3,在第二次运行中属于群集0。我还附有一张图片供您考虑。
我认为这是因为集群中心的随机初始化,但我需要在多次运行中获得恒定的结果。我该如何解决? 
解决方法
簇的数量不是真实数据,是一个随机数,表示一个与另一个的簇不同。
那不是要稳定号码。
要知道类别的真实类型,需要将已知的类别和助记符编号关联起来。
您的样本:
1:246是#3
2:246是#0
您需要命名为[246]