具有极低方差的数据聚类的数据准备

问题描述

我尝试集群生产机器的数据。我正在尝试K-Means,DB-SCAN和OPTICS。使用所有算法,结果都非常糟糕(例如,轮廓系数为0.05)。

从我的观点来看,数据差异很小。我已经做过PCA,前两个主要成分仅占数据集变异的6%。下图显示了前两个主要成分的直方图和散点图。

对于数据准备,我尝试了标准化,最小-最大缩放,具有方差阈值的特征选择(sklearn),单变量特征选择(sklearn)和上述PCA。结果并不令人满意。

所以我的问题是,是否还有其他您认为对我的头脑有用的数据准备方法。或者,如果数据根本不适合进行聚类:D

感谢您的每条评论

First two principal components

K-Means++ with two features

K-Means++ with five features

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)