卡在包含20个要素的数据集的聚类分析中所有数值

问题描述

我希望大家都过得不错。我是一名机器学习工程师,我属于应届毕业生。去年我一直是自由职业者,所以我在机器学习方面没有太多经验,现在我是初创公司中唯一处理机器学习部分的人,所以我只能在这里讨论我的问题。 / p>

问题1: 我陷入集群的情况,在这种情况下,我必须基于20列(所有数值)创建集群,但我们的要求是必须创建7-8个集群(每个集群应代表工程,商业,社会科学等领域)并贴上标签。但是模型表明3-4是最优的簇数。

数字2: 我使用监督学习解决了该数据集,现在我尝试使用非监督学习进行解决,但是当我将监督标签与聚类进行比较时,每个数据点都属于一个以上的聚类。 例如,点A属于群集1,它也属于群集2,也属于群集3。我应该为该点分配什么字段,就像我对如何解决此类问题感到困惑一样。 最好的问候

下面是带有类别和群集列的数据集的屏幕截图。

Screenshot

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)