问题描述
集群中为什么有重叠?是否因为sklearn.KMeans过早完成迭代?图:kmeans cluster sepal iris flower
一些澄清:
- 数据是4D的,值是标准化的(@OmG指出了我的问题的答案)
- 我在这里上传了3个文件:github repository
- code.py - minimum for this question
- code_notebook.ipynb same as code.py + other functions
- iris-dataset.csv : the dataset
因为我正在处理的示例始终只绘制前两列,所以我认为我仅在这两个变量上运行聚类。感谢您指出问题的答案!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)