问题描述
我正在尝试衡量 k-means 算法的稳健性。我已经运行了 100 次算法,因此,我获得了 100 个由 0 到 k-1 的整数组成的 N 元素列表。例如
[8 4 8 3 2 1 3 1 3 6 4 4 3 8 1 8 1 4 4 3 1 0 5 8 8 8 2 0 8 3 3 2 8 4]
[5 2 5 2 2 7 2 7 2 1 8 8 2 7 7 5 7 8 0 5 7 2 8 5 5 5 2 5 5 2 5 2 5 3]
我想检查集群在 100 次迭代中的每一次迭代中是否相似。问题是在每次迭代中,相同的集群可以用不同的标签表示。例如,在第一次迭代中,标签 1 可以对应于第二次迭代中的标签 5。例如,如果k=2,我可以得到如下列表:
[0 1 0 0 1 0 1 0 1 0 1 1 1 0 0 0 0 1 1 0 0 1 1 0 0 0 1 0 0 1 0 1 0 1]
[0 1 0 0 1 0 1 0 1 0 1 1 1 0 0 0 0 1 1 0 0 1 1 0 0 0 1 0 0 1 0 1 0 1]
[1 0 1 1 0 1 0 1 0 1 0 0 0 1 1 1 1 0 0 1 1 0 0 1 1 1 0 1 1 0 1 0 1 0]
[1 0 1 1 0 1 0 1 0 1 0 0 0 1 1 1 1 0 0 1 1 0 0 1 1 1 0 1 1 0 1 0 1 0]
依此类推,我可以看到集群是一致的,如何自动检查集群是否相似?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)