问题描述
我使用nmf
包进行了迭代聚类。
详细地说,我每次使用500次随机观察(从〜15000次观察中采样)和78个固定变量(将nmf
参数固定为2)运行rank
函数100次。
然后我根据H <- coef(result)
矩阵中的较大值将每个变量分配给两个群集之一。
现在我有一个78 x 100
矩阵,在其中存储了组分配的结果。
问题是,如何评估/区分类似后续情况(聚类相同但符号不同):
V1 V2
1 k1 k2
2 k2 k1
3 k2 k1
4 k1 k2
5 k1 k2
由此(相同的聚类和相同的符号):
V1 V3
1 k1 k1
2 k2 k2
3 k2 k2
4 k1 k1
5 k1 k1
并且由此(群集有所不同):
V1 V4
1 k1 k1
2 k2 k1
3 k2 k2
4 k1 k1
5 k1 k2
我无法控制表示法。 换句话说,我想评估同一变量聚在一起的频率。
谢谢
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)