问题描述
我目前正在为一个看似容易解决的问题而苦苦挣扎,也许在先前的问题中已经回答过,但是我在网上找不到关于此问题的任何信息。
我目前正在对某些数据进行聚类分析(k均值,分层的热图,但无论如何)。我想检查我的群集(“群集组”列)是否与附加到我的个人的值列表(“向向性”列)一致。问题是,这个值列表当然没有与我的聚类结果相同的级别。我想对两个变量进行kappa-fleiss一致性测试(聚类结果与值列表)。这是我的数据框的简化版本:
Cluster group tropism
JX308829.1 all "1" "digestif"
NC_020890.1 all "1" "digestif"
KF954417.1 all "1" "peau"
HM011544.1 all "2" "peau"
MH844627.1 all "2" "peau"
HQ696595.1 all "2" "rein"
AB211390.1 all "2" "rein"
AB301101.1 all "2" "rein"
HM011559.1 all "2" "digestif"
KY404016.1 all "2" "rein"
KF444093.1 all "3" "cerveau"
KJ725028.1 all "3" "peau"
GU296408.1 all "3" "peau"
EU711058.1 all "3" "syst_resp"
KC549591.1 all "4" "syst_resp"
KR090571.1 all "4" "muscle"
AB081611.1 all "5" "muscle"
AB092581.1 all "5" "peau"
AB127351.2 all "5" "digestif"
问题是,自然地,kappa-fleiss一致性评分会比较两个具有相同级别的列表。
我试图创建一种算法,其中每个集群级别都按照其中的大多数值进行重命名,但是当然似乎有些“操纵数据”,并且组之间和组内部具有一些相等性,因此很难为我的群集组选择值。然后,我有多个问题:
- 为什么不能比较两个具有不同级别的变量列表之间的一致性?这似乎有些幼稚,但是不应该在组之间测量一致性(例如,“消化”是否与“集群组1”相关联或诸如此类)?我在kappam.fleiss()函数中错过了一个选项吗?
- 是否有功能,测试或遗漏的内容?如果可以的话,我可能会道歉,但是我尝试找到像kappa-fleiss测试一样强大而有意义的东西,但是没有成功。
- 您认为我应该像前面提到的那样处理数据吗?即使我必须手动操作某些零件,这也可以接受吗?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)