您如何组织数据并在 R 中运行多项概率?

问题描述

对于“如何在 R 中运行此模型”问题,我深表歉意。我将是第一个承认我是统计模型新手的人。希望我有足够的实质性问题来吸引它,问题会更像是“R 中的这个命令是否对应于这个统计模型?”

我正在尝试估计一个模型,该模型可以估计给定 Twitter 用户“关注”给定政党的政治用户的概率。我的数据框处于个人用户级别,每个用户都可以选择关注或不关注 Twitter 上的某个派对。作为替代特定变量,我测量了与 Twitter 用户和政党之间的意识形态距离,以及一个指定距离是正值还是负值的交互项。因此,在 Twitter 上关注政治家的决定取决于您的意识形态距离。

最初我试图估计一个条件 logit 模型,但我很快就放弃了这个想法,因为这些选择不是相互排斥的,即他们可以选择跟随一个以上的一方。现在我怀疑我是否应该使用多项式概率或多元概率,因为我希望我的模型允许个人选择多个选项。但是,当我尝试估计多项式概率时,我的代码不起作用。我的代码是:

mprobit <- mlogit(Follow ~ F1_distance+F2_distance+F1_distance*F1_interaction+F2_distance*F2_interaction+strata(id),long,probit = T,seed = 123)

我收到以下错误消息:

Error in dfidx::dfidx(data = data,dfa$idx,drop.index = dfa$drop.index,: 
  the two indexes don't define unique observations

我已尝试查找错误,但似乎找不到与概率模型相关的任何内容。你能告诉我我做错了什么吗?再次为我的无知感到抱歉。感谢您的帮助。

另外,我尝试在下面的代码中复制我的数据框。数据是针对第一个 Twitter 用户的前 6 个观察,但我有一个包含 5181 个用户的数据集,对应于 51810 个观察,因为丹麦有 10 个政党。

 id    Alternative  Follow F1_distance  F2_distance  F1_interaction    
1 1    alternativet  1     -0.9672566   -1.3101138              0
2 1 danskfolkeparti  0      0.6038972    1.3799961              1             
3 1    konservative  1      1.0759252    0.8665096              1              
4 1    enhedslisten  0     -1.0831657   -1.0815424              0              
5 1 liberalalliance  0      1.5389934    0.8470291              1              
6 1   nyeborgerlige  1      1.4139934    0.9898862              1              

 F2_interaction
1   0
2   1
3   1
4   0
5   1
6   1
>```

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)