Patsy公式中的多个类别变量

问题描述

我有一些数据,其中包含多个分类元素。

我想使用回归模型来建模它们,使用statsmodels所使用的patsy公式来获得便利。

当仅使用一个类别变量时,如公式'C(Weekday,Treatment) - 1'中所示,它将按预期工作,删除了截距,并在每个类别的设计矩阵中为我留了一列。

但是,当使用2个不同的分类变量(例如'C(Status,Treatment) + C(Weekday,Treatment) - 1')时,所得矩阵的确没有截距,而且“工作日”的值之一也丢失了,好像我没有{ {1}}了。

我没有看到某些统计原因吗?去除截距不足以阻止完美的共线性吗? 谢谢

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)