将新数据集转换为以前的 patsy dmatrix 形式

问题描述

我将我的数据集分为 2 组,训练集和测试集。我的数据中有 6 种类型的虚拟变量。每次我尝试在训练集上运行模型时,都会出错。 这是我的代码

X = dmatrix('sfdc_tier + poc_image + sub_segment + Product_Set + Volume_2019_Product',data = data)
x = dmatrix('sfdc_tier + poc_image + sub_segment + Product_Set + Volume_2019_Product',data = Training_Set)
Y = data['discount_Total')
model = sm.OLS(Y,X).fit()
y_pred = model.predict(x)

请注意,“Volume_2019_Product”是唯一的数值数据,其余数据是分类数据。

我得到的错误如下:

ValueError: 形状 (662,69) 和 (90,) 未对齐:69 (dim 1) != 90 (dim 0)

我该如何解决这个错误??我需要我的训练数据矩阵看起来与 X 的原始 dmatrix 完全一样。 训练数据包含与我训练模型的其他数据集相同的列标题,但它不包含在创建一个模型预测错误

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)