在scikit-learn中使用不同数据子集进行回归

问题描述

我试图估计一些权重,但是数据集中的每个条目每次仅包含权重的一个子集。我觉得这应该真的很容易,但是对于如何构造问题却一无所知。

数据来自一个物理过程,其中N个门各自允许不同的流量。但是,在整个数据集中,每个浇口的流量不应有很大波动。每个可用数据点都包含:

  • 大门的开/关状态
  • 整个系统的总流量

总流量只是通过闸门的流量之和。

所以我会有类似的东西

configs = np.array([
    [1,0],[1,1,1],1]  ])

totals = np.array([[
    2003,236851,393559,5759,238656,395060 ]])

我试图将其作为联立线性方程组的基本系统来解决,因为与门数(即未知数)相比,数据点(即方程式)舒适得多。我可以对每个不同的数据点执行此操作,然后平均得出每个门的权重。

是否可以将其设置为回归问题,或者线性回归是否可以有效地完成我上面对联立方程所做的工作?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)