在scikit-learn中使用不同数据子集进行回归

我试图估计一些权重，但是数据集中的每个条目每次仅包含权重的一个子集。我觉得这应该真的很容易，但是对于如何构造问题却一无所知。

数据来自一个物理过程，其中N个门各自允许不同的流量。但是，在整个数据集中，每个浇口的流量不应有很大波动。每个可用数据点都包含：

总流量只是通过闸门的流量之和。

所以我会有类似的东西

configs = np.array([
    [1,0],[1,1,1],1]  ])

totals = np.array([[
    2003,236851,393559,5759,238656,395060 ]])

我试图将其作为联立线性方程组的基本系统来解决，因为与门数（即未知数）相比，数据点（即方程式）舒适得多。我可以对每个不同的数据点执行此操作，然后平均得出每个门的权重。

是否可以将其设置为回归问题，或者线性回归是否可以有效地完成我上面对联立方程所做的工作？

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）