掩盖多元单变量回归中的NaN值

问题描述

display

我正在使用上面的代码在许多列上进行迭代,并逐一进行回归。这样可以正常工作,并产生我想要的输出

但是,在实际数据集中,我正在读取Excel文件。我在许多列上进行回归,有些列比其他列具有更多的行。这将导致输出采用以下形式-

This is what the output looks like in the real dataset

我使用df [[0,1,2,3,5,6,7,8,9]] = float('nan')进行模拟,尽管并非所有列都具有NaN值。>

这里的错误对我来说很明显,但我不知道如何解决。回归仅在长度最大的一列上运行。也就是说,如果您要构造一个由该excel文件的值组成的10 * 10矩阵,则它将仅输出最长的列或与之相等的列。

是否可以屏蔽nan值,以便输出合理?我考虑过插补和插值,但两者都会使最终值失真。再次,问题在于公式仅计算具有最大维的列。由于其他列的维数较小(即,带有值的行较少),因此无法获得输出

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)