掩盖多元单变量回归中的NaN值

display

我正在使用上面的代码在许多列上进行迭代，并逐一进行回归。这样可以正常工作，并产生我想要的输出。

但是，在实际数据集中，我正在读取Excel文件。我在许多列上进行回归，有些列比其他列具有更多的行。这将导致输出采用以下形式-

我使用df [[0,1,2,3,5,6,7,8,9]] = float（'nan'）进行模拟，尽管并非所有列都具有NaN值。>

这里的错误对我来说很明显，但我不知道如何解决。回归仅在长度最大的一列上运行。也就是说，如果您要构造一个由该excel文件的值组成的10 * 10矩阵，则它将仅输出最长的列或与之相等的列。

是否可以屏蔽nan值，以便输出合理？我考虑过插补和插值，但两者都会使最终值失真。再次，问题在于公式仅计算具有最大维的列。由于其他列的维数较小（即，带有值的行较少），因此无法获得输出。

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）