python-在DataFrame上将NaN值插值为环

我需要在一个Dataframe上插入NaN值,但我希望该插值能获得DataFrame的第一个值,以防NaN值是最后一个值.这是一个例子:

import pandas as pd
import numpy as np
df = pd.DataFrame.from_dict({"a": [1,2,3], "b":[1,2,np.nan]})

因此,DataFrame是:

   a    b
0  1  1.0
1  2  2.0
2  3  NaN

但是当我插值nan值时:

df.interpolate(method="linear", inplace=True)

我有

   a    b
0  1  1.0
1  2  2.0
2  3  2.0

插值不使用第一个值来执行.由于圆弧插补,我希望的输出将填充1.5的值.

解决方法:

一种可能的解决方案是添加第一行,插值并删除最后一行:

df = df.append(df.iloc[0]).interpolate(method="linear").iloc[:-1]
print (df)
     a    b
0  1.0  1.0
1  2.0  2.0
2  3.0  1.5

编辑:

更一般的解决方案:

df = pd.DataFrame.from_dict({"a": [1,2,3,4], "b":[np.nan,1,2,np.nan]})

df = pd.concat([df] * 3).interpolate(method="linear").iloc[len(df):-len(df)]

print (df)
   a         b
0  1  1.333333
1  2  1.000000
2  3  2.000000
3  4  1.666667

或者,如果仅需要使用最后一个不丢失的值:

df = pd.DataFrame.from_dict({"a": [1,2,3,4], "b":[np.nan,1,2,np.nan]})

df1 = df.ffill().iloc[[-1]]
df2 = df.bfill().iloc[[0]]
df = pd.concat([df1, df, df2]).interpolate(method="linear").iloc[1:-1]

print (df)
   a    b
0  1  1.5
1  2  1.0
2  3  2.0
3  4  1.5

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...