用groupby平均值替换熊猫数据框的空值

问题描述

我有一个包含以下数据的数据框:

df

我想用每个国家的平均值代替每个国家的空值。

例如 我用以下代码计算了平均值:

df2=df.groupby('country').mean()

mean

我必须用df2中存在的相应平均值替换df中的空值。 如果平均值为NaN,则保留Nan,否则为该值。

我尝试使用以下代码,但失败了: 1.输出仍然具有NaN值:

Output still has NaN values

2。

df['retail'] = df['retail'].replace('',df.groupby('country').mean())

enter image description here

解决方法

要将空值替换为列的平均值,您应该执行以下操作:

 df['transit_stations'] = df['transit_stations'].fillna(df2.groupby('country')['transit_stations'].transform('mean'))