问题描述
我对使用groupby和agg和几个类别变量有疑问。
例如,请参见下文。
group_cols = ['Group1','Group2','Group3']
df = pd.DataFrame([['A','B','C',54.34],['A','D',61.34],['B','A',514.5],765.4],765.4]],columns= (group_cols+['Value']))
for col in group_cols:
df[col] = df[col].astype('category')
# Works as intended
df.groupby(group_cols,as_index=False).sum()
# Works as intended
df.groupby(['Group1'],as_index=False).agg({'Value':'sum'})
# Works as intended
df.groupby(group_cols,as_index=False,observed=True).agg({'Value':'sum'})
# Agg does not work with several
# groupby columns which are
# categorical dtypes
df.groupby(group_cols,as_index=False).agg({'Value':'sum'})
agg和groupby应该在groupby子句中使用多个类别变量吗?还是我做错了什么?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)