问题描述
通过使用 apply
df.groupby(['col1', 'col2'])["col3", "col4"].apply(lambda x : x.astype(int).sum())
Out[1257]:
col3 col4
col1 col2
a c 2 4
d 1 2
b d 1 2
e 2 4
如果你想 agg
df.groupby(['col1', 'col2']).agg({'col3':'sum','col4':'sum'})
解决方法
这应该很容易,但是以某种方式我找不到有效的解决方案。
我有一个熊猫数据框,看起来像这样:
index col1 col2 col3 col4 col5
0 a c 1 2 f
1 a c 1 2 f
2 a d 1 2 f
3 b d 1 2 g
4 b e 1 2 g
5 b e 1 2 g
我想按col1和col2分组并获得sum()
col3和col4。 Col5
由于无法汇总数据,因此可以删除。
这是输出的样子。我很感兴趣,同时具有col3
和col4
中产生的数据帧。是否col1
和col2
是否属于索引并不重要。
index col1 col2 col3 col4
0 a c 2 4
1 a d 1 2
2 b d 1 2
3 b e 2 4
这是我尝试过的:
df_new = df.groupby(['col1','col2'])["col3","col4"].sum()
但是,这只会返回的汇总结果col4
。
我在这里迷路了。我发现的每个示例仅汇总一列,显然不会发生此问题。