pandas-数据框分组-如何获取多列总和

问题描述

通过使用 apply

df.groupby(['col1', 'col2'])["col3", "col4"].apply(lambda x : x.astype(int).sum())
Out[1257]: 
           col3  col4
col1 col2            
a    c        2     4
     d        1     2
b    d        1     2
     e        2     4

如果你想 agg

df.groupby(['col1', 'col2']).agg({'col3':'sum','col4':'sum'})

解决方法

这应该很容易，但是以某种方式我找不到有效的解决方案。

我有一个熊猫数据框，看起来像这样：

index col1   col2   col3   col4   col5
0     a      c      1      2      f 
1     a      c      1      2      f
2     a      d      1      2      f
3     b      d      1      2      g
4     b      e      1      2      g
5     b      e      1      2      g

我想按col1和col2分组并获得sum()col3和col4。 Col5由于无法汇总数据，因此可以删除。

这是输出的样子。我很感兴趣，同时具有col3和col4中产生的数据帧。是否col1和col2是否属于索引并不重要。

index col1   col2   col3   col4   
0     a      c      2      4          
1     a      d      1      2      
2     b      d      1      2      
3     b      e      2      4

这是我尝试过的：

df_new = df.groupby(['col1','col2'])["col3","col4"].sum()

但是，这只会返回的汇总结果col4。

我在这里迷路了。我发现的每个示例仅汇总一列，显然不会发生此问题。

python