问题描述
我有这个数据框(请参考下图)
| State | County | Homicides
|--------------|---------------|-----------
| Ags | Calvillo | 4
| Mexico City | Alvaro O | 2
| Mexico City | Alvaro O | 3
| Mexico City | Miguel H | 2
| Gto | Leon | 1
| Gto | Leon | 1
我想做的是按县分组,并对凶杀案的价值求和。例如
| State | County | Homicides
|--------------|---------------|-----------
| Ags | Calvillo | 4
| Mexico City | Alvaro O | 5
| Mexico City | Miguel H | 2
| Gto | Leon | 2
如您所见,我总结了同一个县名的凶杀案的价值
这是我的尝试
df1 >> group_by("County") >> summarize(County = X.County)
但是我没有做我想做的,请有人指导我这个问题。
谢谢
解决方法
在您的帮助下,这是我最后解决这一问题的代码行
df1 = df1.groupby(['State',"County"]).agg('sum')
df1 =df1.reset_index()
df1
这是我的结果
| State | County | Homicides
|--------------|---------------|-----------
| Ags | Calvillo | 4
| Mexico City | Alvaro O | 5
| Mexico City | Miguel H | 2
| Gto | Leon | 2