如何对数据框中的值进行分组和求和?

问题描述

我有这个数据框(请参考下图)

| State        | County        |  Homicides
|--------------|---------------|-----------
|   Ags        |  Calvillo     |    4
|  Mexico City |  Alvaro O     |    2
|  Mexico City | Alvaro O      |    3
|  Mexico City |  Miguel H     |    2
|   Gto        |   Leon        |    1
|   Gto        |   Leon        |    1

我想做的是按县分组,并对凶杀案的价值求和。例如

| State        | County        |  Homicides
|--------------|---------------|-----------
|   Ags        |  Calvillo     |    4
|  Mexico City |  Alvaro O     |    5
| Mexico City  |  Miguel H     |    2
|   Gto        |   Leon        |    2

如您所见,我总结了同一个县名的凶杀案的价值

这是我的尝试

df1 >> group_by("County") >> summarize(County = X.County)

但是我没有做我想做的,请有人指导我这个问题。

谢谢

解决方法

在您的帮助下,这是我最后解决这一问题的代码行

df1 = df1.groupby(['State',"County"]).agg('sum')
df1 =df1.reset_index()
df1   

这是我的结果

| State        | County        |  Homicides
|--------------|---------------|-----------
|   Ags        |  Calvillo     |    4
|  Mexico City |  Alvaro O     |    5
| Mexico City  |  Miguel H     |    2
|   Gto        |   Leon        |    2