我迷失在Pandas doc中,试图找出一种方法,通过列总和的值将DataFrame分组.
例如,假设我有以下数据:
In [2]: dat = {'a':[1,0,0], 'b':[0,1,0], 'c':[1,0,0], 'd':[2,3,4]}
In [3]: df = pd.DataFrame(dat)
In [4]: df
Out[4]:
a b c d
0 1 0 1 2
1 0 1 0 3
2 0 0 0 4
我希望将a,b和c列分组,因为它们的总和等于1.结果DataFrame的列标签等于它总和的列的总和.像这样 :
1 9
0 2 2
1 1 3
2 0 4
有什么想法让我朝着好的方向前进吗?提前致谢 !
解决方法:
干得好:
In [57]: df.groupby(df.sum(), axis=1).sum()
Out[57]:
1 9
0 2 2
1 1 3
2 0 4
[3 rows x 2 columns]
df.sum()是你的石斑鱼.它在0轴(索引)上求和,给出两组:1(列a,b和c)和9(列d).您想要对列(轴= 1)进行分组,并获取每个组的总和.