数据帧:
Symbol1 BB Symbol2 CC
0 ABC 1 ABC 1
1 PQR 1 PQR 1
2 CPC 2 CPC 0
3 CPC 2 CPC 1
4 CPC 2 CPC 2
我想将Symbol1与Symbol2和BB与CC进行比较,如果它们相同,那么我希望只有其他行必须从数据帧中删除.
预期结果 :
Symbol1 BB Symbol2 CC
0 ABC 1 ABC 1
1 PQR 1 PQR 1
2 CPC 2 CPC 2
如果比较两行,那么我正在使用:
df = df[df['BB'] == '2'].copy()
它会工作正常.
df = df[df['BB'] == df['offset'] and df['Symbol1'] == df['Symbol2']].copy()
它给了我错误.
错误:
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
我如何比较并得到预期的结果?
解决方法:
您可以使用boolean indexing
并与&进行比较而是and
:
print ((df.Symbol1 == df.Symbol2) & (df.BB == df.CC))
0 True
1 True
2 False
3 False
4 True
dtype: bool
print (df[(df.Symbol1 == df.Symbol2) & (df.BB == df.CC)])
Symbol1 BB Symbol2 CC
0 ABC 1 ABC 1
1 PQR 1 PQR 1
4 CPC 2 CPC 2