python – 如何一次比较四列pandas数据帧?

我有一个数据帧.

数据帧:

   Symbol1   BB Symbol2 CC 
0         ABC    1  ABC       1
1         PQR    1  PQR       1
2         CPC    2  CPC       0
3         CPC    2  CPC       1
4         CPC    2  CPC       2

我想将Symbol1与Symbol2和BB与CC进行比较,如果它们相同,那么我希望只有其他行必须从数据帧中删除.

预期结果 :

Symbol1   BB Symbol2 CC 
0         ABC    1  ABC       1
1         PQR    1  PQR       1
2         CPC    2  CPC       2

如果比较两行,那么我正在使用:

df = df[df['BB'] == '2'].copy()

它会工作正常.

df = df[df['BB'] == df['offset'] and df['Symbol1'] == df['Symbol2']].copy()

它给了我错误.

错误

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

我如何比较并得到预期的结果?

解决方法:

您可以使用boolean indexing并与&进行比较而是and

print ((df.Symbol1 == df.Symbol2) & (df.BB == df.CC))
0     True
1     True
2    False
3    False
4     True
dtype: bool

print (df[(df.Symbol1 == df.Symbol2) & (df.BB == df.CC)])
  Symbol1  BB Symbol2  CC
0     ABC   1     ABC   1
1     PQR   1     PQR   1
4     CPC   2     CPC   2

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...