如何查找具有相同名称的列的最大值

问题描述

对此数据帧存在一些麻烦,必须将具有相同名称的列的值减少为至少一个以“ 1”为“ 1”的值。

+---+---+---+---+---+---+---+---+---+
| a | a | a | b | c | c | c | d | d |
+---+---+---+---+---+---+---+---+---+
| 1 | 0 | 0 | 1 | 1 | 0 | 0 | 1 | 1 |
| 0 | 0 | 0 | 1 | 0 | 1 | 1 | 1 | 0 |
| 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 |
+---+---+---+---+---+---+---+---+---+

对于大型数据集的每一列使用“或”条件进行类似的操作可能是一项耗时的任务,因此我很难弄清楚。我用max(axis = 1,level = 0)还是没办法。

我想要的输出

+---+---+---+---+
| a | b | c | d |
+---+---+---+---+
| 1 | 1 | 1 | 1 |
| 0 | 1 | 1 | 1 |
| 1 | 0 | 1 | 0 |
+---+---+---+---+

解决方法

使用max

进行检查
df = df.max(level=0,axis=1)