python – 删除pandas时间序列数据帧中的重复项

我在数据框中有时间序列数据,如下所示:

Index Time Value_A Value_B
0     1    A       A
1     2    A       A
2     2    B       A
3     3    A       A
4     5    A       A

我想删除Value_A和Value_B列中的副本,以便仅在遇到不同的模式时才会删除重复项.此示例数据的结果应为:

Index Time Value_A Value_B
0     1    A       A
2     2    B       A
3     3    A       A

解决方法:

检测连续组的常用技巧是将某些内容与自身的移位版本进行比较.例如:

In [137]: cols = ["Value_A", "Value_B"]

In [138]: df[~(df[cols] == df[cols].shift()).all(axis=1)]
Out[138]: 
       Time Value_A Value_B
Index                      
0         1       A       A
2         2       B       A
3         3       A       A

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...