问题描述
我有两个数据框,其中一个包含历史值,另一个包含新值。两个值之间可能有重叠,但都用时间戳索引。
如何将两个数据帧合并为一个,而不会有两次相同的值(相同的值具有完全相同的时间戳和值)。
非常感谢您的回答。
样本 DF1
|2011-05-09 15:00:00|5.395|
|2011-05-09 16:00:00|7.654|
|2011-05-09 17:00:00|8.395|
|2011-05-09 18:00:00|9.999|
样本 DF2
|2011-05-09 17:00:00|8.395|
|2011-05-09 18:00:00|9.999|
|2011-06-09 06:00:00|7.455|
|2011-06-09 07:00:00|7.422|
期望的输出
|2011-05-09 15:00:00|5.395|
|2011-05-09 16:00:00|7.654|
|2011-05-09 17:00:00|8.395|
|2011-05-09 18:00:00|9.999|
|2011-06-09 06:00:00|7.455|
|2011-06-09 07:00:00|7.422|
解决方法
可能最简单的方法是连接和重复数据删除:
pd.concat([DF1,DF2]).drop_duplicates()
假设 import pandas as pd