问题描述
我有两个数据框如下:
df_customers.head()
| | customer_id | zip_code_prefix | coords |
|----+----------------------------------+-------------------+-------------------------------------------|
| 0 | 06b8999e2fba1a1fbc88172c00ba8bc7 | 14409 | (-20.509897499999997,-47.3978655) |
| 1 | 18955e83d337fd6b2def6b18a428ac77 | 9790 | (-23.72685273154166,-46.54574582941039) |
| 2 | 4e7b3e00288586ebd08712fdd0374a03 | 1151 | (-23.527788191788307,-46.66030962184773) |
| 3 | b2b6027bc5c5109e529d4dc6358b12c3 | 8775 | (-23.49693002789165,-46.185351975305366) |
| 4 | 4f2d8ab171c80ec8364f7c12e35b23ad | 13056 | (-22.98722237101393,-47.151072819246686) |
+----+----------------------------------+-------------------+-------------------------------------------+
df_sellers.head()
| | seller_id | zip_code_prefix | coords |
|----+----------------------------------+-------------------+--------------------------------------------|
| 0 | 3442f8959a84dea7ee197c632cb2df15 | 13023 | (-22.898536428530225,-47.063125168330544) |
| 1 | d1b65fc7debc3361ea86b5f14c68d2e2 | 13844 | (-22.382941116125448,-46.94664125419024) |
| 2 | ce3ad9de960102d0677a81f5d0bb7b2d | 20031 | (-22.91064096725142,-43.17650983181368) |
| 3 | c0f3eea2e14555b6faeea3dd58c1b1c3 | 4195 | (-23.657250175378767,-46.61075944811122) |
| 4 | 51a04a8a6bdcb23deccc82b0b80742cf | 12914 | (-22.971647510075705,-46.53361841170685) |
+----+----------------------------------+-------------------+--------------------------------------------+
我想用 haversine 库计算这些坐标列之间的差异,而无需合并这些数据框(它们之间存在多对多关系)。。 >
所以我正在寻找的是一种在使用半正弦库计算 KM 中的坐标距离的同时,通过列 zip_code_prefix 动态合并两个数据帧的方法。
这可能吗?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)