如何使用 Lat Long 数据查找重复项并使其成为大数据集中的唯一标识符

问题描述

我的数据集看起来像这样{**请注意下面是假设数据集}

目标:销售员工必须前往特定位置并验证以下提到的房屋/商店/建筑物和设备捕获

Sr.No. Store_Name 电话号码 Agent_id 区域 经纬度
1 ABC 商店 89099090 121 湾区 23.909090,89.878798
2 武汉口罩 45453434 122 圣达菲 24.452134,78.123243
3 推特咖啡馆 67556090 123 中东 11.889766,23.334483
4 abc 33445569 121 圣克鲁斯 23.345678,89.234213
5 银色健身房 11004110 234 Worli Sea Link 56.564311,78.909087
6 CK服装 00908876 223 第90街 34.445887,12.887654

事实: #1 查找重复项的唯一标识符 -- ** Check Sr.No 1 & 4 基本相同

在这个虚拟数据集中,所有的列都可以被操作,即对于同一个商店/房子/建筑物出口

a) 由于名称是为相同的房屋/商店名称手动输入的,因此可以更改并输入系统 - 多次访问可能发生 b) 也可以操作手机号码,同一个网点可以关联不同的号码

c) 也可以通过靠近或靠近建筑物来伪造带有代理捕获经纬度信息的设备

问题:

  1. 如何将经纬度数据作为唯一标识符牢记点 - c,上面用于在庞大的数据集中查找重复项。
  2. 部署 QR 也不是很有帮助,因为这也可以进行调整。
  3. 特此阻止员工的欺诈行为(同一个 emp 可以访问同一家商店/分店,或者不同的 emp 也可以再次访问同一家分店以增加访问次数

现在我只能想到 Lat-Long Column 来制作 UID 请随时提出建议是否可以制作其他任何东西

编辑:提前祝大家圣诞快乐,新年快乐

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)