如何在不进行客户端筛选的情况下使用地理哈希查找x英里半径内的文档?

问题描述

因此,目前,我正在使用geohash进行基于位置的查询(遵循此stackoverflow帖子:Finding geohashes of certain length within radius from a point

public extension CLLocationCoordinate2D {

    func boundingBox(radius: CLLocationdistance) -> (max: CLLocationCoordinate2D,min: CLLocationCoordinate2D) {
        // 0.0000089982311916 ~= 1m
        let offset = 0.0000089982311916 * radius
        let latMax = self.latitude + offset
        let latMin = self.latitude - offset
        
        // 1 degree of longitude = 111km only at equator
        // (gradually shrinks to zero at the poles)
        // So need to take into account latitude too
        let lngOffset = offset * cos(self.latitude * .pi / 180.0)
        let lngMax = self.longitude + lngOffset
        let lngMin = self.longitude - lngOffset
        
        
        let max = CLLocationCoordinate2D(latitude: latMax,longitude: lngMax)
        let min = CLLocationCoordinate2D(latitude: latMin,longitude: lngMin)
        
        return (max,min)
    }
func isWithin(min: CLLocationCoordinate2D,max: CLLocationCoordinate2D) -> Bool {
        return
            self.latitude > min.latitude &&
                self.latitude < max.latitude &&
                self.longitude > min.longitude &&
                self.longitude < max.longitude
    }

}
func getGeohashPrefix(){
        let loc = CLLocationCoordinate2D(latitude: lat!,longitude: long!)
        MBR = loc.boundingBox(radius: 16093.4) //16093.4 meters = 10 miles
        //corners = [northWest,SouthWest,SouthEast,northEast] in lat n long
        let corners = [CLLocationCoordinate2D(latitude: MBR.0.latitude,longitude: MBR.1.longitude),MBR.1,CLLocationCoordinate2D(latitude: MBR.1.latitude,longitude: MBR.0.longitude),MBR.0]
        var geohashes_of_corners: [String] = []
        for corner in corners {
            geohashes_of_corners.append(corner.geohash(length: 12))
        }
        geohashes_prefix = geohashes_of_corners.longestCommonPrefix()

    }

var query: Query = db.collection("Users").whereField("geohash",isGreaterThanorEqualTo: geohashes_prefix).whereField("geohash",isLessthanorEqualTo: geohashes_prefix + "~").order(by: "geohash",descending: false)

       query.getDocuments { (querySnapshot,err) in
           if err != nil{
               print("error getting da documents")
           }else{
                if querySnapshot!.isEmpty{
                    return completion(arr_of_people)
                }
                for document in querySnapshot!.documents {
                    let d = document.data()
                    let isPersonWithin = CLLocationCoordinate2D(latitude: (d["loc"] as! GeoPoint).latitude,longitude: (d["loc"] as! GeoPoint).longitude).isWithin(min: self.MBR.1,max: self.MBR.0)
                  if !isPersonWithin{
                         continue
                 }
 
                    arr_of_people.append([d["firstName"] as! String,d["lastName"] as! String])
                   }

               return completion(arr_of_people)
           }
       }

如您所见,我正在查询具有特定前缀的文档,然后再次在客户端上过滤这些文档。这样安全吗?如果没有,解决方法是什么?使用云函数,其他算法(如果有,建议使用一种算法)或其他方法

解决方法

有关地理哈希的查询会返回一定范围的地理哈希内的点,这些点是(有点)矩形区域。

在中心点和距离上进行地理查询会返回圆形的点。

由于两个形状不同,因此您的代码使用客户端检查来截去圆外但矩形内的点。这是正常的步骤,当使用Geohash进行地理查询时,一个点周围的最大距离是


以下是地图上的示例:

enter image description here

绿色针脚在旧金山周围250公里的一圈中,这正是我所要求的。红色针脚不在该圆的范围内,但在一定范围的geohash范围内(此处为[["9q0","9qh"],["9nh","9n~"],["9r0","9rh"],["9ph","9p~"]]),需要进行查询,以确保所有点都在该范围内。

如前所述:这种所谓的过采样是使用地理哈希来执行点和距离查询所固有的。以我的经验,您最终会阅读2到8倍的文档。

有可能通过查询更多但更小的范围来减少误报的数量,但是我不知道有任何Firestore的地理图书馆这样做。

我将这笔额外费用映射为一种心理模型:在距某点一定距离内查找文档,比普通文档花费2倍至8倍。


将操作移至服务器上的Cloud Functions不会改变需要读取的文档数量,只是更改了读取位置。因此,您可以在服务器上执行该操作,以减少将文档从数据库传输到客户端的带宽。但这不会影响需要阅读的文档数量。

如注释中所讨论:在服务器上执行查询确实允许您从数据中删除客户端访问,以便您可以确保应用程序代码将永远不会看到不在其中的文档要求的范围。因此,如果您担心文档的访问,那么在受信任的环境(例如您控制的服务器或Cloud Functions)中执行查询是一个不错的选择。


为了不支付额外的文档阅读费用,请考虑根据返回的结果数(而不是必须考虑的结果数),找到一种以定价模型本地支持地理查询的服务。这样的服务(很可能)仍然考虑太多点,但是如果定价模型与您想要的相匹配,那可能是值得的。