GeoSparql 函数在 RDF4J 的存储库中未按预期工作

问题描述

我和同事正在使用 RDF 数据集和 RDF4J 的内存存储库,我们正在尝试在使用 WKT 格式的几何数据的同时执行 GeoSparql 查询,如下所示:

@prefix geo: <http://www.opengis.net/ont/geosparql#> .
@prefix sf: <http://www.opengis.net/ont/sf> .
@prefix ex: <http://example.org/> .
@prefix geof: <http://www.opengis.net/def/function/geosparql/>.

ex:eiffelTower a ex:Landmark ;
        geo:hasGeometry ex:coordinates-et.
ex:coordinates-et a sf:Point;
        geo:asWKT "POINT(2.2945 48.8584)"^^geo:wktLiteral .

ex:towerBridge a ex:Landmark ;
          geo:hasGeometry ex:coordinates-tb.
ex:coordinates-tb a sf:Point;
        geo:asWKT "POINT(-0.0754 51.5055)"^^geo:wktLiteral .

场景 1: 到目前为止,我们成功地使用了 geof:distance 函数,例如查询及其结果如下。目的是计算两个地标坐标之间的距离。

SELECT *
WHERE {
  ?lmA a ex:Landmark ;
       geo:hasGeometry [ geo:asWKT ?coord1 ].

  ?lmB a ex:Landmark ;
       geo:hasGeometry [ geo:asWKT ?coord2 ].

  BIND((geof:distance(?coord1,?coord2,uom:metre)/1000) as ?dist) .
  FILTER (str(?lmA) < str(?lmB))
}

场景 1 的结果:

lmA => ex:eiffelTower
coord1 => "POINT(2.2945 48.8584)"
lmB =>  ex:towerBridge
coord2 => "POINT(-0.0754 51.5055)"
dist => "339.2412973915987"

场景 2: 当我们尝试使用其他功能时,例如geof:sfWithin,geof:sfContains,我们遇到了一些奇怪的行为。带有 geof:sfWithin 示例的查询及其结果如下所示。目的是获取位于给定多边形内的所有点。

SELECT *
WHERE {
  ?lmA a ex:Landmark ;
       geo:hasGeometry ?Geom.

  ?Geom geo:asWKT ?WKT.

  FILTER(geof:sfWithin(?WKT,'''
        <http://www.opengis.net/def/crs/OGC/1.3/CRS84>
            polygon ((80.0 80.0,-80.0 80.0,-80.0 -80.0,80.0 -80.0,80.0 80.0))
        '''^^geo:wktLiteral))
}

结果:-空表-

我们在查询中做错了什么吗? 我们的依赖:

  • rdf4j-storage 3.6.0
  • rdf4j-queryalgebra-geosparql 3.6.1

解决方法

我认为问题在于多边形 wkt 文字的语法。你有:

<http://www.opengis.net/def/crs/OGC/1.3/CRS84>
Polygon ((80.0 80.0,-80.0 80.0,-80.0 -80.0,80.0 -80.0,80.0 80.0))

我不确定第一行的 URI 来自哪里(我不是真正的 GeoSPARQL 专家),但这对我来说看起来不像是一个合适的 WKT 文字。我尝试了您的查询

Polygon ((80.0 80.0,80.0 80.0))

相反,得到了以下两个结果:

lmA=http://example.org/eiffelTower
WKT="POINT(2.2945 48.8584)"^^<http://www.opengis.net/ont/geosparql#wktLiteral>
Geom=http://example.org/coordinates-et

lmA=http://example.org/towerBridge
WKT="POINT(-0.0754 51.5055)"^^<http://www.opengis.net/ont/geosparql#wktLiteral>
Geom=http://example.org/coordinates-tb

诚然,查询以静默方式失败而不是产生一些“无法处理 WKT 文字”错误或警告令人困惑。

更新:

再进一步看(另见评论),这实际上是 RDF4J 中的一个错误。由于 GeoSPARQL spec 中的第 8.5 节表明参考系统的前缀 URI 不是 WKT 规范本身的一部分,而是对 WKT 文字定义的特定于 GeoSPARQL 的补充。因此,RDF4J 需要在将其交给底层 WKTReader 之前进行预处理。创建为 https://github.com/eclipse/rdf4j/issues/2935 的错误票证。

作为一种解决方法,您仍然可以删除 URI,因为 CRS84 实际上是默认的参考系统。