问题描述
我和同事正在使用 RDF 数据集和 RDF4J 的内存存储库,我们正在尝试在使用 WKT 格式的几何数据的同时执行 GeoSparql 查询,如下所示:
@prefix geo: <http://www.opengis.net/ont/geosparql#> .
@prefix sf: <http://www.opengis.net/ont/sf> .
@prefix ex: <http://example.org/> .
@prefix geof: <http://www.opengis.net/def/function/geosparql/>.
ex:eiffelTower a ex:Landmark ;
geo:hasGeometry ex:coordinates-et.
ex:coordinates-et a sf:Point;
geo:asWKT "POINT(2.2945 48.8584)"^^geo:wktLiteral .
ex:towerBridge a ex:Landmark ;
geo:hasGeometry ex:coordinates-tb.
ex:coordinates-tb a sf:Point;
geo:asWKT "POINT(-0.0754 51.5055)"^^geo:wktLiteral .
场景 1:
到目前为止,我们成功地使用了 geof:distance
函数,例如查询及其结果如下。目的是计算两个地标坐标之间的距离。
SELECT *
WHERE {
?lmA a ex:Landmark ;
geo:hasGeometry [ geo:asWKT ?coord1 ].
?lmB a ex:Landmark ;
geo:hasGeometry [ geo:asWKT ?coord2 ].
BIND((geof:distance(?coord1,?coord2,uom:metre)/1000) as ?dist) .
FILTER (str(?lmA) < str(?lmB))
}
场景 1 的结果:
lmA => ex:eiffelTower
coord1 => "POINT(2.2945 48.8584)"
lmB => ex:towerBridge
coord2 => "POINT(-0.0754 51.5055)"
dist => "339.2412973915987"
场景 2:
当我们尝试使用其他功能时,例如geof:sfWithin
,geof:sfContains
,我们遇到了一些奇怪的行为。带有 geof:sfWithin
示例的查询及其结果如下所示。目的是获取位于给定多边形内的所有点。
SELECT *
WHERE {
?lmA a ex:Landmark ;
geo:hasGeometry ?Geom.
?Geom geo:asWKT ?WKT.
FILTER(geof:sfWithin(?WKT,'''
<http://www.opengis.net/def/crs/OGC/1.3/CRS84>
polygon ((80.0 80.0,-80.0 80.0,-80.0 -80.0,80.0 -80.0,80.0 80.0))
'''^^geo:wktLiteral))
}
结果:-空表-
我们在查询中做错了什么吗? 我们的依赖:
rdf4j-storage 3.6.0
rdf4j-queryalgebra-geosparql 3.6.1
解决方法
我认为问题在于多边形 wkt 文字的语法。你有:
<http://www.opengis.net/def/crs/OGC/1.3/CRS84>
Polygon ((80.0 80.0,-80.0 80.0,-80.0 -80.0,80.0 -80.0,80.0 80.0))
我不确定第一行的 URI 来自哪里(我不是真正的 GeoSPARQL 专家),但这对我来说看起来不像是一个合适的 WKT 文字。我尝试了您的查询
Polygon ((80.0 80.0,80.0 80.0))
相反,得到了以下两个结果:
lmA=http://example.org/eiffelTower
WKT="POINT(2.2945 48.8584)"^^<http://www.opengis.net/ont/geosparql#wktLiteral>
Geom=http://example.org/coordinates-et
lmA=http://example.org/towerBridge
WKT="POINT(-0.0754 51.5055)"^^<http://www.opengis.net/ont/geosparql#wktLiteral>
Geom=http://example.org/coordinates-tb
诚然,查询以静默方式失败而不是产生一些“无法处理 WKT 文字”错误或警告令人困惑。
更新:
再进一步看(另见评论),这实际上是 RDF4J 中的一个错误。由于 GeoSPARQL spec 中的第 8.5 节表明参考系统的前缀 URI 不是 WKT 规范本身的一部分,而是对 WKT 文字定义的特定于 GeoSPARQL 的补充。因此,RDF4J 需要在将其交给底层 WKTReader 之前进行预处理。创建为 https://github.com/eclipse/rdf4j/issues/2935 的错误票证。
作为一种解决方法,您仍然可以删除 URI,因为 CRS84 实际上是默认的参考系统。