问题描述
我需要为具有传递关系的实体检索三元组,但我只想将传递链末端的实体作为主体。
以下示例:
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
<:a0> rdfs:label "a0" ;
<:has_parent> <:a1> .
<:b0> rdfs:label "b0" ;
<:has_parent> <:b1> .
<:a1> rdfs:label "a1" ;
<:has_parent> <:a2> .
<:a2> rdfs:label "a2" ;
<:has_parent> <:a3> .
<:a3> rdfs:label "a3" .
<:b1> rdfs:label "b1" ;
<:has_parent> <:b2> .
<:b2> rdfs:label "b2" .
当我运行以下 SPARQL 查询时(使用 rdflib-5.0.0):
SELECT ?ancestor ?descendant
WHERE
{
?descendant <:has_parent>+ ?ancestor .
}
ORDER BY ?ancestor
我明白了:
:a1 is_ancestor_of :a0
:a2 is_ancestor_of :a0
:a2 is_ancestor_of :a1
:a3 is_ancestor_of :a2
:a3 is_ancestor_of :a0
:a3 is_ancestor_of :a1
:b1 is_ancestor_of :b0
:b2 is_ancestor_of :b1
:b2 is_ancestor_of :b0
但我想得到的是:
:a3 is_ancestor_of :a2
:a3 is_ancestor_of :a0
:a3 is_ancestor_of :a1
:b2 is_ancestor_of :b1
:b2 is_ancestor_of :b0
即,只有链的“最古老的祖先”作为主体,所有后代作为客体。换句话说,我不希望任何后代作为主题。
我知道我缺少一个 FILTER,或者一个 FILTER NOT EXISTS,或者一个额外的 SELECT-WHERE 但我所有的尝试目前都返回了空表(即我否定了所有选定的三元组)。
我发现的最接近的问题是 this one,但我无法正确实施自选答案或对问题的评论。
感谢您的帮助。谢谢。
解决方法
对我来说,首先尝试用文字表达查询总是有帮助的。你想说的是:“只给我那些自己没有任何祖先的祖先”。
要在 SPARQL 中对此进行表述,请使用 FILTER NOT EXISTS
约束,如下所示:
FILTER NOT EXISTS { ?ancestor <:has_parent> [] }
这里的 []
位是一个匿名变量,基本上你是说“如果一个祖先有任何父级,它们不应该被返回”。