问题描述
我的数据基本上是 RDF 中的事件日志。我有案例和事件,后者属于前者。事件有时间戳和触发它们的参与者。
对于每种情况,我现在都需要最新的事件、发生的时间以及触发它的人。
这大致是我当前的查询:
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-Syntax-ns#>
PREFIX ex: <http://example.org/>
SELECT ?case ?event ?timestamp ?actor
WHERE {
?case rdf:type ex:Case ;
ex:hasEvent ?event .
?event ex:timestamp ?timestamp ;
ex:hasActor ?actor .
}
ORDER BY ASC(?case) DESC(?timestamp)
产生如下结果:
| case | event | timestamp | actor |
=================================================================================
| ex:case1 | ex:event1 | "2020-01-01T02:00:00Z"^^xsd:dateTimeStamp | ex:Alice |
| ex:case1 | ex:event2 | "2020-01-01T01:00:00Z"^^xsd:dateTimeStamp | ex:Bob |
| ex:case2 | ex:event3 | "2020-01-01T03:00:00Z"^^xsd:dateTimeStamp | ex:Charlie |
| ex:case2 | ex:event4 | "2020-01-01T02:00:00Z"^^xsd:dateTimeStamp | ex:Dan |
但是我只想获取第一行和第三行,因为它们对应于这种情况下的最新事件。像这样:
| case | event | timestamp | actor |
=================================================================================
| ex:case1 | ex:event1 | "2020-01-01T02:00:00Z"^^xsd:dateTimeStamp | ex:Alice |
| ex:case2 | ex:event3 | "2020-01-01T03:00:00Z"^^xsd:dateTimeStamp | ex:Charlie |
为了实现这一点,我尝试将 SELECT ?case ?event (MAX(?timestamp) AS ?latest) ?actor
与 GROUP BY ?case
结合使用,但是 SPARQL 抱怨我还需要按 ?event 和 ?actor 进行分组,这当然不是我想要的。>
我知道 Postgresql 有 disTINCT ON
可以解决我的问题,但我需要在 SPARQL 中进行。有什么好的方法可以实现这一目标吗?
解决方法
基于@UninformedUser 评论的自我回答:
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX ex: <http://example.org/>
SELECT ?case ?event (?latest as ?timestamp) ?actor WHERE {
?case ex:hasEvent ?event .
?event ex:timestamp ?latest ;
ex:hasActor?actor .
{ SELECT ?case (MAX(?timestamp) AS ?latest) {
?case rdf:type ex:case ;
ex:hasEvent ?event .
?event ex:timestamp ?timestamp }
group by ?case }
}