问题描述
使用通过 SPARQL 端点访问的 RDF 数据库,生成新的 UUID IRI 并将它们用于新资源的最佳方法是什么?
以下是我尝试过的一些方法的概述。我分享这个是因为我希望找到这个问题的答案。我最喜欢的是最后一种方法,但我认为它仍有待讨论。
在客户端生成一个 UUID 并在更新请求中使用它
- 亲:快
- con:您无法确定 UUID 在数据库中是唯一的。不过发生碰撞的可能性很小。
在客户端生成一个 UUID 并检查 RDF 存储是否包含具有该 id 的三元组。迭代直到 UUID 是新的。
向 RDF 存储询问 UUID 并使用它
查询:SELECT (UUID() as ?id) WHERE{}
在进行大量更新之前向 RDF 存储询问 N >> 1 个 UUID
查询(返回 1000 个结果行):
SELECT (UUID() as ?id) WHERE {
VALUES ?index1 { 0 1 2 3 4 5 6 7 8 9 }
VALUES ?index2 { 0 1 2 3 4 5 6 7 8 9 }
VALUES ?index3 { 0 1 2 3 4 5 6 7 8 9 }
}
相关:
解决方法
根据AndyS的评论,我决定look that up again并调整我的期望:你必须在大约 85 年内每秒生成 10 亿个 UUID,才能达到 50% 的一次或多次碰撞概率.因此,变体 1 是最好的:
在客户端生成一个 UUID 并在更新请求中使用它。