问题描述
我正在尝试使用 Python 中的 RDFLib 将 csv 文件转换为 RDF N-triples。似乎主题必须是 IRI/空白节点,而且谓词必须是 IRI。例如,
<http://example.org/show/218> <http://www.w3.org/2000/01/rdf-schema#label> "That Seventies Show" .
我在 csv 文件中只有静态字符串文字数据,我没有任何 IRI。例如,
subject: "Name" predicate: "Id" Object="Location"
。
更新csv格式如下,
姓名 | ID | 位置 |
---|---|---|
乔恩 | 34 | 德克萨斯 |
迈克尔 | 42 | 加利福尼亚 |
那么,是否可以只对主语和谓词使用字符串字面量?或者如何为我的数据构建 IRI?
解决方法
当您声明必须将 URI 作为主题时,您是对的。这是允许您将数据链接在一起的技术的主要功能。
您还需要有一个用于谓词的命名空间。这是您无法绕过的技术的另一个功能。
如果你想要名字作为主题,我会做类似的事情......
subject = rdflib.URIRef('http://ex.com/name')
predicate = rdflib.URIRef('http://ex.com/hasID')
object = rdflib.Literal(id)
graph.add((subject,predicate,object))
其中 name
和 id
来自您的 CSV。
您可能希望向节点添加 rdfs:label
以进行解析/可读性。我认为更好的选择是创建一个新关系 ex:hasName
并以这种方式将名称与节点相关联。
tldr
使用现有的 URI 方案(file://、http://、uuid: 等)并在最有意义的末尾附加一些内容。