问题描述
我有一个.rdf文件(压缩后超过2gb),显然中间有一些重复的IRI,也许还有其他问题。
导入期间工作台中的以下错误:
RDF Parse Error: ID '_D5C2483C53D3F747_up.name_uORF' has already been defined [line 6907110,column 53
是否存在用于在导入之前使用某些定义的行为(例如“只是跳过它”等)对这些大文件进行预处理的工具?
解决方法
当您通过GraphDB Workbench导入文件时,会有一个“高级设置”折叠菜单。简而言之,它具有几个可以启用或禁用的有关验证的选项,包括“应在错误时停止”。如果您禁用该选项,我不确定是否会继续发生此特定错误(解析器根本无法从中恢复某些语法错误),但是值得一试。