问题描述
如http://wiki.bitplan.com/index.php/Apache_Jena#Script_to_start_Fuseki_server中所述 我一直在避免Fuseki配置文件的复杂性,并针对我的用例从脚本启动服务器,在该用例中,我只需要一个数据集/端点。对于多个数据集/端点,我只使用了多个服务器。
描述如下:
以及类似问题:
一直令我感到恐惧,因为似乎有太多选择,而且没有简单的简单说法:请使用以下目录中的这些数据集,因为命令行版本可以处理一个数据集。
只要看看:
用户期望的地方:
java -jar fuseki-0.1.0-server.jar --update --loc=data /dataset
--loc=data2 /dataset2
可以看到不幸的是未满。相反:
当时是答案,现在已经过时了。
因此,很明显,有些人在使用Fusionki处理多个数据集。但是他们怎么做到的呢?
我知道如何通过命令行从三重文件加载TDB存储。我知道我可以使用WebGUI来设置数据集和加载数据,但这不适用于我的数百万个(部分为数十亿个)三重文件。
是一个(希望非常简单)的示例,该示例用于加载多个三重文件并使结果在同一funkki服务器上作为不同的数据集可用,并使SPARQL端点运行(部分只读)?
解决方法
https://jena.apache.org/documentation/fuseki2/fuseki-layout.html提示文件的布局。
我使用script to start fuseki检查了运行目录,就我而言,该目录位于:
apache-jena-fuseki-3.16.0/run
有两个子目录,它们最初是空的,并保持不变,因此,如果您从命令行运行,则为:
- 配置
- 数据库
通过通过webgui http:// localhost:3030添加数据集
在这种情况下具有数据集名称的目录:
databases/cr
和配置文件
configuration/cr.ttl
已创建。 对于较小的数据集,现在可以通过webgui添加数据。对于更大的数据集,必须在数据库目录中复制原始加载的tdb数据的副本或符号链接。
示例符号链接:
zeus:databases wf$ls -l
total 48
drwxr-xr-x 4 wf admin 136 Sep 14 07:43 cr
lrwxr-xr-x 1 wf admin 27 Sep 15 11:53 dblp -> /Volumes/Torterra/dblp/data
lrwxr-xr-x 1 wf admin 26 Sep 14 08:10 gnd -> /Volumes/Torterra/gnd/data
lrwxr-xr-x 1 wf admin 42 Sep 14 07:55 wikidata -> /Volumes/Torterra/wikidata2020-08-15/data/
通过不使用--loc重启服务器
nohup java -jar fuseki-server.jar&
好消息是,只要您没有任何特殊需要,就不必用这种方式来烦扰配置文件的详细信息。