如何提高Neo4j关系创建查询的性能

问题描述

我正在处理一个相对较小的数据集,我使用Python脚本收集了该数据集,然后将其写入Neo4j数据库以进行快速访问。大约有20000个节点,这些节点之间大约有500万个关系。收集Python中的数据并在几分钟之内放入字典中,然后我遍历整个字典一次以插入所有节点,再一次插入所有关系。这两个动作都包含一个交易。

正如我提到的,收集数据需要几分钟,编写节点也需要几分钟。但是,创建这些关系要花很多时间(我上次检查15个小时)。我想知道如何提高这些查询性能,也许有一些明显的问题我正在忽略,或者也许有些我不熟悉的“交易技巧”。

有问题的密码查询如下:

CREATE(node: Model { name: 'example',path: 'example'})
MATCH (parent:Model {name: '',path: ''}),(child1:Model {name: '',(child2:Model {name: '',(child3:Model {name: '',path: ''})
MERGE (child1)-[r1:DEPENDS_ON]->(parent),MERGE (child2)-[r2:DEPENDS_ON]->(parent),MERGE (child3)-[r3:DEPENDS_ON]->(parent)

编辑1 因此,仅是进行更新,问题仍然存在,我觉得我应该提供一些其他信息。

  1. 名称和路径上有一个复合索引,这两个字段在一起是唯一的
  2. 据我所知,在我的查询中,每个字段仅被发现一次(因此没有基数问题)

编辑2 我已经执行并测试了一个查询,它由大约70个孩子与一个单亲建立关系(大约71个匹配查询)。通过Python脚本执行此查询所产生的总运行时间为 12秒,而在neo4j桌面上,该运行时间仅需 3毫秒

如果有人有任何改进建议,将非常欢迎。我唯一能想到的就是创建某种唯一密钥,在其上添加索引,并仅通过一个字段来查找模型。但是话又说回来,这真的会带来多大的改变?谢谢大家。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)