光学 API 与 CTS 查询性能

问题描述

我使用以下两个查询(Optic and CTS)获取路径范围索引 /tXML/Item/PutawayCategory 的值。

问题 1: - 大约需要。 4 milliseconds 执行并返回 17 个不同的值。我尝试多次执行相同的查询

xquery version "1.0-ml";
import module namespace op="http://marklogic.com/optic"  at "/MarkLogic/optic.xqy";

op:from-lexicons(map:entry("PutawayCategory",cts:path-reference("/tXML/Item/PutawayCategory")))
=> op:where-distinct()
=> op:result()

问题 2: - 大约用了。 0.30 milliseconds 获得与 Query 1

相同的结果
xquery version "1.0-ml";

cts:values(cts:path-reference("/tXML/Item/PutawayCategory"))

我不明白为什么 Optic Querycts 查询花费更多时间来执行。

请帮助我理解这一点。

解决方法

将您的光学查询更改为使用 op:group-by("PutawayCategory") 而不是 op:where-distinct(),它的性能应该会好得多。

xquery version "1.0-ml";
import module namespace op="http://marklogic.com/optic"  at "/MarkLogic/optic.xqy";

op:from-lexicons(map:entry("PutawayCategory",cts:path-reference("/tXML/Item/PutawayCategory")))
=> op:group-by("PutawayCategory")
=> op:result()

op:from-lexicon

Optic 根据同一个文档中词典值的共现发出行,类似于 cts:value-tuples

这意味着 op:from-lexicons() 正在返回存在于多个文档中的值的每个实例,并且可以多次返回,而不是一个不同的列表,然后 op:where-distinct() 进行过滤和去重,这会消耗 CPU 和时间。值集越大,op:where-distinct() 需要做的工作(和时间)就越多。

cts:values() 直接从路径范围索引词典中提取不同的值列表,因此要做的工作更少。

MarkLogic 可能有一种方法可以使用 op:where-distinct() 优化 Optic 查询。如果您有权访问 MarkLogic 支持,如果您创建了一个询问它的支持案例,将会很有帮助。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...