如何在构面内的单行中获取不同元素中的数据

问题描述

我们在MarkLogic中具有以下数据

<article>
<data id=1>
      <author>
        <name>
            <fname>manish</fname>
            <sname>joisar</sname>
       </name>
      </author>
</data>
<data id=2>
      <author>
        <name>
            <fname>Rakesh</fname>
            <sname>Malhotra</sname>
       </name>
      </author>
      <editor>
        <name>
            <fname>manish</fname>
            <sname>joisar</sname>
       </name>
      </editor>
</data>
<data id=3>
      <author>
        <name>
            <fname>manish</fname>
            <sname>joisar</sname>
       </name>
      </author>
      <editor>
        <name>
            <fname>manish</fname>
            <sname>joisar</sname>
       </name>
      </editor>
</data>
</article>

现在我们实现了以下方面

<constraint name="AuFacet">
    <range collation="http://marklogic.com/collation/" type="xs:string" facet="{$IsFacet}">
           <element ns="" name="name"/>
           <facet-option>descending</facet-option>
           <facet-option>frequency-order</facet-option>
           <facet-option>limit=10</facet-option>
    </range>
</constraint>

输出如下

{
      "name": "authors","type": "xs:string","Values": [
             {
               "value": "manish joisar","count": "2"
              },{
               "value": "manish joisar","count": "2"
             },{
               "value": "Rakesh Malhotra","count": "1"
            },]
}

我想要实现数据如下

{
      "name": "authors","Values": [
            {
               "value": "manish joisar","count": "3"
            }
            {
               "value": "Rakesh Mahotra",]
}

我不想进行后期处理。因为我只在寻找元素名称,所以我应该得到作者/编辑者之间匹配作者的组合计数。 截至目前,当在两个文档中都找到名称并在作者计数中添加该名称时,它正在计算一个文档,但是当个人是编辑者时,它将创建一个具有相同名称的单独列表。

编辑:我更改了数据结构,我们发现问题仅在于父元素包含子元素并且在父元素上实现了构面。

解决方法

在具有子结构的元素上放置范围索引会从元素的全部内容中创建值,如下所述:

https://docs.marklogic.com/guide/admin/range_index#id_93351

输出具有重复条目的事实表明,索引值在某种程度上是不一致的-可能是在Search API报表中已规范化但在索引中未标准化的空白字符中。

查看报告前的值的一种方法是在QueryConsole中使用等效查询调用cts.countAggregate()

https://docs.marklogic.com/cts.countAggregate

如果问题是空格或其他一些不一致的地方,一种可能的解决方案是将名称以一致的方式串联为属性中的单个原子值,并在该属性上放置范围索引。

另一种解决方案可能是不包含根的字段范围索引:

https://docs.marklogic.com/guide/admin/fields#id_65763

另一种替代方法是创建一个TDE,该TDE构造fname和sname的单独列(或具有fname和sname的规范化和串联的单个列)以及具有计数总和的列上的组。


对原始帖子的回复

通过添加以下内容,将查询选项配置为对项目(aka值)频率而不是片段(aka文档)频率进行计数是否有效?

<facet-option>item-frequency</facet-option>

有关更多详细信息,请参见

希望有帮助,

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...