如何在 Lucene 搜索语法中指定查询参数?

问题描述

我想向这个 https://musicbrainz.org/doc/MusicBrainz_API/Search 音乐 API 发出一个 get 请求。我想让它搜索专辑名称和发行格式。发行格式应该是黑胶唱片。您可以在请求的查询部分中搜索这些内容。如果我不指定任何格式,它就可以正常工作,但是当我指定一种格式时,它不会注册并且仍然显示其他发行格式,例如 CD 和数字。这是我用来执行请求的网址:https://musicbrainz.org/ws/2/release?query=depeche%20mode%20music%20for%20the%20massesANDformat%3AVinyl&fmt=json&limit=10 有人知道我必须如何更改我的 URL 以便它只显示黑胶唱片格式吗?

解决方法

看起来好像 Format 字段基于预定义值的受限列表 - 如 release format 列表页面所示。​​

因此,Lucene 索引可能已将此字段定义为 StringField 而不是 TextField

StringField 定义为:

已索引但未标记的字段:整个字符串值被索引为单个标记。

这意味着您无法搜索 vinyl。您需要使用确切的值,它可以是以下之一:

7" Vinyl
10" Vinyl
12" Vinyl

因此,为了解决这个问题,您可以按如下方式构建 Lucene 查询的那部分:

AND (format:"7\" vinyl" OR format:"10\" vinyl" format:"12\" vinyl")

文本值用 " 括起来,以确保整个术语在查询中被视为单个标记(与索引中的单个标记完全匹配)。

反斜杠用于转义文本中的 "

因此整个 Lucene 查询变成了这样:

title:"music for the masses" AND artist:"depeche mode" AND (format:"7\" vinyl" OR format:"10\" vinyl" OR format:"12\" vinyl")

当添加到 URL 时,它变成这样:

https://musicbrainz.org/ws/2/release?query=title:"music for the masses" AND artist:"depeche mode" AND (format:"7\" vinyl" OR format:"10\" vinyl" OR format:"12\" vinyl")&fmt=json

我将上述内容粘贴到浏览器查询栏中,在 JSON 响应中返回了 8 个发布对象。

当 URL 是 URL 编码时,它的结尾如下:

https://musicbrainz.org/ws/2/release?query=title:%22music%20for%20the%20masses%22%20AND%20artist:%22depeche%20mode%22%20AND%20(format:%227\%22%20vinyl%22%20OR%20format:%2210\%22%20vinyl%22%20OR%20format:%2212\%22%20vinyl%22)&fmt=json

我在开头提到因此可能格式字段(可能还有其他几个)被索引为字符串字段。我不知道这是事实 - 但这是我可以解释为什么我的查询有效而你的无效的唯一方法。所以我认为这是一个合理的假设 - 但我可能是错的。