文档至少包含一个巨大术语-Solr

问题描述

我正在使用solr库来索引我的文档。它按预期工作,但有时我遇到错误。您能帮忙吗?

文档至少在field =“ FileContent_en ***”(其UTF8编码长于最大长度32766的长度)中包含一个巨大的术语,所有这些术语均被跳过。请更正分析仪以免产生此类条款。第一个庞大术语的前缀是:'[110、97、109、101、61、34、97、99、113、117、105、115、105、116、105、111、110、115、116、111 ,114、101、34、62、101、106、122、107、118、118] ...',原始消息:字节的长度最多为32766;得到了422071。也许文档的索引字符串字段(solr.StrField)太大solr.StrField

提前谢谢

解决方法

将字段的字段类型从字符串更改为文本。

例如,您的字段定义应如下所示。

<field name="text" type="text_general" indexed="true" stored="true"/>

字符串(UTF-8编码的字符串或Unicode)。字符串适用于 小字段,不会以任何方式标记或分析。他们有个 硬限制略小于32K。