关于solr schema.xml 和solrconfig.xml的解释

一、字段配置（schema）

schema.xml位于solr/conf/目录下，类似于数据表配置文件，

定义了加入索引的数据的数据类型，主要包括type、fields和其他的一些缺省设置。

1、先来看下type节点，这里面定义FieldType子节点，包括name,class,positionIncrementGap等一些参数。

name：就是这个FieldType的名称。
class：指向org.apache.solr.analysis包里面对应的class名称，用来定义这个类型的行为。

<schemaname="example"version="1.2">
<types>
<fieldTypename="string"class="solr.StrField"sortMissingLast="true"omitNorms="true"/>
<fieldTypename="boolean"class="solr.BoolField"sortMissingLast="true"omitNorms="true"/>
<fieldtypename="binary"class="solr.BinaryField"/>
<fieldTypename="int"class="solr.TrieIntField"precisionStep="0"omitNorms="true"
positionIncrementGap="0"/>
<fieldTypename="float"class="solr.TrieFloatField"precisionStep="0"omitNorms="true"
positionIncrementGap="0"/>
<fieldTypename="long"class="solr.TrieLongField"precisionStep="0"omitNorms="true"
positionIncrementGap="0"/>
<fieldTypename="double"class="solr.TrieDoubleField"precisionStep="0"omitNorms="true"
positionIncrementGap="0"/>
...
</types>
...
</schema>

必要的时候fieldType还需要自己定义这个类型的数据在建立索引和进行查询的时候要使用的分析器analyzer，包括分词和过滤，如下：

view plain print ?

<fieldTypename="text_ws"class="solr.TextField"positionIncrementGap="100">
<analyzer>
<tokenizerclass="solr.WhitespaceTokenizerFactory"/>
</analyzer>
</fieldType>
<fieldTypename="text"class="solr.TextField"positionIncrementGap="100">
<analyzertype="index">
<!--这个分词包是空格分词，在向索引库添加text类型的索引时，Solr会首先用空格进行分词
然后把分词结果依次使用指定的过滤器进行过滤，最后剩下的结果，才会加入到索引库中以备查询。
注意:Solr的analysis包并没有带支持中文的包，需要自己添加中文分词器，google下。
-->
<tokenizerclass="solr.WhitespaceTokenizerFactory"/>
<!--inthisexample,wewillonlyusesynonymsatquerytime
<filterclass="solr.SynonymFilterFactory"synonyms="index_synonyms.txt"
ignoreCase="true"expand="false"/>
-->
<!--Caseinsensitivestopwordremoval.
addenablePositionIncrements=trueinboththeindexandquery
analyzerstoleavea'gap'formoreaccuratephrasequeries.
-->
<filterclass="solr.StopFilterFactory"
ignoreCase="true"
words="stopwords.txt"
enablePositionIncrements="true"
/>
<filterclass="solr.WordDelimiterFilterFactory"generateWordParts="1"
generateNumberParts="1"catenateWords="1"catenateNumbers="1"
catenateAll="0"splitOnCaseChange="1"/>
<filterclass="solr.LowerCaseFilterFactory"/>
<filterclass="solr.SnowballPorterFilterFactory"language="English"
protected="protwords.txt"/>
</analyzer>
<analyzertype="query">
<tokenizerclass="solr.WhitespaceTokenizerFactory"/>
<filterclass="solr.SynonymFilterFactory"synonyms="synonyms.txt"ignoreCase="true"
expand="true"/>
<filterclass="solr.StopFilterFactory"
ignoreCase="true"
words="stopwords.txt"
enablePositionIncrements="true"
/>
<filterclass="solr.WordDelimiterFilterFactory"generateWordParts="1"
generateNumberParts="1"catenateWords="0"catenateNumbers="0"
catenateAll="0"splitOnCaseChange="1"/>
<filterclass="solr.LowerCaseFilterFactory"/>
<filterclass="solr.SnowballPorterFilterFactory"language="English"
protected="protwords.txt"/>
</analyzer>
</fieldType>

2、再来看下fields节点内定义具体的字段（类似数据库的字段），含有以下属性：

关于solr schema.xml 和solrconfig.xml的解释

相关文章