solr具体怎么处理分词

 我来答

1个回答

#热议# 空调使用不当可能引发哪些疾病？

婉顺还惟妙惟肖的桃花L
2018-11-27 · TA获得超过1万个赞

知道大有可为答主

回答量：5467

采纳率：87%

帮助的人：331万

我也去答题访问个人页

关注

展开全部

分词器的工作是将一串的文本切成 tokens，这些 token 一般是文本的子集。分析器的处理对象时一个字段，分词器则是面对一串文本，分词器读取一串文本，然后将其切割成一堆的 token 对象。

字符串中的空格或连接符会被删除。字符将被添加或者替换，如映射别名，或者缩写替换缩写为正常格式。分词器可能会产生出与原字段值不一致的token，或者长度与原始文本不一致。这个在token元数据用于文本字段高亮搜索结果时需要注意。

<</code>fieldType name="text" class="solr.TextField">
<</code>analyzer>
<</code>tokenizer class="solr.StandardTokenizerFactory"/>
</</code>analyzer>
</</code>fieldType>

元素的类名称不是一个真实的分词器，但是它指向一个实现了org.apache.solr.analysis.TokenizerFactory接口的类。这个工厂在需要的时候会创建一个分词器的实例。工厂创建出来的对象必须继承 org.apache.lucene.analysis.TokenStream.

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

solr具体怎么处理分词

为你推荐：