如何理解Lucene的Index索引文档模型

 我来答

1个回答

#热议# 上班途中天气原因受伤算工伤吗？

野人无事不言L
2017-01-26 · TA获得超过1413万个赞

知道顶级答主

回答量：2242万

采纳率：0%

帮助的人：143.8亿

我也去答题访问个人页

关注

展开全部

lucene主要有两种文档模型：document和field，一个document可能包含若干个field。
每一个field有不同的策略：
1.被索引 or not，将该字段（field）镇瞎悄经过分析（analyise）后，加入索引中，并不是原文。
2.如果被索引，可选择是否保存“term vector”(向量)，用于相似检索。
3.可选择是否神岁存储(store)，将原文直接拷贝，不做索引，用于检索后的取出。
lucene中的文档模型类似于数据库，但是又不完全相同，体现在如下几方面：
1.无规范格式，即无需固定的schema，无列等预先设计，同一个索引中加入的document可包含不同的field。
2.非正规化，lucene中的文档模御渣型是一个平面化的结构，没有递归定义，自然连接等等复杂的结构。

本回答由提问者推荐

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

如何理解Lucene的Index索引文档模型

其他类似问题

为你推荐：