如何理解Lucene的Index索引文档模型

 我来答

1个回答

#热议# 上班途中天气原因受伤算工伤吗？

野人无事不言L
2017-03-18 · TA获得超过1413万个赞

知道顶级答主

回答量：2242万

采纳率：0%

帮助的人：137.4亿

我也去答题访问个人页

关注

展开全部

lucene主要有两种文档模型：document和field，一个document可能包含若干个field。
每一个field有不同的策略：
1.被索引 or not，将该字段（field）经过分析（analyise）后，加入索引中，并不是原文。
2.如果被索引，可选择是否保存“term vector”(向量)，用于相似检索。
3.可选择是否存储(store)，将原文直接拷贝，不做索引，用于检索后的取出。
lucene中的文档模型类似于数据库，但是又不完全相同，体现在如下几方面：
1.无规范格式，即无需固定的schema，无列等预先设计，同一个索引中加入的document可包含不同的field。
2.非正规化，lucene中的文档模型是一个平面化的结构，没有递归定义，自然连接等等复杂的结构。

本回答由提问者推荐

已赞过 已踩过<

评论收起

ZESTRON
2024-09-04 广告

在Dr. O.K. Wack Chemie GmbH，我们高度重视ZESTRON的表界面分析技术。该技术通过深入研究材料表面与界面的性质，为提升产品质量与可靠性提供了有力支持。ZESTRON的表界面分析不仅涵盖了相变化、化学反应、吸附与解吸... 点击进入详情页

本回答由ZESTRON提供

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

如何理解Lucene的Index索引文档模型

为你推荐：