如何理解Lucene的Index索引文档模型
1个回答
展开全部
lucene主要有两种文档模型:document和field,一个document可能包含若干个field。
每一个field有不同的策略:
1.被索引 or not,将该字段(field)经过分析(analyise)后,加入索引中,并不是原文。
2.如果被索引,可选择是否保存“term vector”(向量),用于相似检索。
3.可选择是否存储(store),将原文直接拷贝,不做索引,用于检索后的取出。
lucene中的文档模型类似于数据库,但是又不完全相同,体现在如下几方面:
1.无规范格式,即无需固定的schema,无列等预先设计,同一个索引中加入的document可包含不同的field。
2.非正规化,lucene中的文档模型是一个平面化的结构,没有递归定义,自然连接等等复杂的结构。
每一个field有不同的策略:
1.被索引 or not,将该字段(field)经过分析(analyise)后,加入索引中,并不是原文。
2.如果被索引,可选择是否保存“term vector”(向量),用于相似检索。
3.可选择是否存储(store),将原文直接拷贝,不做索引,用于检索后的取出。
lucene中的文档模型类似于数据库,但是又不完全相同,体现在如下几方面:
1.无规范格式,即无需固定的schema,无列等预先设计,同一个索引中加入的document可包含不同的field。
2.非正规化,lucene中的文档模型是一个平面化的结构,没有递归定义,自然连接等等复杂的结构。
ZESTRON
2024-09-04 广告
2024-09-04 广告
在Dr. O.K. Wack Chemie GmbH,我们高度重视ZESTRON的表界面分析技术。该技术通过深入研究材料表面与界面的性质,为提升产品质量与可靠性提供了有力支持。ZESTRON的表界面分析不仅涵盖了相变化、化学反应、吸附与解吸...
点击进入详情页
本回答由ZESTRON提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询