搜索引擎是用什么技术进行搜索的

 我来答
小文芋月西2158
2022-10-06 · TA获得超过1935个赞
知道小有建树答主
回答量:484
采纳率:0%
帮助的人:70.5万
展开全部
分类: 教育/科学 >> 院校信息
问题描述:

各大搜索引擎是用什么技术进行搜索的?

菜鸟问,请详答,谢谢

解析:

10月28日 19:56 搜索引擎起源于传统的信息全文检索理论。它包括3个主要过程:

1)搜集Web信息:发现、搜集Web上的网页信息。需要有高性能的搜集器自动的在Web中搜索

信息。Web信息搜集器是下载Web上网页的程序。它顺着网页之间的链接移动,自动地下载

所经过的网页。给定起始URL *** S,Web搜集器不停的从S中移除URL,下载相应的网页,解

析出网页中的超链接URL,将未访问过的URL加入 *** S。Web搜集器也称作Web机器人或Web

蜘蛛。搜集器把所获得的信息保存下来以备建立索引库,供用户检索。

2)索引库的建立:对搜集到的Web信息提取和组织,建立索引库。这关系到用户能否迅速地

找到准确、广泛的信息。对搜集器抓来的网页信息快速地建立索引,通常采用倒排表技术

。如果在建立索引库的过程中对用户在检索端搜索的查询串进行跟踪,并对查询频率高的

查询串建立Cache,可以在检索端请求时,加快索引库的响应速度。

3)检索端的查询:根据用户输入的查询字串,在索引库中快速检索出文档。采用基于网页

内容分析和基于超链分析相结合的方法进行相关度评价,客观地对检索出的网页进行排序

,从而尽量保证搜索出的结果与用户的查询串相一致。然后将输出的结果返回给用户。为

了加快检索端的响应速度,可以根据最近用户查询信息建立检索端Cache。

针对你的问题:看来你是没有建索引文件,关键词来了现到数据库匹配,当然慢。

索引文件是不需要数据库保存的,利用倒排表建好每个词的索引网页,查询的时候几乎是

一下命中,当然在秒级下完成了。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式