robots是什么文件,它有什么作用 10

 我来答
野生人口菌
2016-05-09 · TA获得超过4894个赞
知道大有可为答主
回答量:2375
采纳率:81%
帮助的人:323万
展开全部
简介 听语音
robots.txt文件是一个文本文件,使用任何一个常见的文本编辑器,比如Windows系统自带的Notepad,就可以创建和编辑它。robots.txt是一个协议,而不是一个命令。robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的。
当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。百度官方建议,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。
如果将网站视为酒店里的一个房间,robots.txt就是主人在房间门口悬挂的“请勿打扰”或“欢迎打扫”的提示牌。这个文件告诉来访的搜索引擎哪些房间可以进入和参观,哪些房间因为存放贵重物品,或可能涉及住户及访客的隐私而不对搜索引擎开放。但robots.txt不是命令,也不是防火墙,如同守门人无法阻止窃贼等恶意闯入者。
原则 听语音

robots协议原理
Robots协议是国际互联网界通行的道德规范,基于以下原则建立:
1、搜索技术应服务于人类,同时尊重信息提供者的意愿,并维护其隐私权;
追答
如果是的话,请采纳一下
Storm代理
2023-07-25 广告
StormProxies是一家可靠的代理服务提供商,提供原生IP(住宅原生IP)和高匿名代理服务。以下是关于StormProxies的原生IP服务的一些信息:1. 住宅原生IP:StormProxies提供的住宅原生IP是指从真实的家庭或企... 点击进入详情页
本回答由Storm代理提供
子闻SEO
2016-05-09 · TA获得超过486个赞
知道小有建树答主
回答量:164
采纳率:53%
帮助的人:37万
展开全部
robots.txt是一种存放网站根目录下的文本文件,它通常告诉搜索引擎的抓取程序,这个网站中的哪些内容是不应该被搜索引擎的抓取程序获取的,哪些是可以被抓取程序获取的。

它的作用有几下几点:
1.引导搜索引擎蜘蛛抓取指定栏目或内容
2.网站改版或者URL重写优化时屏蔽不友好链接
3.屏蔽死链接,404错误页面
4.屏蔽重复页面,如评论页面,搜索结果页
5.屏蔽无内容,无价值页面
6.屏蔽任何不想被收录的页面
7.引导蜘蛛抓取网站地图
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
骑蜗牛走遍全球
2016-05-09 · TA获得超过484个赞
知道小有建树答主
回答量:381
采纳率:0%
帮助的人:60.8万
展开全部
User-agent:* 这里的*代表的所有的搜索引擎,*是一个通配符.
Disallow:/plus/ad_js.php Disallow是不允许、禁止的意思,这里定义是禁止爬寻plus目录下的ad_js.php文件.
下边的Disallow的意思也是禁止所有搜索引擎都不允许爬取的文件或目录.
User-Agent:*
Allow:/ 的意思是所有的搜索引擎都可以爬取你网站的所有内容.
Robots协议用来告知搜索引擎哪些页面能被抓取,哪些页面不能被抓取;可以屏蔽一些网站中比较大的文件,如:图片,音乐,视频等,节省服务器带宽;可以屏蔽站点的一些死链接.方便搜索引擎抓取网站内容;设置网站地图连接,方便引导蜘蛛爬取页面.
如果你设置了所有都可以爬取,那就不必要设置robots,上述的所有robots的作用也都没用.
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(1)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式