请问如何防止自己网页的内容被采集

 我来答
落叶纷纷闯天涯
推荐于2016-03-06
知道答主
回答量:2
采纳率:0%
帮助的人:2.5万
展开全部
防止采集第一种方法:在文章的头尾加上随机不固定的内容。网站采集者在采集时,通常都是指定一个开始位置和一个结束位置,截取中间的内容。

比如你的文章内容是"有讯软件信息网",则随机内容的加入方法:

<div id="xxx">随机内容1+有讯软件信息网+随机内容2</div>
注:随机内容1和随机内容2每篇文章只要随机显示一个就可以了.

防止采集第二种方法:在文章正文页面插入重复特征头尾代码的注释。
文章列表加随机不同的链接标签,比如<a href="" class="xxx"><a class="xxx" href=''>,当然,这个可以用正则去掉,但足于对付通用的CMS采集系统了.
<!--<div id="xxx_文章ID">-->
其它标题或内容...
<!--<div id="xxx_文章ID">--> <div id="xxx_文章ID">
随机内容1欢迎有讯软件信息网随机内容2
<--</div>--></div><--</div>-->
即:正文头尾或列表头尾添加<!--重复特征代码-->

防采集第三种方法:加在文章列表的随便链接样式。目的是让采集的人无法抓到列表链接规律,无法批量进行采集.
mk47林
2014-04-22 · 超过35用户采纳过TA的回答
知道答主
回答量:81
采纳率:0%
帮助的人:90.1万
展开全部
可以暂时防止别人采集自己的网页,但不是治本。
方法有很多:
1、从web服务器上,直接禁用掉短时间访问次数多的ip。
2、脚本上,同上
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式