如何处理百度抓取异常的页面?
百度抓取异常的页面的原因有:网页不存在、服务器无法正常提供信息,或是服务器无法回应,也就是常说的网站404页面。具体的解决方法是在网站中设置一个404页面。具体的步骤如下:
1.先下载或者根据网站制作一个404错误页面,优化404页面,添加一些导航菜单或者返回首页的超链接;
2.打开网站使用服务器的FTP,登陆网站的后台;
3.登陆FTP,打开网站的根目录htdocs;
4.把刚刚我们下载好的404模板,用鼠标拖进左下角的任务栏,单击鼠标右键传输到根目录。(这里说下,404模板名字一定是命名“404”,比如:404.html这个才是正确的,其他命名名字,系统会无法识别的);
5.进入到网站主机的管理后台,输入个人的账号登陆,然后点击管理控制台;
6.进入到主机后台后,点击站点信息,打开基础环境设置,直接设置404页面。
7.进入404错误页面设置界面,点击“浏览”选中刚刚上传的404模板,点设置404错误页面就好了;
8.测试是否已经成功设置404,在浏览器中输入自己的域名,在域名后缀加斜杠随便打几个字母测试。比如:xxxx.com/dfddfdsd,如图;
要看具体的问题,再针对问题解决抓取异常的问题
网站抓取异常分析:
域名到期(或者域名转出等出现暂时不能访问就会出现抓取异常)
服务器不稳定
网站程序有问题
robots.txt文件里设置了拒绝百度蜘蛛抓取的代码
网站被挂马
解决方案:
查询域名是否到期,到期了需续费恢复正常
服务器不稳定 咨询供应商及其解决稳定问题并修复
网站程序有问题找建站程序员检测问题并修复
robots.txt文件里拒绝百度蜘蛛抓取的代码删除掉并更新
网站被挂马,要查询挂马文件在哪里并删除,恢复网站,更改登录名和密码,安全密保要从新设置,防止下次被挂马
现在那些链接打开都是404,我并不知道他本来链接到什么地方,怎么办