Python爬虫采集遇到403问题怎么办?
最近使用爬虫程序去爬一些电商网站,但是爬取的效果不怎么好,总是返回403,也使用过代理,是代理的问题,还是程序的问题。各位大神请指教?...
最近使用爬虫程序去爬一些电商网站,但是爬取的效果不怎么好,总是返回403,也使用过代理,是代理的问题,还是程序的问题。各位大神请指教?
展开
提示该问答中所提及的号码未经验证,请注意甄别。
3个回答
2019-03-21
展开全部
1、通过Headers反爬虫:
从用户请求的Headers反爬虫是最常见的反爬虫策略。可以直接在爬虫中添加Headers,将浏览器的User-Agent复制到爬虫的Headers中;或者将Referer值修改为目标网站域名。对于检测Headers的反爬虫,在爬虫中修改或者添加Headers就能很好的绕过。
2、基于用户行为反爬虫:
直接使用芝麻IP代理,高匿名。
去测试一下,看一看具体是什么问题。
从用户请求的Headers反爬虫是最常见的反爬虫策略。可以直接在爬虫中添加Headers,将浏览器的User-Agent复制到爬虫的Headers中;或者将Referer值修改为目标网站域名。对于检测Headers的反爬虫,在爬虫中修改或者添加Headers就能很好的绕过。
2、基于用户行为反爬虫:
直接使用芝麻IP代理,高匿名。
去测试一下,看一看具体是什么问题。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2018-11-13
展开全部
618IP代理为您解答
您好,一般您说的更换IP的软件,使用体验好的都是付费软件,免费的要么不好用,要么有安全隐患,不建议您使用免费的IP更换软件。希望能够帮到您。
您好,一般您说的更换IP的软件,使用体验好的都是付费软件,免费的要么不好用,要么有安全隐患,不建议您使用免费的IP更换软件。希望能够帮到您。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询