当Python爬虫遇到网站防爬机制时如何处理

 我来答

3个回答

IPIDEA全球HTTP
2020-09-10 · 百度认证:江苏艾迪信息科技官方账号

IPIDEA全球HTTP

IPIDEA是国内领先的动态IP服务商，整合全球240+国家和地区真实住宅IP资源量9000万我们提供7x24小时的全天候多语种咨询，真实住宅IP应用多种应用场景，支持百万高并发

关注

展开全部

绕过反爬虫机制的方法

1、模拟正常用户。反爬虫机制还会利用检测用户的行为来判断，例如Cookies来判断是不是有效的用户。

2、动态页面限制。有时候发现抓取的信息内容空白，这是因为这个网站的信息是通过用户的XHR动态返回内容信息。解决这种问题就要爬虫程序对网站进行分析，找到内容信息并抓取，才能获取内容。

3、降低IP访问频率。有时候平台为了阻止频繁访问，会设置IP在规定时间内的访问次数，超过次数就会禁止访问。所以绕过反爬虫机制可以降低爬虫的访问频率，还可以用IPIDEA代理IP换IP解决限制。

已赞过 已踩过<

评论收起

匿名用户
2019-04-30

展开全部

User-Agent伪装和轮换，设置访问时间间隔，使用芝麻代理。

本回答被网友采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

腾讯电脑管家
2018-09-24 · 百度知道官方认证企业

腾讯电脑管家

腾讯电脑管家是腾讯公司推出的免费安全管理软件，能有效预防和解决计算机上常见的安全风险，并帮助用户解决各种电脑“疑难杂症”、优化系统和网络环境，是中国综合能力最强、最稳定的安全软件。

关注

展开全部

最简单最直接的办法是使用HTTP代理IP，例如代理云，拥有国内海量高质量HTTP代理IP资源，全国地区散段分布，IP的质量、稳定性、安全性都值得信赖。

已赞过 已踩过<

评论收起

1条折叠回答

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容