如何突破豆瓣爬虫限制频率

 我来答

2个回答

匿名用户
2019-04-10

展开全部

做好 cookie UA 伪装，豆瓣带 cookie 的抓取保持一定节奏不会被 403 ，会跳转验证码，把验证码简单二值化然后扔给开放的 OCR API ，然后走下英文单词纠错（豆瓣验证码基本都是英文单词），自动识别率基本是超过 30% 。找到这个节奏的最大并发限制，然后慢慢抓，不行可以开多 ip 代理这么抓。几个月前抓豆瓣基本是这么写的。先大概计算下需要抓的页面数量级，有时候 1 秒一个页面，慢慢抓，抓几天也能满足需要，不行再上代理。

已赞过 已踩过<

评论收起

Storm代理
2023-07-25 广告

StormProxies是一家可靠的代理服务提供商，提供原生IP（住宅原生IP）和高匿名代理服务。以下是关于StormProxies的原生IP服务的一些信息：1. 住宅原生IP：StormProxies提供的住宅原生IP是指从真实的家庭或企... 点击进入详情页

本回答由Storm代理提供

用户一个梅cN
2017-10-19 · TA获得超过227个赞

知道小有建树答主

回答量：245

采纳率：0%

帮助的人：45万

我也去答题访问个人页

关注

展开全部

现在都是新版的了。登陆了之后右上角有一个“XX的设置”，然后选那个，设置头像就好了啊。不过最近豆瓣好像在系统升级维护，可能无法更改，所以你看不见更改头像的按钮。等几天吧。

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

2023python网络爬虫每天免费网上学习python网络爬虫

免费网上学习python网络爬虫，国内讲师机构专业授课，适合从基础学习，挑战从入门到熟练运用，海量python网络爬虫学习从入门到编程技术高超 python编程能力快速提升

www.huke88.com广告

通用人工智能网:征文奖励500元，python千字科技原创文章

www.opensnn.com

如何突破豆瓣爬虫限制频率

您可能关注的内容

其他类似问题

为你推荐：