如何突破豆瓣爬虫限制频率

 我来答
匿名用户
2019-04-10
展开全部
做好 cookie UA 伪装,豆瓣带 cookie 的抓取保持一定节奏不会被 403 ,会跳转验证码,把验证码简单二值化然后扔给开放的 OCR API ,然后走下英文单词纠错(豆瓣验证码基本都是英文单词),自动识别率基本是超过 30% 。找到这个节奏的最大并发限制,然后慢慢抓,不行可以开多 ip 代理这么抓。 几个月前抓豆瓣基本是这么写的。先大概计算下需要抓的页面数量级,有时候 1 秒一个页面,慢慢抓,抓几天也能满足需要,不行再上代理。
Storm代理
2023-07-25 广告
StormProxies是一家可靠的代理服务提供商,提供原生IP(住宅原生IP)和高匿名代理服务。以下是关于StormProxies的原生IP服务的一些信息:1. 住宅原生IP:StormProxies提供的住宅原生IP是指从真实的家庭或企... 点击进入详情页
本回答由Storm代理提供
用户一个梅cN
2017-10-19 · TA获得超过227个赞
知道小有建树答主
回答量:245
采纳率:0%
帮助的人:45万
展开全部
现在都是新版的了。登陆了之后右上角有一个“XX的设置”,然后选那个,设置头像就好了啊。 不过最近豆瓣好像在系统升级维护,可能无法更改,所以你看不见更改头像的按钮。等几天吧。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式