如何解决爬虫ip被封的问题

 我来答

7个回答

#热议# 上班途中天气原因受伤算工伤吗？

路是月的痕f8
2017-09-07 · TA获得超过1216个赞

知道大有可为答主

回答量：1352

采纳率：0%

帮助的人：1033万

我也去答题访问个人页

关注

展开全部

1.IP必须需要，，ADSL。如果有条件，其实可以跟机房多申请外网IP。
2.在有外网IP的机器上，部署代理服务器。
3.你的程序，使用轮训替换代理服务器来访问想要采集的网站。
好处：
1.程序逻辑变化小，只需要代理功能。
2.根据对方网站屏蔽规则不同，你只需要添加更多的代理就行了。
3.就算具体IP被屏蔽了，你可以直接把代理服务器下线就OK，程序逻辑不需要变化。
方法2.
有小部分网站的防范措施比较弱，可以伪装下IP，修改X-Forwarded-for（貌似这么拼。。。）即可绕过。
大部分网站么，如果要频繁抓取，一般还是要多IP。我比较喜欢的解决方案是国外VPS再配多IP，通过默认网关切换来实现IP切换，比HTTP代理高效得多，估计也比多数情况下的ADSL切换更高效。
方法3.
ADSL + 脚本，监测是否被封，然后不断切换 ip
设置查询频率限制
正统的做法是调用该网站提供的服务接口。
方法4.
8年多爬虫经验的人告诉你，国内ADSL是王道，多申请些线路，分布在多个不同的电信区局，能跨省跨市更好，自己写好断线重拨组件，自己写动态IP追踪服务，远程硬件重置（主要针对ADSL猫，防止其宕机），其余的任务分配，数据回收，都不是大问题。我的已经稳定运行了好几年了，妥妥的！
方法5.
1 user agent 伪装和轮换
2 使用代理 ip 和轮换
3 cookies 的处理，有的网站对登陆用户政策宽松些
友情提示：考虑爬虫给人家网站带来的负担，be a responsible crawler
方法6.
尽可能的模拟用户行为：
1、UserAgent经常换一换；
2、访问时间间隔设长一点，访问时间设置为随机数；
3、访问页面的顺序也可以随机着来
方法8.
网站封的依据一般是单位时间内特定IP的访问次数.
我是将采集的任务按目标站点的IP进行分组通过控制每个IP 在单位时间内发出任务的个数,来避免被封.当然,这个前题是你采集很多网站.如果只是采集一个网站,那么只能通过多外部IP的方式来实现了.
方法9.
1. 对爬虫抓取进行压力控制；
2. 可以考虑使用代理的方式访问目标站点。
-降低抓取频率，时间设置长一些，访问时间采用随机数
-频繁切换UserAgent（模拟浏览器访问）
-多页面数据，随机访问然后抓取数据
-更换用户IP

已赞过 已踩过<

评论收起

Storm代理
2023-07-25 广告

StormProxies是一家提供动态代理服务器服务的企业，旨在帮助用户更好地管理网络访问和安全。以下是一些关于StormProxies的IP动态代理服务的特点：1. 高匿名性：StormProxies的动态代理服务器具有高匿名性，可以有效... 点击进入详情页

本回答由Storm代理提供

匿名用户
2019-03-25

展开全部

在请求头中把User-Agent设置成浏览器中的User-Agent，来伪造浏览器访问
还可以先收集多种浏览器的User-Agent，每次发起请求时随机从中选一个使用，可以进一步提高安全性
选择高匿稳定的极光动态IP，多线接入，独享专线带宽，确保网络免受干扰
在每次重复爬取之间设置一个随机时间间隔

已赞过 已踩过<

评论收起

衬抖全国性
2018-12-25 · 贡献了超过168个回答

知道答主

回答量：168

采纳率：0%

帮助的人：12.5万

我也去答题访问个人页

关注

展开全部

一般就是重启网络和路由器等等
在就是软件
下我名字

已赞过 已踩过<

评论收起

极光代理动态IP
2020-10-15 · 千万IP库存，一键切换，无需配置，易操作

极光代理动态IP

极光代理动态IP是一款稳定高速的国内IP切换软件。 IP数量1000万+，全国线路，不限带宽，海量稳定IP秒连秒换连接切换速度小于100ms每日切换不限次数，高质量流量出口。

向TA提问

关注

展开全部

数据抓取的时候发现ip被封使因为现在许多网站都是会设置一定的反爬虫措施，由于爬虫在爬取的过程中，会占用服务器的带宽，为了保证网站可以被正常访问，不会因为爬虫的原因导致瘫痪，因此才会设置反爬虫措施。
由于爬虫在爬取的过程当中，往往会发送大量请求，所以网站的反爬虫措施就会被触发，IP就会被封禁，直接导致爬虫不能继续进行。而用了HTTP代理进行爬虫，就会大大地减少这种情况的出现。使用HTTP代理进行数据抓取的时候可以更换ip，如果IP被封禁了，换个IP就可以继续爬虫了。

已赞过 已踩过<

评论收起

IPIDEA全球HTTP
2020-08-15 · 百度认证:江苏艾迪信息科技官方账号

IPIDEA全球HTTP

IPIDEA是国内领先的动态IP服务商，整合全球240+国家和地区真实住宅IP资源量9000万我们提供7x24小时的全天候多语种咨询，真实住宅IP应用多种应用场景，支持百万高并发

向TA提问

关注

展开全部

现在网站一般都会设置反爬虫机制，如果此时还想继续访问这个网站，爬虫ip就很重要，如果当前的ip地址受限制，可以换一个新的ip地址，需要用到HTTP。可以用IPIDEA操作简单而且ip纯净，池量足够大，保证爬虫的顺利进行。

已赞过 已踩过<

评论收起

3条折叠回答

更多回答（5）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

工作室换ip-全球200+国家地区，可免费试用。

工作室换ip，全球住宅代理IP服务商，纯净住宅IP，可用率99.99%。工作室换ip，适合搭建网站，电子商务，访问地理限制，网页抓取等

proxybd.tiaozhuan.com广告

如何解决爬虫ip被封的问题

您可能关注的内容

其他类似问题

为你推荐：