Java爬虫QQ空间? 200

用Java+Selenium模拟用户登录QQ空间,输入账号,密码都通过了,然后验证码这里好复杂,弄了好久,网上找了好多解决方案,基本上都是失效的,求大佬解决验证码,自己爬... 用Java+Selenium模拟用户登录QQ空间,输入账号,密码都通过了,然后验证码这里好复杂,弄了好久,网上找了好多解决方案,基本上都是失效的,求大佬解决验证码,自己爬自己空间说说来做数据分析的 展开
 我来答
沉绪员
2019-11-18 · TA获得超过131个赞
知道小有建树答主
回答量:242
采纳率:65%
帮助的人:38.4万
展开全部

你直接保存某次登录后的cookie信息设置到请求头里,应该就不用验证了;别模拟手动手动输入账号密码去登录

下图是我用python筛选百度知道有金币问题代码中的登录设置

你说cookie失效,你一次性爬取完呗,我就不行你页面没关闭他也给你失效,而且爬完也用不了多久

追问
我还是想解决验证码,我想爬空间说说做成一个api接口,只要输入qq号就可以爬说说
追答
那你就别怕麻烦用@亚宝1314520的第二种方法,或者你自己想个更牛逼的
AiPPT
2024-09-19 广告
作为北京饼干科技有限公司的工作人员,关于AIPPT免费生成PPT的功能,我可以简要介绍如下:AIPPT是一款基于人工智能技术的PPT制作工具,它为用户提供了免费生成PPT的便捷服务。用户只需简单输入PPT的主题或内容大纲,AIPPT便能智能... 点击进入详情页
本回答由AiPPT提供
亚宝1314520
2019-11-18
知道答主
回答量:17
采纳率:100%
帮助的人:9660
展开全部
如题,用selenium操作浏览器登录网站,验证码是个头疼的问题,翻遍了网上,大概两种方法,第一种手动登录,然后用找到浏览器中登录的cookie,将cookie添加到chromedriver里,跳过登录页面,参考文章:https://blog.csdn.net/ab_2016/article/details/78427084
这里说明的第二种,把验证码拿到本地识别,然后输入网站文本框,测试了三十多个网站,测试效果比较理想,正确率高达百分85%
追问
第一种试过了,Cookie过一段时间就会失效,第二种技术难度有点难搞,弄了好久
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
数阔八爪鱼采集器丨RPA机器人
2021-07-30 · 前往八爪鱼RPA应用市场,免费获取机器人
数阔八爪鱼采集器丨RPA机器人
向TA提问
展开全部
QQ空间是需要登陆才能爬取的,所以说首先要做的事进行登陆,这里有两种思路进行模拟登陆:
(1)、用selenium+Chrome 进行自动化检测登陆,接着用扫码或者账号自动输入都是可以的,然后获取cookies,再传入requests.Session().get()对要爬取好友的空间进行爬取。
(2)、用opener 和 cookielib 进行对网站cookie的获取,然后再传入requests.Session().get()
我在这里使用的是第一种方法。
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
这是砖砖
2019-11-18
知道答主
回答量:46
采纳率:0%
帮助的人:2.9万
展开全部

直接用QQ登录就行了

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 2条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式