java爬虫怎么抓取登陆后的网页数据

登陆是指用户登陆的急啊,各位好心人帮帮忙。... 登陆是指用户登陆的
急啊,各位好心人帮帮忙。
展开
 我来答
ccppv
推荐于2016-09-30 · TA获得超过2994个赞
知道大有可为答主
回答量:5074
采纳率:40%
帮助的人:2975万
展开全部
一般爬虫都不会抓登录以后的页面,
如果你只是临时抓某个站,可以模拟登录,然后拿到登录以后的Cookies,再去请求相关的页面。
追问
讲得有点玄,有没有可以参考的资料或者例子什么的
追答
你百度一下  java 模拟GET/POST请求,资料有很多,
这个可以了解一下,在你以后的编程中,可能有很多地方会用得到这个东西。
数阔八爪鱼采集器丨RPA机器人
2021-07-29 · 前往八爪鱼RPA应用市场,免费获取机器人
数阔八爪鱼采集器丨RPA机器人
向TA提问
展开全部
1、首先抓包获取登录的url,新建post请求
2、设置用户名和密码参数
3、发起请求
4、获取返回值和cookie
5、新建抓取数据的请求
6、设置请求头
7、通过抓包,得知参数是通过form data方式传递还是通过request payload方式,form data方式就是通过键值对 NameValuePair、UrlEncodedFormEntity的方式,如果是request payload方式的话,则需要字符流StringEntity的方式了。
8、执行请求就可以获取到我们要的数据了
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 1条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式