java爬虫抓取指定数据 50

如图所示:抓取选中地方的a标签下面的链接,然后再控制台循环打印出url值,求解救... 如图所示:抓取选中地方的a标签下面的链接,然后再控制台循环打印出url值,求解救 展开
 我来答
数阔八爪鱼采集器丨RPA机器人
2021-07-29 · 前往八爪鱼RPA应用市场,免费获取机器人
数阔八爪鱼采集器丨RPA机器人
向TA提问
展开全部

根据java网络编程相关的内容,使用jdk提供的相关类可以得到url对应网页的html页面代码。

针对得到的html代码,通过使用正则表达式即可得到我们想要的内容。

比如,我们如果想得到一个网页上所有包括“java”关键字的文本内容,就可以逐行对网页代码进行正则表达式的匹配。最后达到去除html标签和不相关的内容,只得到包括“java”这个关键字的内容的效果。

从网页上爬取图片的流程和爬取内容的流程基本相同,但是爬取图片的步骤会多一步。

需要先用img标签的正则表达式匹配获取到img标签,再用src属性的正则表达式获取这个img标签中的src属性的图片url,然后再通过缓冲输入流对象读取到这个图片url的图片信息,配合文件输出流将读到的图片信息写入到本地即可。

优速生鲜
2018-07-06 · 聚焦舌尖上的美食,为你掌关天下
优速生鲜
采纳数:16 获赞数:1867

向TA提问 私信TA
展开全部
如何通过Java代码实现对网页数据进行指定抓取,我总结了有以下几个步骤中会使用到Jsoup.Jar包:

1、在工程中导入Jsoup.jar包

2、获取网址url指定HTML或者文档指定的body

3、获取网页中超链接的标题和链接

4、获取指定博客文章的内容

5、获取网页中超链接的标题和链接的结果
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
sunlimengjie
2016-06-27
知道答主
回答量:25
采纳率:0%
帮助的人:7.5万
展开全部
网页地址是啥?
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
优质内容提供者andy
2016-06-29 · TA获得超过1561个赞
知道大有可为答主
回答量:2551
采纳率:72%
帮助的人:769万
展开全部
私信我我可以完成这个问题
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 2条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式