java爬虫抓取指定数据 50

如图所示：抓取选中地方的a标签下面的链接，然后再控制台循环打印出url值，求解救... 如图所示：抓取选中地方的a标签下面的链接，然后再控制台循环打印出url值，求解救展开

 我来答

4个回答

#热议# 不吃早饭真的会得胆结石吗？

数阔八爪鱼采集器丨RPA机器人
2021-07-29 · 前往八爪鱼RPA应用市场，免费获取机器人

数阔八爪鱼采集器丨RPA机器人

向TA提问

关注

展开全部

根据java网络编程相关的内容，使用jdk提供的相关类可以得到url对应网页的html页面代码。

针对得到的html代码，通过使用正则表达式即可得到我们想要的内容。

比如，我们如果想得到一个网页上所有包括“java”关键字的文本内容，就可以逐行对网页代码进行正则表达式的匹配。最后达到去除html标签和不相关的内容，只得到包括“java”这个关键字的内容的效果。

从网页上爬取图片的流程和爬取内容的流程基本相同，但是爬取图片的步骤会多一步。

需要先用img标签的正则表达式匹配获取到img标签，再用src属性的正则表达式获取这个img标签中的src属性的图片url，然后再通过缓冲输入流对象读取到这个图片url的图片信息，配合文件输出流将读到的图片信息写入到本地即可。

已赞过 已踩过<

评论收起

优速生鲜
2018-07-06 · 聚焦舌尖上的美食，为你掌关天下

优速生鲜

采纳数：16 获赞数：1867

向TA提问私信TA

关注

展开全部

如何通过Java代码实现对网页数据进行指定抓取，我总结了有以下几个步骤中会使用到Jsoup.Jar包：

1、在工程中导入Jsoup.jar包

2、获取网址url指定HTML或者文档指定的body

3、获取网页中超链接的标题和链接

4、获取指定博客文章的内容

5、获取网页中超链接的标题和链接的结果

本回答被网友采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

sunlimengjie
2016-06-27

知道答主

回答量：25

采纳率：0%

帮助的人：7.5万

我也去答题访问个人页

关注

展开全部

网页地址是啥？

已赞过 已踩过<

评论收起

优质内容提供者andy
2016-06-29 · TA获得超过1561个赞

知道大有可为答主

回答量：2551

采纳率：72%

帮助的人：769万

我也去答题访问个人页

关注

展开全部

私信我我可以完成这个问题

已赞过 已踩过<

评论收起

2条折叠回答

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

爬虫和大数据-数据采集就用后羿采集器-小白神器，一键采集

基于人工智能算法的新一代智能爬虫和大数据，不需要配置采集规则，一键采集!导出采集结果无数量限制~不要积分~~

www.houyicaiji.com广告

爬虫是什么全能工程师2024 版 - 从入门到精通，实战特训

爬虫是什么海量学习资源，200 多节精心录制的视频课程，100 余个真实企业案例剖析爬虫是什么从入门到精通，全方位覆盖 Python 各个知识点与应用场景。

class.imooc.com广告

爬虫什么意思_Kimi-AI写作-5分钟生成高质量文章

爬虫什么意思_选Kimi_智能AI精准生成写作、文案、翻译、编程等等_无广告无会员不限次数，你想要的全都有!

kimi.moonshot.cn广告

java爬虫抓取指定数据 50

您可能关注的内容

其他类似问题

为你推荐：