如何用java中HTMLPraser提取网页源代码中的某些链接

举一个例子,如果网页源代码中有这样的代码<ahref="forum.php?mod=viewthread&tid=214172&extra=page%3D1"onclic... 举一个例子, 如果网页源代码中有这样的代码 <a href="forum.php?mod=viewthread&tid=214172&extra=page%3D1" onclick="atarget(this)" class="s xst">博士视频讲师,1小时180+</a> <a href="forum.php?mod=viewthread&tid=215520&extra=page%3D1" onclick="atarget(this)" class="s xst">周日2月1日麦颂KTV唱歌交友活动通知</a> 等等类似的,但是还有其他链接,我想要提取每一个href后面表示的链接 应该怎么用HTMLPraser 这里好像没什么标签 由于初学这里 希望大家可以予以解答疑问 谢谢啦~~ 展开
 我来答
牛雰咸听枫
2020-03-10 · TA获得超过3588个赞
知道大有可为答主
回答量:3060
采纳率:28%
帮助的人:240万
展开全部
使用正则表达式去匹配就行了。
第一步:下载你需要分析的网页的源码
第二步:在程序中使用正则表达式去匹配源码,保存匹配成功的链接地址就行。
可以在网上搜一下匹配网址的正则表达式
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式