如何用java中HTMLPraser提取网页源代码中的某些链接

举一个例子,如果网页源代码中有这样的代码<ahref="forum.php?mod=viewthread&tid=214172&extra=page%3D... 举一个例子,
如果网页源代码中有这样的代码
<a href="forum.php?mod=viewthread&tid=214172&extra=page%3D1" onclick="atarget(this)" class="s xst">博士视频讲师,1小时180+</a>
<a href="forum.php?mod=viewthread&tid=215520&extra=page%3D1" onclick="atarget(this)" class="s xst">周日2月1日麦颂KTV唱歌交友活动通知</a>
等等类似的,但是还有其他链接,我想要提取每一个href后面表示的链接
应该怎么用HTMLPraser
这里好像没什么标签
由于初学这里
希望大家可以予以解答疑问
谢谢啦~~
展开
 我来答
精品二手挖掘机械
2015-03-06 · TA获得超过205个赞
知道小有建树答主
回答量:209
采纳率:0%
帮助的人:115万
展开全部
使用正则表达式去匹配就行了。
第一步:下载你需要分析的网页的源码
第二步:在程序中使用正则表达式去匹配源码,保存匹配成功的链接地址就行。
可以在网上搜一下匹配网址的正则表达式
追问
网上有好多,哪一个才是正确的
那些表达式可以匹配所有网址吗?
麻烦你给我一个可以匹配这个的正则表达式,行吗?
谢谢你
月亮风度
2015-03-05 · TA获得超过386个赞
知道小有建树答主
回答量:391
采纳率:87%
帮助的人:151万
展开全部
直接使用正则去匹配捕获就行,不用那么麻烦哈
追问
能不能告诉我怎么用
我还没有学过正则表达式。。。
就这个链接给个例子行么
谢谢你
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式