正则表达式提取网页链接

<ahref="http://www.jieyanqu.com/thread-3017493-1-1.html"onclick="atarget(this)"class=... <a href="http://www.jieyanqu.com/thread-3017493-1-1.html" onclick="atarget(this)" class="xst" >phpinfo()显示时区正确,服务器时区正确,网站时间不正确</a>
中提取
http://www.jieyanqu.com/thread-3017493-1-1.html
其他的过滤掉
用的是VB2010
展开
 我来答
匿名用户
2012-08-15
展开全部
正则表达式

\b(https?)://([-A-Z0-9.]+)(/[-A-Z0-9+&@#/%=~_|!:,.;]*)?(\?[A-Z0-9+&@#/%=~_|!:,.;]*)?

;;;VB.net实现

Imports System.Text.RegularExpressions

Dim MatchVale As String = String.Empty

Dim myrule As New
Regex("\b(https?)://([-A-Z0-9.]+)(/[-A-Z0-9+&@#/%=~_|!:,.;]*)?(\?[A-Z0-9+&@#/%=~_|!:,.;]*)?")

Dim m As Match = myrule.Match(url)

MatchVale = m.Groups(1).ToString

Return MatchVale
追问
嗯,差不多了

我现在知道/thread- 和-1-1.html 俩个参数,如何把网址提取出来呢?只提取中间的数字怎么弄?
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
匿名用户
2012-08-15
展开全部
@"(?is)<a((?!href=)[\s\S])*href=['""]?(?<href>[^'""]*)[^<]*</a>"

group["href"]就是http://www.jieyanqu.com/thread-3017493-1-1.html
追问
嗯,差不多了

我现在知道/thread- 和-1-1.html 俩个参数,如何把网址提取出来呢?只提取中间的数字怎么弄?
追答
@"thread\-(\d+)\-1\-1.html"
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式