正则表达式提取网页链接
<ahref="http://www.jieyanqu.com/thread-3017493-1-1.html"onclick="atarget(this)"class=...
<a href="http://www.jieyanqu.com/thread-3017493-1-1.html" onclick="atarget(this)" class="xst" >phpinfo()显示时区正确,服务器时区正确,网站时间不正确</a>
中提取
http://www.jieyanqu.com/thread-3017493-1-1.html
其他的过滤掉
用的是VB2010 展开
中提取
http://www.jieyanqu.com/thread-3017493-1-1.html
其他的过滤掉
用的是VB2010 展开
2个回答
2012-08-15
展开全部
正则表达式
\b(https?)://([-A-Z0-9.]+)(/[-A-Z0-9+&@#/%=~_|!:,.;]*)?(\?[A-Z0-9+&@#/%=~_|!:,.;]*)?
;;;VB.net实现
Imports System.Text.RegularExpressions
Dim MatchVale As String = String.Empty
Dim myrule As New
Regex("\b(https?)://([-A-Z0-9.]+)(/[-A-Z0-9+&@#/%=~_|!:,.;]*)?(\?[A-Z0-9+&@#/%=~_|!:,.;]*)?")
Dim m As Match = myrule.Match(url)
MatchVale = m.Groups(1).ToString
Return MatchVale
\b(https?)://([-A-Z0-9.]+)(/[-A-Z0-9+&@#/%=~_|!:,.;]*)?(\?[A-Z0-9+&@#/%=~_|!:,.;]*)?
;;;VB.net实现
Imports System.Text.RegularExpressions
Dim MatchVale As String = String.Empty
Dim myrule As New
Regex("\b(https?)://([-A-Z0-9.]+)(/[-A-Z0-9+&@#/%=~_|!:,.;]*)?(\?[A-Z0-9+&@#/%=~_|!:,.;]*)?")
Dim m As Match = myrule.Match(url)
MatchVale = m.Groups(1).ToString
Return MatchVale
追问
嗯,差不多了
我现在知道/thread- 和-1-1.html 俩个参数,如何把网址提取出来呢?只提取中间的数字怎么弄?
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2012-08-15
展开全部
@"(?is)<a((?!href=)[\s\S])*href=['""]?(?<href>[^'""]*)[^<]*</a>"
group["href"]就是http://www.jieyanqu.com/thread-3017493-1-1.html
group["href"]就是http://www.jieyanqu.com/thread-3017493-1-1.html
追问
嗯,差不多了
我现在知道/thread- 和-1-1.html 俩个参数,如何把网址提取出来呢?只提取中间的数字怎么弄?
追答
@"thread\-(\d+)\-1\-1.html"
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询