正则表达式匹配链接怎么写?
获取网页中的<a链接,没有太特殊,都是如下类型:比如<ahref="http://www.baidu.com">百度</a>("http://"必须有)获得结果:百度ht...
获取网页中的<a 链接,没有太特殊,都是如下类型:
比如 <a href="http://www.baidu.com">百度</a> ("http://"必须有)
获得结果 :百度 http://www.baidu.com 展开
比如 <a href="http://www.baidu.com">百度</a> ("http://"必须有)
获得结果 :百度 http://www.baidu.com 展开
3个回答
展开全部
<a\shref=\"(https?://[^"]+)\"[^>]*>([^<]+)<\/a>
组1为链接 组2为文本
组1为链接 组2为文本
追问
请问如何获得网页中所有链接,如获得所有这样类型的百度其中网址必须以http://开头 href 后没有其他属性,正则表达式怎么写?
追答
([^
组1为链接 组2为文本
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
/**
* 英文域名url正则
*
* 传输协议(字母开头紧接'://')
* ^[a-z]+:\/\/
*
* 多级子域(字母、数字开头可以包含字母、数字、'_'、'-'且以'.'结尾的多组这种组合)
* ([a-z0-9]{1}[a-z0-9_-]*\.)*
*
* 顶级域名(由.分割的1到多组字母、数字组合)
* ([a-z0-9]+\.)*[a-z0-9]+
*
* 链接路由(以'/'开头的一段字符串)
* (\/[^\f\n\r\t\v]*)*$
*
* 最终表达式
* ^[a-z]+:\/\/([a-z0-9]{1}[a-z0-9_-]*\.)*([a-z0-9]+\.)*[a-z0-9]+(\/[^\f\n\r\t\v]*)*$
*/
* 英文域名url正则
*
* 传输协议(字母开头紧接'://')
* ^[a-z]+:\/\/
*
* 多级子域(字母、数字开头可以包含字母、数字、'_'、'-'且以'.'结尾的多组这种组合)
* ([a-z0-9]{1}[a-z0-9_-]*\.)*
*
* 顶级域名(由.分割的1到多组字母、数字组合)
* ([a-z0-9]+\.)*[a-z0-9]+
*
* 链接路由(以'/'开头的一段字符串)
* (\/[^\f\n\r\t\v]*)*$
*
* 最终表达式
* ^[a-z]+:\/\/([a-z0-9]{1}[a-z0-9_-]*\.)*([a-z0-9]+\.)*[a-z0-9]+(\/[^\f\n\r\t\v]*)*$
*/
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询