editplus或者UE里 用正则表达式如何提取文本中的URL?
文本是<loc>这里是URL</loc><priority>0.5000</priority></url><loc>这里是URL</loc><priority>0.500...
文本是
<loc>这里是URL</loc>
<priority>0.5000</priority>
</url>
<loc>这里是URL</loc>
<priority>0.5000</priority>
</url>
URL特征是
http开头,html结尾
我想提取URL,去掉URL以外的内容。
提取URL的正则是(http).+(html),试了下匹配成功,但问题是,我只想在这个文本里保留匹配的网址,把其他的无用文本都去掉。而我现在的操作是在"查找内容"里,写的是(http).+(html),"替换内容"里没填。这样操作只能删除我匹配的网址。
在Editplus或者UltraEdit的环境下, 怎么才能只保留我需要的URL呢? 展开
<loc>这里是URL</loc>
<priority>0.5000</priority>
</url>
<loc>这里是URL</loc>
<priority>0.5000</priority>
</url>
URL特征是
http开头,html结尾
我想提取URL,去掉URL以外的内容。
提取URL的正则是(http).+(html),试了下匹配成功,但问题是,我只想在这个文本里保留匹配的网址,把其他的无用文本都去掉。而我现在的操作是在"查找内容"里,写的是(http).+(html),"替换内容"里没填。这样操作只能删除我匹配的网址。
在Editplus或者UltraEdit的环境下, 怎么才能只保留我需要的URL呢? 展开
3个回答
2013-05-15
展开全部
正则表达式有个功能叫预搜索,和反向预搜索,就是解决这个问题,你的表达式可以这样写:(?<=http).+(?=html)这样就可以了
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2013-05-15
展开全部
那就麻烦点来。。一部分一部分的替换?呃。。这也是接解决方案。。就是麻烦没效率,想了半天也找不出也个合适的正则,坐等高手。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询