如何用正则表达式提取网址？

文件格式(HTML)网址格式如下：http://AAA.abc.com/http://img.abc.com/images/01.jpg要求返回结果：AAA或者http:... 文件格式(HTML)
网址格式如下：
http://AAA.abc.com/
http://img.abc.com/images/01.jpg
要求返回结果：
AAA
或者
http://AAA.abc.com/

在线等。。。展开

 我来答

1个回答

#热议# 空调使用不当可能引发哪些疾病？

tim_spac
2011-05-02 · TA获得超过3629个赞

知道大有可为答主

回答量：1804

采纳率：100%

帮助的人：2183万

我也去答题访问个人页

关注

展开全部

import re
patt = re.compile(r'(http://[0-9a-z\.]+)/.*',re.I|re.X)
print patt.findall('''http://AAA.abc.com/
http://img.abc.com/images/01.jpg
''')

>>> ['http://AAA.abc.com', 'http://img.abc.com']

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

如何用正则表达式提取网址？

为你推荐：