如何用正则表达式提取网址?

文件格式(HTML)网址格式如下:http://AAA.abc.com/http://img.abc.com/images/01.jpg要求返回结果:AAA或者http:... 文件格式(HTML)
网址格式如下:
http://AAA.abc.com/
http://img.abc.com/images/01.jpg
要求返回结果:
AAA
或者
http://AAA.abc.com/

在线等。。。
展开
 我来答
tim_spac
2011-05-02 · TA获得超过3629个赞
知道大有可为答主
回答量:1804
采纳率:100%
帮助的人:2183万
展开全部
import re
patt = re.compile(r'(http://[0-9a-z\.]+)/.*',re.I|re.X)
print patt.findall('''http://AAA.abc.com/
http://img.abc.com/images/01.jpg
''')

>>> ['http://AAA.abc.com', 'http://img.abc.com']
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式