
如何用正则表达式提取网址?
文件格式(HTML)网址格式如下:http://AAA.abc.com/http://img.abc.com/images/01.jpg要求返回结果:AAA或者http:...
文件格式(HTML)
网址格式如下:
http://AAA.abc.com/
http://img.abc.com/images/01.jpg
要求返回结果:
AAA
或者
http://AAA.abc.com/
在线等。。。 展开
网址格式如下:
http://AAA.abc.com/
http://img.abc.com/images/01.jpg
要求返回结果:
AAA
或者
http://AAA.abc.com/
在线等。。。 展开
1个回答
展开全部
import re
patt = re.compile(r'(http://[0-9a-z\.]+)/.*',re.I|re.X)
print patt.findall('''http://AAA.abc.com/
http://img.abc.com/images/01.jpg
''')
>>> ['http://AAA.abc.com', 'http://img.abc.com']
patt = re.compile(r'(http://[0-9a-z\.]+)/.*',re.I|re.X)
print patt.findall('''http://AAA.abc.com/
http://img.abc.com/images/01.jpg
''')
>>> ['http://AAA.abc.com', 'http://img.abc.com']
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询