一个关于python正则表达式获取网页图片地址的问题
importurllib2importrereg=r'<img.*height="100".*src="(.*?\.jpg)"'req=urllib2.urlopen('...
import urllib2import rereg = r'<img.* height="100".* src="(.*?\.jpg)"'req = urllib2.urlopen('http://www.mtime.com/')html = req.read()ps = re.findall(reg,html)print ps
打印出['http://img31.mtime.cn/mg/2014/02/12/165947.43299453.jpg']而这个图片的高度是330.
我这个正则表达式是要打印高度为100的图片的地址,下面是正则表达式中测试的结果是对的
如果我用死的方法测试像这样
ps = re.findall(reg,'<img height="100" width="75" src="http://img31.mtime.cn/mt/2014/01/23/150710.46283059_75X100.jpg" alt="谁说我们不会爱/Unexpected Love(2014)">')
ps打印出来是这个地址
我用高度为330的测试
ps = re.findall(reg,'<img width="265" height="330" alt="“多看10部”还是“同步引进”?" src="http://img31.mtime.cn/mg/2014/02/12/165947.43299453.jpg">')
打印[]是空的,这是为什么咧请帮忙解答一下 展开
打印出['http://img31.mtime.cn/mg/2014/02/12/165947.43299453.jpg']而这个图片的高度是330.
我这个正则表达式是要打印高度为100的图片的地址,下面是正则表达式中测试的结果是对的
如果我用死的方法测试像这样
ps = re.findall(reg,'<img height="100" width="75" src="http://img31.mtime.cn/mt/2014/01/23/150710.46283059_75X100.jpg" alt="谁说我们不会爱/Unexpected Love(2014)">')
ps打印出来是这个地址
我用高度为330的测试
ps = re.findall(reg,'<img width="265" height="330" alt="“多看10部”还是“同步引进”?" src="http://img31.mtime.cn/mg/2014/02/12/165947.43299453.jpg">')
打印[]是空的,这是为什么咧请帮忙解答一下 展开
1个回答
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询