Python爬虫爬取图片问题 用正则规则匹配到一个网页的所有图片的网址规则,请问如何用遍历把正则
Python爬虫爬取图片问题用正则规则匹配到一个网页的所有图片的网址规则,请问如何用遍历把正则匹配到的所有图片的网址都找到,最好给出源码,谢谢!...
Python爬虫爬取图片问题
用正则规则匹配到一个网页的所有图片的网址规则,请问如何用遍历把正则匹配到的所有图片的网址都找到,最好给出源码,谢谢! 展开
用正则规则匹配到一个网页的所有图片的网址规则,请问如何用遍历把正则匹配到的所有图片的网址都找到,最好给出源码,谢谢! 展开
1个回答
展开全部
# encoding: UTF-8
import re
# 将正则表达式编译成Pattern对象
pattern = re.compile(r'<img[^>]*src[=\"\']+([^\"\']*)[\"\'][^>]*>', re.I)
# 使用search()查找匹配的子串,不存在能匹配的子串时将返回None
match = pattern.search('hello world!')
if match:
# 使用Match获得分组信息
print match.group(1)
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询