python 爬虫中正则表达式里的pic_ext是什么意思?

跟着一个例子学python爬虫,里面有一个定义的函数:defgetImg(html):reg=r'src="(.+?\.jpg)"pic_ext'imgre=re.com... 跟着一个例子学python爬虫,里面有一个定义的函数:
def getImg(html):
reg = r'src="(.+?\.jpg)" pic_ext'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
return imglist

由于自己想爬的网页和例子不一样,分析了一下后想改正则表达式,但不知道那个pic_ext是什么意思?
我好像知道了!但是我自己改表达式后,为什么getImag返回的结果里面和例子比起来多了src=这个部分,不是单纯的网址?
展开
 我来答
Alfredseng
推荐于2017-11-27
知道答主
回答量:11
采纳率:0%
帮助的人:6.8万
展开全部
reg = r'src="(.+?\.jpg)" pic_ext'

pic_ext 是匹配源里要包含的东西,也就是说源内容一定要以 pic_ext结尾才匹配成功。
正在飞的风筝
2017-10-19
知道答主
回答量:8
采纳率:66%
帮助的人:6883
展开全部

pic_ext只是单纯的匹配后面固定的字符

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
657929492
2015-06-05 · TA获得超过380个赞
知道小有建树答主
回答量:497
采纳率:33%
帮助的人:321万
展开全部
可能你的小括号没有放对。如果小括号放对了话应该是单纯的网址。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(1)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式