python 爬虫中正则表达式里的pic_ext是什么意思?
跟着一个例子学python爬虫,里面有一个定义的函数:defgetImg(html):reg=r'src="(.+?\.jpg)"pic_ext'imgre=re.com...
跟着一个例子学python爬虫,里面有一个定义的函数:
def getImg(html):
reg = r'src="(.+?\.jpg)" pic_ext'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
return imglist
由于自己想爬的网页和例子不一样,分析了一下后想改正则表达式,但不知道那个pic_ext是什么意思?
我好像知道了!但是我自己改表达式后,为什么getImag返回的结果里面和例子比起来多了src=这个部分,不是单纯的网址? 展开
def getImg(html):
reg = r'src="(.+?\.jpg)" pic_ext'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
return imglist
由于自己想爬的网页和例子不一样,分析了一下后想改正则表达式,但不知道那个pic_ext是什么意思?
我好像知道了!但是我自己改表达式后,为什么getImag返回的结果里面和例子比起来多了src=这个部分,不是单纯的网址? 展开
3个回答
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询