一个简单的python爬虫出现问题,求解 50

这是我仿照人家的代码写的一个百度贴吧图片爬虫用的python3.4但是运行出现很多问题,麻烦帮忙改一下。并且怎么去存到一个具体文件夹中。importurllib.requ... 这是我仿照人家的代码写的一个百度贴吧图片爬虫
用的python3.4
但是运行出现很多问题,麻烦帮忙改一下。并且怎么去存到一个具体文件夹中。

import urllib.request
import re

def gethtml(url):
page = urllib.request.urlopen(url)
html = page.read()
return html
def getimg(html):
reg = r'src=(.+?\.jpg)'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
x = 0
print('下载一张图片')
for imgurl in imglist:
urllib.request.urlretrieve(imgurl,'%s.jpg' % x)
x+=1
html = gethtml("http://tieba.baidu.com/p/3861692918")
html = html.decode('utf-8')
print(getimg(html))
print(x)

结果如下图所示:
展开
 我来答
heptnaol
2015-07-28 · TA获得超过7261个赞
知道大有可为答主
回答量:7120
采纳率:78%
帮助的人:1804万
展开全部
<img src=""/>这种img标签解析错误了,正则式需要改进
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
微笑妙音乐
2016-12-26
知道答主
回答量:3
采纳率:0%
帮助的人:2923
展开全部
reg = r'src="(.*?\.jpg\?.*?)"'
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式