Python爬虫爬取图片这个报错怎么处理? 10

代码及报错截图:请大佬解决!... 代码及报错截图:请大佬解决! 展开
 我来答
匿名用户
2018-03-02
展开全部

你好!你的错误原因在于html页面获取到的img标签src属性中的链接,可能是因为src中的url格式是这样的:

<img src="//hao123.com/xxx/xxx/xxx/"></img>

这样获取到的链接都没有带上协议:http或者https。而导致程序抛出ValueError的错误异常。

因为正常的url格式应该类似这样的:https://www.baidu.com/

即 协议://用户名:密码@子域名.域名.顶级域名:端口号/目录/文件名.文件后缀?参数=值#标志

参考网页链接

可将代码中第一个for循环中download_links.append修改为:

for pic_tag in soup.find_all('img'):
    pic_link = pic_tag.get('src')
    download_links.append('http:' + pic_link)
heptnaol
2018-03-02 · TA获得超过7263个赞
知道大有可为答主
回答量:7120
采纳率:78%
帮助的人:1823万
展开全部
处理url的时候把http这一节错误处理给删掉了,问题不在这行
追问
什么意思啊?刚刚开始学不太懂,怎么改?谢谢了!
追答
没有代码怎么改
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式