python urllib2.urlopen(url).read()乱码
url="http://www.google.com/"content=urllib2.urlopen(url).read()printcontent结果如图所示,所有网...
url="http://www.google.com/"
content = urllib2.urlopen(url).read()
print content
结果如图所示,所有网页内的内容都是乱码(除了html代码本身)。试了好几个网页都是这样,不知该怎么办?
运行环境是ubuntu 32位,python版本为2.7 展开
content = urllib2.urlopen(url).read()
print content
结果如图所示,所有网页内的内容都是乱码(除了html代码本身)。试了好几个网页都是这样,不知该怎么办?
运行环境是ubuntu 32位,python版本为2.7 展开
4个回答
展开全部
修改你的编码吧。估计是因为你的shell编码格式和网页编码格式不一致。google应该是UTF8编码。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
在python脚本的第二行制定utf-8编码。若还不行,需要先把输入的网页给iconv转编码~
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
你指定一下编码格式吧,试一下gb2312
文件头加上这句
# -*- coding: gb2312 -*-
文件头加上这句
# -*- coding: gb2312 -*-
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询