python urllib2.urlopen(url).read()乱码

url="http://www.google.com/"content=urllib2.urlopen(url).read()printcontent结果如图所示,所有网... url="http://www.google.com/"
content = urllib2.urlopen(url).read()
print content
结果如图所示,所有网页内的内容都是乱码(除了html代码本身)。试了好几个网页都是这样,不知该怎么办?
运行环境是ubuntu 32位,python版本为2.7
展开
 我来答
haokeyy
2011-12-10 · TA获得超过1487个赞
知道小有建树答主
回答量:1002
采纳率:0%
帮助的人:1144万
展开全部
ubuntu 的控制台默认是utf8编码的吧。而且这个google返回的是big5编码吗,用下面的代码解码下试试

url="网址"
content = urllib2.urlopen(url).read()
print content.decode('big5').encode('utf8')
testcrab
2011-12-09 · TA获得超过488个赞
知道小有建树答主
回答量:291
采纳率:0%
帮助的人:248万
展开全部
修改你的编码吧。估计是因为你的shell编码格式和网页编码格式不一致。google应该是UTF8编码。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
Dalio
2011-12-08
知道答主
回答量:16
采纳率:0%
帮助的人:10.4万
展开全部
在python脚本的第二行制定utf-8编码。若还不行,需要先把输入的网页给iconv转编码~
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
jaybestwang
2011-12-08 · TA获得超过4106个赞
知道小有建树答主
回答量:940
采纳率:0%
帮助的人:712万
展开全部
你指定一下编码格式吧,试一下gb2312
文件头加上这句
# -*- coding: gb2312 -*-
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(2)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式