python爬虫抓下来的网页,中间的中文乱码怎么解决

 我来答
就烦条0o
2016-03-22 · 知道合伙人软件行家
就烦条0o
知道合伙人软件行家
采纳数:33315 获赞数:46492
从事多年系统运维,喜欢编写各种小程序和脚本。

向TA提问 私信TA
展开全部
Python写程序原则是所有进来的字符串(读文件,爬网页),一进来就decode,处理完之后在要输出的地方在encode。题主读入(read)和输出(print)在一行里,要在win下面想不出错就这么写
print response.decode('utf-8').encode('gbk')
结果id
2018-03-11
知道答主
回答量:1
采纳率:0%
帮助的人:895
展开全部
假如你使用的是requests的库。
response = requests.get(url,headers = headers)# url是你想抓的网站

然后使用语句response.encoding = 'utf-8'('gbk') # 这个视你的网页的源代码的charset格式决定
然后就随便使用吧,不会出现那种16进制的字节码了。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 1条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式