python爬虫抓下来的网页，中间的中文乱码怎么解决

 我来答

2个回答

#热议# 应届生在签三方时要注意什么？

就烦条0o
2016-03-22 · 知道合伙人软件行家

就烦条0o
知道合伙人软件行家

采纳数：33315 获赞数：46492

从事多年系统运维，喜欢编写各种小程序和脚本。

向TA提问私信TA

关注

展开全部

Python写程序原则是所有进来的字符串(读文件，爬网页)，一进来就decode，处理完之后在要输出的地方在encode。题主读入(read)和输出(print)在一行里，要在win下面想不出错就这么写
print response.decode('utf-8').encode('gbk')

本回答由提问者推荐

已赞过 已踩过<

评论收起

结果id
2018-03-11

知道答主

回答量：1

采纳率：0%

帮助的人：895

我也去答题访问个人页

关注

展开全部

假如你使用的是requests的库。
response = requests.get(url,headers = headers)# url是你想抓的网站

然后使用语句response.encoding = 'utf-8'('gbk') # 这个视你的网页的源代码的charset格式决定
然后就随便使用吧，不会出现那种16进制的字节码了。

已赞过 已踩过<

评论收起

1条折叠回答

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python爬虫抓下来的网页，中间的中文乱码怎么解决

其他类似问题

为你推荐：