python程序读中文文本时,中文编码错误,怎么解决? 20

出现:UnicodeDecodeError:'gbk'codeccan'tdecodebytesinposition2-3:illegalmultibytesequenc... 出现:UnicodeDecodeError: 'gbk' codec can't decode bytes in position 2-3: illegal multibyte sequence
(谷歌翻译上一句话:的UnicodeDecodeError:“GBK”编码解码器不能解码字节的位置2-3:违法多字节序列)
我的程序开头是这么写的:
#!/usr/bin/env python
# -*- coding: cp936 -*-

读文本的程序如下:
s = open('input.txt')
content = s.read().decode('cp936').encode('utf-8')

麻烦大神帮忙解答下!
展开
 我来答
ai看雪
2015-12-11 · TA获得超过207个赞
知道小有建树答主
回答量:263
采纳率:0%
帮助的人:202万
展开全部
你确定读到的文本是cp936编码么?如果不是你用decode('cp936')肯定就会出错,你可以用chardet模块来检测文本编码,然后再decode
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式