python报错UnicodeDecodeError

我想读取一下TXT文件的单词数,但出现了这种问题文档是英文版的... 我想读取一下TXT文件的单词数,但出现了这种问题文档是英文版的展开





 我来答

1个回答

#热议# 为什么有人显老，有人显年轻？

不醒浮生梦
2017-10-10 · TA获得超过139个赞

知道小有建树答主

回答量：141

采纳率：100%

帮助的人：94.6万

我也去答题访问个人页

关注

展开全部

python的中文编码比较容易采坑，主要有一下几个注意点：

明确读取的是什么编码格式的输入 gb18030，还是utf-8,，如果不是从文件中来，而是代码内的中文字符，最好直接 u'中文'，将编码变为 unicode
操作的时候，注意各种字符串的编码方式匹配，可以都转为unicode以统一处理，string.decode('gb18030') 可以把 gb18030编码转换为 unicode编码
输出时，明确最终的输出格式是什么，从而采用正确的 encode 方式进行编码
至于json，在load的时候，注意设定编码方式， json.loads(str, encoding='gb18030') 或者 utf-8

如果按照这个原则解决不了，可以考虑贴代码

本回答由提问者推荐

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python报错UnicodeDecodeError

其他类似问题

为你推荐：