python gbk 编码:'gbk'codec can't decode byte 0x81 in position 18 5

UnicodeDecodeError:'gbk'codeccan'tdecodebyte0x81inposition18:illegalmultibytesequen。我... UnicodeDecodeError:'gbk'codec can't decode byte 0x81 in position 18:illegal multibyte sequen。我尝试着从一个word 文档中读取文字结果就出现这种情况。。。怎么解决啊求高手指导展开

 我来答

4个回答

#合辑# 机票是越早买越便宜吗？

梦回0梦里
2018-03-31 · TA获得超过8958个赞

知道小有建树答主

回答量：54

采纳率：0%

帮助的人：9024

我也去答题访问个人页

关注

展开全部

是因为python实现爬虫遇到编码问题：error：UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX。具体解决办法：

改变标准输出，添加代码。

1、str转bytes叫encode，bytes转str叫decode。

2、常用的中文编码名称

已赞过 已踩过<

评论收起

matlab2000
2013-01-30 · TA获得超过2321个赞

知道大有可为答主

回答量：1678

采纳率：100%

帮助的人：1040万

我也去答题访问个人页

关注

展开全部

“xxx”.decode('gbk')就可以了。你的可以是 eachline.decode('gbk')
不过word文档是有结构的二进制文件，并非文本文件，最好用com接口操纵，你这种处理方法是错误的

追问

麻烦棒我改下可以吗？刚开始学，有很多东西还不懂。。。谢谢了。。。。

本回答被网友采纳

已赞过 已踩过<

评论收起

飞雪踏红尘
2019-06-05 · TA获得超过132个赞

知道答主

回答量：26

采纳率：0%

帮助的人：2.1万

我也去答题访问个人页

关注

展开全部

python3
打开文件：
openfile = open(filename,'r',encoding = 'utf-8')

已赞过 已踩过<

评论收起

匿名用户
2013-01-30

展开全部

.decode('gbk','ignore')

追问

python3.3里好像有没有string.decode()这个内建方法了吧？？
filename = open('hello.docx','r')
for eachline in filename:
    print(eachline)

已赞过 已踩过<

评论收起

更多回答（2）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

为你推荐：

下载百度知道APP，抢鲜体验

使用百度知道APP，立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。

扫描二维码下载

×

个人、企业类侵权投诉
违法有害信息,请在下方选择后提交

类别

色情低俗
涉嫌违法犯罪
时政信息不实
垃圾广告
低质灌水

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交

取消

辅助

模式