python gbk 编码:'gbk'codec can't decode byte 0x81 in position 18 5

UnicodeDecodeError:'gbk'codeccan'tdecodebyte0x81inposition18:illegalmultibytesequen。我... UnicodeDecodeError:'gbk'codec can't decode byte 0x81 in position 18:illegal multibyte sequen。我尝试着从一个word 文档中读取文字 结果就出现这种情况。。。怎么解决啊 求高手指导 展开
 我来答
梦回0梦里
2018-03-31 · TA获得超过8958个赞
知道小有建树答主
回答量:54
采纳率:0%
帮助的人:9981
展开全部

是因为python实现爬虫遇到编码问题:error:UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX。具体解决办法:

改变标准输出,添加代码。

1、str转bytes叫encode,bytes转str叫decode。

2、常用的中文编码名称

matlab2000
2013-01-30 · TA获得超过2323个赞
知道大有可为答主
回答量:1678
采纳率:100%
帮助的人:1056万
展开全部
“xxx”.decode('gbk')就可以了。你的可以是 eachline.decode('gbk')
不过word文档是有结构的二进制文件,并非文本文件,最好用com接口操纵,你这种处理方法是错误的
追问
麻烦棒我改下可以吗?刚开始学,有很多东西还不懂。。。谢谢了。。。。
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
飞雪踏红尘
2019-06-05 · TA获得超过132个赞
知道答主
回答量:26
采纳率:0%
帮助的人:2.2万
展开全部
python3
打开文件:
openfile = open(filename,'r',encoding = 'utf-8')
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
匿名用户
2013-01-30
展开全部
.decode('gbk','ignore')
追问
python3.3里好像有没有string.decode()这个内建方法了吧??
filename = open('hello.docx','r')
for eachline in filename:
print(eachline)
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(2)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式