python3出现utf-8 codec cant decode bytes in position114-115:invalid continuation byte怎么办

 我来答
雁西楼
科技发烧友

2018-10-31 · 有一些普通的科技小锦囊
知道小有建树答主
回答量:1118
采纳率:73%
帮助的人:402万
展开全部

首先检查文件编码是不是utf-8;

如果是utf-8,检查是否有乱码

这个错误就是说这两个字节的内容无法按utf-8来解码。

比如一些网站页面有部分乱码的问题存在,去掉相应的字节后就好,我是这么解决的:

def _html(url, decode):
    html = urlopen(url).read()()
    if not decode:
        decode = _testencode(html)
    while True:
        try:
            html = html.decode(decode)
            break
        except (UnicodeDecodeError,) as e:
            html = html[:e.args[2]-1] + html[e.args[3]+1:]
    return html

这里except 块里动作就是把相应不能解码的内容丢弃。对应文本文件也可以用类似的方法处理。

推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式