python3出现utf-8 codec cant decode bytes in position114-115:invalid continuation byte怎么办
展开全部
首先检查文件编码是不是utf-8;
如果是utf-8,检查是否有乱码。
这个错误就是说这两个字节的内容无法按utf-8来解码。
比如一些网站页面有部分乱码的问题存在,去掉相应的字节后就好,我是这么解决的:
def _html(url, decode):
html = urlopen(url).read()()
if not decode:
decode = _testencode(html)
while True:
try:
html = html.decode(decode)
break
except (UnicodeDecodeError,) as e:
html = html[:e.args[2]-1] + html[e.args[3]+1:]
return html
这里except 块里动作就是把相应不能解码的内容丢弃。对应文本文件也可以用类似的方法处理。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询