python3 新手一枚,运用Python3.4.1爬网页,网易的机器学习网页,报Unicodedecodeerror,该网页是utf-8.

如上面说明,附上代码和报错,望高人指点一二,新手。importurllib.requesthtml=re.read()print(html)html=html.decod... 如上面说明,附上代码和报错,望高人指点一二,新手。import urllib.requesthtml=re.read()print(html)html=html.decode('utf-8')报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb8 in position 776: invalid start byte
由于上传链接发不出问题,所以re=urllib.request.urlopen('')第二行代码放在下面图片格式显示了,谢谢大家的解答。
展开
 我来答
卑躬屈膝的人生
2016-11-04 · 超过27用户采纳过TA的回答
知道答主
回答量:102
采纳率:0%
帮助的人:38.8万
展开全部

童鞋,网页不是utf-8编码的。

http头也说不是utf-8的

gbk的,用gb18030编码试试,如下:

至此,完全显示正确。

推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式