如何解决用 Beautiful Soup 抓取网页却得到乱码的问题

 我来答
折柳成萌
高粉答主

2017-09-20 · 繁杂信息太多,你要学会辨别
知道顶级答主
回答量:4.4万
采纳率:96%
帮助的人:6317万
展开全部
可能编码识别错了,建议创建soup对象时手动把正确的编码传过去,国内的网站编码主要是gb2312和utf8,对于大部分非utf8编码中文网站可以用gb18030通吃 > > > encoding = "gb18030" > > > soup = BeautifulSoup(page, fromEncoding=encoding)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式