如何解决用 Beautiful Soup 抓取网页却得到乱码的问题

 我来答

2个回答

#合辑# 机票是越早买越便宜吗？

yangjinlong76

活跃答主

2017-08-04 · 非职业答题人

知道顶级答主

回答量：5.7万

采纳率：94%

帮助的人：1.8亿

我也去答题访问个人页

关注

展开全部

可能编码识别错了，建议创建soup对象时手动把正确的编码传过去,国内的网站编码主要是gb2312和utf8，对于大部分非utf8编码中文网站可以用gb18030通吃 > > > encoding = "gb18030" > > > soup = BeautifulSoup(page, fromEncoding=encoding)

本回答由提问者推荐

已赞过 已踩过<

评论收起

空巷八卦
2017-08-04 · 超过26用户采纳过TA的回答

知道答主

回答量：85

采纳率：0%

帮助的人：23.2万

我也去答题访问个人页

关注

展开全部

1.你贴的python代码，缩进有问题。请自己重新确定代码缩进是正常的，且贴出来正常的代码给我们看。 2.请确保：你代码中所处理的内容，的确是你所截图贴出来的内容 -> 程序抓取出来的内容，有时候未必和你查看网页源码看到的内容是一样的。 3.。

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

如何解决用 Beautiful Soup 抓取网页却得到乱码的问题

其他类似问题

为你推荐：