Python中用BeautifulSoup解析中文网页里的中文都是乱码，怎么回事

 我来答

1个回答

#热议# 应届生在签三方时要注意什么？

从空去听8
2017-06-11 · TA获得超过7441个赞

知道大有可为答主

回答量：6907

采纳率：93%

帮助的人：5614万

我也去答题访问个人页

关注

展开全部

print一个对象的逻辑：内部是调用对象的__str__得到对应的字符串的，此处对应的是soup的__str__ 而针对于soup本身，其实已经是Unicode编码，所以可以通过指定__str__输出时的编码为GBK，以使得此处正确显示非乱码的中文
而对于cmd：（中文的系统中）编码为GBK,所以只要重新编码为gb18030就可以正常输出了
就是下面这行代码

print (soup.title).encode('gb18030')

本回答由提问者推荐

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

Python中用BeautifulSoup解析中文网页里的中文都是乱码，怎么回事

其他类似问题

为你推荐：