python中一个很长的字符串text,直接在解释器里打text输出的和print text输出的结果不一样.

text是我抓取的网页,里面有中文。想分析一下结果各种乱码。而且printtext输出的非常好,但是直接输入text就会有乱码,或者是什么编码啊,不懂。为什么会这样呢?而... text是我抓取的网页,里面有中文。想分析一下结果各种乱码。而且print text 输出的非常好,但是直接输入text就会有乱码,或者是什么编码啊,不懂。为什么会这样呢?

而且处理过程中会出现各种意外的好好的中文便乱的现象。

网页文件(就是我抓取的存入text中的字符)是gb2312编码,我用的ubuntu系统,python2.7.3
过程中百度谷歌总是找不到特别明白的解答。望大神们救济。
展开
 我来答
fujianwei2010
2019-04-11
知道答主
回答量:34
采纳率:50%
帮助的人:8.2万
展开全部
直接在python解释器中输入text代表的是获取该text的字节码,比如你输入a='中文',你输入a返回的结果是:'\xe4\xb8\xad\xe6\x96\x87' 这个就是中文对应的utf8字节码,使用print a 会返回中文是对字节码进行了编码操作所以人类能读懂.
hliang79
2013-12-06 · 超过16用户采纳过TA的回答
知道答主
回答量:26
采纳率:0%
帮助的人:36.1万
展开全部
你的描述我看的不是很明白,所以也知道怎么回答。
我想网页编码无非就是gb2312(gbk)和utf8
python的话有些库会用unicode处理,需要转化
能否给出代码片段或者抓取网页的网址看看
本回答被提问者采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式