python utf8 gbk 编码问题

当用百度搜索待解析网页时url为http://www.baidu.com/baidu?word=%E5%BE%85%E8%A7%A3%E6%9E%90%E7%BD%91%... 当用百度搜索待解析网页时url为http://www.baidu.com/baidu?word=%E5%BE%85%E8%A7%A3%E6%9E%90%E7%BD%91%E9%A1%B5&ie=utf-8 而用python编码时
>>> '待解析网页'.decode('gbk').encode('utf-8')
'\xe5\xbe\x85\xe8\xa7\xa3\xe6\x9e\x90\xe7\xbd\x91\xe9\xa1\xb5'
而且百度那个编码在python里也不能识别,有一点倒是可以看出来,python转码跟上面区别就是\x代替了%还有字母都小写了.那写程序应该怎么处理呢?自己手动转化么? 展开

 我来答

1个回答

#热议# 什么是淋病？哪些行为会感染淋病？

heycn
推荐于2016-10-18 · TA获得超过100个赞

知道答主

回答量：78

采纳率：0%

帮助的人：58.7万

我也去答题访问个人页

关注

展开全部

你是不是想在python里把中文变成链接中%E5%BE%85这种形式？直接用urllib.urlencode({'word':'中文'})方法
而显示\xe5\xbe\x85\是因为你没有使用read()方法，加上后变成：'待解析网页'.decode('gbk').encode('utf-8').read()，就是你熟悉的中文了。
不过，'待解析网页'.decode('gbk').encode('utf-8')这句我要吐槽一下，网页明显是utf-8编码，你在文件开头声明utf-8编码就可以了，这一句是多余的。在这基础上读取网页直接用 '待解析网页'.read()

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python utf8 gbk 编码问题

其他类似问题

为你推荐：