python utf8 gbk 编码问题

当用百度搜索待解析网页时url为http://www.baidu.com/baidu?word=%E5%BE%85%E8%A7%A3%E6%9E%90%E7%BD%91%... 当用百度搜索 待解析网页时url为http://www.baidu.com/baidu?word=%E5%BE%85%E8%A7%A3%E6%9E%90%E7%BD%91%E9%A1%B5&ie=utf-8 而用python编码时
>>> '待解析网页'.decode('gbk').encode('utf-8')
'\xe5\xbe\x85\xe8\xa7\xa3\xe6\x9e\x90\xe7\xbd\x91\xe9\xa1\xb5'
而且百度那个编码在python里也不能识别,有一点倒是可以看出来,python转码跟上面区别就是\x代替了%还有字母都小写了.那写程序应该怎么处理呢?自己手动转化么?
展开
 我来答
heycn
推荐于2016-10-18 · TA获得超过100个赞
知道答主
回答量:78
采纳率:0%
帮助的人:58.7万
展开全部
你是不是想在python里把中文变成链接中%E5%BE%85这种形式?直接用urllib.urlencode({'word':'中文'})方法
而显示\xe5\xbe\x85\是因为你没有使用read()方法,加上后变成:'待解析网页'.decode('gbk').encode('utf-8').read(),就是你熟悉的中文了。
不过,'待解析网页'.decode('gbk').encode('utf-8')这句我要吐槽一下,网页明显是utf-8编码,你在文件开头声明utf-8编码就可以了,这一句是多余的。在这基础上读取网页直接用 '待解析网页'.read()
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式