
python lxml,中文乱码
printlxml.etree.tostring(dom)<ahref="..."target="_blank"title="±Ê¼...
print lxml.etree.tostring(dom)
<a href="..." target="_blank" title="±Ê¼Ç±¾">±Ê¼Ç±¾</a>
源代码:
<a title="笔记本" target="_blank" href="...">笔记本</a>
这是什么“±Ê¼Ç±¾”,怎么转成正常中文呢
\&\#\x\B\1\;
这是在每个字符前加反斜杠,百度这把原来的字符转成那个了。。。 展开
<a href="..." target="_blank" title="±Ê¼Ç±¾">±Ê¼Ç±¾</a>
源代码:
<a title="笔记本" target="_blank" href="...">笔记本</a>
这是什么“±Ê¼Ç±¾”,怎么转成正常中文呢
\&\#\x\B\1\;
这是在每个字符前加反斜杠,百度这把原来的字符转成那个了。。。 展开
3个回答
展开全部
有一个万能转码的模块,会自动识别并转换,chardet
import chardet
def smartcode(stream):
____ustring = stream
____codedetect = chardet.detect(ustring)["encoding"]
____print codedetect
____try:
________print ustring
________ustring = unicode(ustring, codedetect)
________print ustring
________return "%s %s %s" % (" ",ustring.encode('utf8'))
____except:
________return u"bad unicode encode try!"
你可以百度一下.下载一个试试
import chardet
def smartcode(stream):
____ustring = stream
____codedetect = chardet.detect(ustring)["encoding"]
____print codedetect
____try:
________print ustring
________ustring = unicode(ustring, codedetect)
________print ustring
________return "%s %s %s" % (" ",ustring.encode('utf8'))
____except:
________return u"bad unicode encode try!"
你可以百度一下.下载一个试试
本回答被提问者和网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
优质机构答主
2021-03-24 · 百度认证:广东太平洋互联网信息服务有限公司官方账号,优质数码...
关注

展开全部
解压文件出现中文乱码怎么办解决办法
华为Mate50 Pro曲面旗舰手机
¥6799
苹果 AirPods Pro 2代
¥1699
索尼65英寸4K HDR专业游戏电视
¥7499
惠普战66五代15.6英寸轻薄本
¥4399
查
看
更
多
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
在你用的库的py文件和你的源文件第一行均加上 # -*- coding: utf-8 -*- 试试。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询