Python2.7 中文字符编码,使用Unicode时,选择什么编码格式
1个回答
展开全部
什么编码格式都可以,unicode是自己特定的格式,是字符串str解码decode之后生成的,也就是说,不存在说unicode中文是什么编码的问题。(因为都已经解码了)
只有转成str时,将unicode中文encode的时候会选择一种编码格式进行编码,默认是使用系统编码格式,为了统一一般都是是手动使用utf8格式。
而str字符串要转成unicode解码时,decode时也要根据str字符串本身的编码格式选择对应的编码格式进行解码,比如原来是gb2312的str,解码时也要选择gb2312进行decode,才能正常的转化为unicode
只有转成str时,将unicode中文encode的时候会选择一种编码格式进行编码,默认是使用系统编码格式,为了统一一般都是是手动使用utf8格式。
而str字符串要转成unicode解码时,decode时也要根据str字符串本身的编码格式选择对应的编码格式进行解码,比如原来是gb2312的str,解码时也要选择gb2312进行decode,才能正常的转化为unicode
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询