python 3.x 编码问题 10
默认情况下,3.x源码文件都是UTF-8编码,字符串都是Unicode字符。这句话很难搞懂“源码文件都是UTF-8编码”容易理解,但“字符串都是Unicode字符”就不太...
默认情况下,3.x 源码文件都是 UTF-8 编码,字符串都是 Unicode 字符。
这句话很难搞懂 “ 源码文件都是 UTF-8 编码”容易理解,但 “字符串都是 Unicode 字符”就不太懂,难道 字符串不是 源码的一部分吗?既然源码以UTF-8保存,为什么源码中的字符串却是Unicode 展开
这句话很难搞懂 “ 源码文件都是 UTF-8 编码”容易理解,但 “字符串都是 Unicode 字符”就不太懂,难道 字符串不是 源码的一部分吗?既然源码以UTF-8保存,为什么源码中的字符串却是Unicode 展开
1个回答
展开全部
你好,简单来说unicode是字符集,然后utf8是编码的规则,utf8支持多种字符集,unicode只是其中的一种所以需要明确的说明。
下面是unicode的更多的信息:
首先世界上语言很多,不同语言的编码不一样,解码的结果也不同。而unicode的编号从0一直算到了100多万(三个字节)。每一个区间都对应着一种语言的编码。目前几乎收纳了全世界大部分的字符。所有的字符都有唯一的编号,这就解决了解码的冲突。但是,unicode把大家都归纳进来,却没有为编码的二进制传输和二进制解码做出规定。
下面是unicode的更多的信息:
首先世界上语言很多,不同语言的编码不一样,解码的结果也不同。而unicode的编号从0一直算到了100多万(三个字节)。每一个区间都对应着一种语言的编码。目前几乎收纳了全世界大部分的字符。所有的字符都有唯一的编号,这就解决了解码的冲突。但是,unicode把大家都归纳进来,却没有为编码的二进制传输和二进制解码做出规定。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询