请问unicode和UTF-8之间的关系是什么?
我在网上看到了说UTF-8是unicode的一种实现,是不是说实际存储的时候不存在unicode?而是UTF-8?但好像不对。。。为什么有UTF-8到unicode的转换...
我在网上看到了说UTF-8是unicode的一种实现,是不是说实际存储的时候不存在unicode?而是UTF-8?但好像不对。。。为什么有UTF-8到unicode的转换的说法。。。还有unicode全部字符用两字节表示,而UTF-8英文字母用一个字节,汉字三个字节(没错?),跟本就不一样,为什么还说是一种实现。。。。求高手用更通俗的话解释一下。
展开
2个回答
展开全部
unicode是一种定义,它定义了每个字符对应的code point,也就是码点,或者说对应的数字。
实际存储有unicode16,unicode 32,UTF-7,UTF-8等等编码形式的。
他们都是unicode定义的一种变形~~~有规律的变形形式,所以可以转换。
为什么变形?是为了满足一些实际需要。
比如为什么有UTF-8?因为unicode定义里每个字符都占用两个字节,
而英数字其实一个字节就够了,另外一个字节是白白浪费的。
所以,变形出了UTF-8编码形式。英数字还用一个字节,汉字用3个字节~~
有个转换对应表,看下就明白了。
实际存储有unicode16,unicode 32,UTF-7,UTF-8等等编码形式的。
他们都是unicode定义的一种变形~~~有规律的变形形式,所以可以转换。
为什么变形?是为了满足一些实际需要。
比如为什么有UTF-8?因为unicode定义里每个字符都占用两个字节,
而英数字其实一个字节就够了,另外一个字节是白白浪费的。
所以,变形出了UTF-8编码形式。英数字还用一个字节,汉字用3个字节~~
有个转换对应表,看下就明白了。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询