unicode是两个字节,2^16=65536,为什么能编码所以汉字呢?
如题。我相信汉字觉得超过6万的。看有些书说unicode能编码全世界的语言,怎么可能呢?求解!...
如题。我相信汉字觉得超过6万的。
看有些书说unicode能编码全世界的语言,怎么可能呢?
求解! 展开
看有些书说unicode能编码全世界的语言,怎么可能呢?
求解! 展开
3个回答
展开全部
之所以能编码全世界的语言是因为unicode码没有把所有语言的全部组成部分收入编码,对于一些语言,如汉字,只是收录了一步分常用的汉字罢了。或许汉字真的有6万多,但是,因为常用的汉字没有6万多,貌似只有几千个,以前有做过统计(貌似是从报纸上一个一个算,大概算了2万多个汉字),大概5000个常用的汉字就占了所有汉字的使用量的90%(具体是多少我也不清楚了)。
况且,我国本身的GB码(国标码)都没有把全部汉字收录,更何况unicode码。
其实书上说的话多少有些夸张了,顶多是基本上把全部语言收录了,只要不误解就行了。。。
话说,语言是不断变化的,2个字节也迟早不够用的了。
况且,我国本身的GB码(国标码)都没有把全部汉字收录,更何况unicode码。
其实书上说的话多少有些夸张了,顶多是基本上把全部语言收录了,只要不误解就行了。。。
话说,语言是不断变化的,2个字节也迟早不够用的了。
追问
现在电脑用的unicode还是2字节吗?
追答
现在常用的是2个字节的,貌似unicode码有几种字符集,有的是2个字节,有的是4个字节。而且在某些版本下,汉字是3个字节的。。。其实我也不太懂,不过现在用的最多的是2个字节的unicode码,这个可以确定。一般电脑的话,当然啊也是咯
展开全部
unicode16是两个字节,可以用代理对来映射四字节空间,UTF-16 中采用的这种设计方法分配 1,024 值给 16 位高代理(high surrogate),将另外的 1,024 值分配给 16 位低代理(low surrogate)。它使用一个高代理加上一个低代理 — 一个代理对(surrogate pair) — 来表示 65,536 (0x10000) 和 1,114,111 (0x10FFFF) 之间的 1,048,576 (0x100000) 值(1,024 和 1,024 的乘积)。
unicode32能编码四个字节汉字
unicode32能编码四个字节汉字
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
有心人啊, unicode包括UCS-4, 是4字节的,这样就够了。
追问
但是我发现书上大都说2字节。现在电脑用的unicode也是2字节吧?
追答
Windows只支持单字节和双字节内码,可以认为其unicode是2字节。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询