unicode是两个字节,2^16=65536,为什么能编码所以汉字呢?

如题。我相信汉字觉得超过6万的。看有些书说unicode能编码全世界的语言,怎么可能呢?求解!... 如题。我相信汉字觉得超过6万的。
看有些书说unicode能编码全世界的语言,怎么可能呢?
求解!
展开
 我来答
百度网友2a208e92a
2011-02-24 · TA获得超过452个赞
知道小有建树答主
回答量:198
采纳率:0%
帮助的人:213万
展开全部
之所以能编码全世界的语言是因为unicode码没有把所有语言的全部组成部分收入编码,对于一些语言,如汉字,只是收录了一步分常用的汉字罢了。或许汉字真的有6万多,但是,因为常用的汉字没有6万多,貌似只有几千个,以前有做过统计(貌似是从报纸上一个一个算,大概算了2万多个汉字),大概5000个常用的汉字就占了所有汉字的使用量的90%(具体是多少我也不清楚了)。
况且,我国本身的GB码(国标码)都没有把全部汉字收录,更何况unicode码。
其实书上说的话多少有些夸张了,顶多是基本上把全部语言收录了,只要不误解就行了。。。
话说,语言是不断变化的,2个字节也迟早不够用的了。
追问
现在电脑用的unicode还是2字节吗?
追答
现在常用的是2个字节的,貌似unicode码有几种字符集,有的是2个字节,有的是4个字节。而且在某些版本下,汉字是3个字节的。。。其实我也不太懂,不过现在用的最多的是2个字节的unicode码,这个可以确定。一般电脑的话,当然啊也是咯
探索3000
2011-02-24 · 探索世界,探索人生,追求无止境
探索3000
采纳数:66 获赞数:221

向TA提问 私信TA
展开全部
unicode16是两个字节,可以用代理对来映射四字节空间,UTF-16 中采用的这种设计方法分配 1,024 值给 16 位高代理(high surrogate),将另外的 1,024 值分配给 16 位低代理(low surrogate)。它使用一个高代理加上一个低代理 — 一个代理对(surrogate pair) — 来表示 65,536 (0x10000) 和 1,114,111 (0x10FFFF) 之间的 1,048,576 (0x100000) 值(1,024 和 1,024 的乘积)。

unicode32能编码四个字节汉字
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
thatsrightsir
2011-02-24
知道答主
回答量:10
采纳率:0%
帮助的人:0
展开全部
有心人啊, unicode包括UCS-4, 是4字节的,这样就够了。
追问
但是我发现书上大都说2字节。现在电脑用的unicode也是2字节吧?
追答
Windows只支持单字节和双字节内码,可以认为其unicode是2字节。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(1)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式