UTF-8对应汉字是3个字节还是2个字节的相关推荐

 我来答
eexpress
2014-12-15 · TA获得超过884个赞
知道大有可为答主
回答量:1493
采纳率:100%
帮助的人:770万
展开全部
你应该去看
http://zh.wikipedia.org/wiki/UTF-8

UTF-8[编辑]
(重定向自UTF8)
UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,也是一种前缀码。它可以用来表示Unicode标准中的任何字符,且其编码中的第一个字节仍与ASCII兼容,这使得原来处理ASCII字符的软件无须或只须做少部份修改,即可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或发送文字的应用中,优先采用的编码。

UTF-8使用一至六个字节为每个字符编码(尽管如此,2003年11月UTF-8被RFC 3629重新规范,只能使用原来Unicode定义的区域,U+0000到U+10FFFF,也就是说最多4位字节):

128个US-ASCII字符只需一个字节编码(Unicode范围由U+0000至U+007F)。
带有附加符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文及它拿字母则需要两个字节编码(Unicode范围由U+0080至U+07FF)。
其他基本多文种平面(BMP)中的字符(这包含了大部分常用字)使用三个字节编码(Unicode范围由U+0800至U+FFFF)。
其他极少使用的Unicode 辅助平面的字符使用四至六字节编码(Unicode范围由U+10000至U+1FFFFF使用四字节,Unicode范围由U+200000至U+3FFFFFF使用五字节,Unicode范围由U+4000000至U+7FFFFFFF使用六字节)。
对上述提及的第四种字符而言,UTF-8使用四至六个字节来编码似乎太耗费资源了。但UTF-8对所有常用的字符都可以用三个字节表示,而且它的另一种选择,UTF-16编码,对前述的第四种字符同样需要四个字节来编码,所以要决定UTF-8或UTF-16哪种编码比较有效率,还要视所使用的字符的分布范围而定。不过,如果使用一些传统的压缩系统,比如DEFLATE,则这些不同编码系统间的的差异就变得微不足道了。若顾及传统压缩算法在压缩较短文字上的效果不大,可以考虑使用Unicode标准压缩格式(SCSU)。

千万别看百度百科,那上面错误很多。
无名者的世界
2020-04-12 · TA获得超过4309个赞
知道小有建树答主
回答量:1419
采纳率:57%
帮助的人:441万
展开全部

3个字节,网上那种在线中文转utf-8的转换出来的都是2字节的其实是unicode,例如

百度转换为unicode是767E,5EA6

而真正的UTF-8则是E799BE,E5BAA6

不少在线中文转UTF-8转出来的确和unicode一样。所以这种网站是错误的。我给你一转utf-8的网站网页链接

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
eve652723
2014-12-13 · TA获得超过2.4万个赞
知道大有可为答主
回答量:3.2万
采纳率:70%
帮助的人:4581万
展开全部
3个字节,就像按人分东西,在不确定的情况下只能多备
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(1)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式