utf8是等长编码吗

 我来答
小科技大不同
高能答主

2021-12-06 · 把复杂的事情简单说给你听
知道小有建树答主
回答量:3495
采纳率:98%
帮助的人:98.4万
展开全部

utf8不是等长编码。

UTF-8码是一种字符集,是分配整数给字符的编码表,将文本存储为2个或4个字节序列的串,可以最多到6个字节长,所以是不等长编码。

特性

UCS字符U+0000到U+007F(ASCII)被编码为字节0x00到0x7F(ASCII兼容)。这意味着只包含7位ASCII字符的文件在ASCII和UTF-8两种编码方式下是一样的。

所有>U+007F的UCS字符被编码为一个多个字节的串,每个字节都有标记位集。因此,ASCⅡ字节(0x00-0x7F)不可能作为任何其他字符的一部分。

表示非ASCⅡ字符的多字节串的第一个字节总是在0xC0到0xFD的范围里,并指出这个字符包含多少个字节。多字节串的其余字节都在0x80到0xBF范围里。这使得重新同步非常容易,并使编码无国界,且很少受丢失字节的影响。

推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式