一个汉字的机内码需用几个字节存储？

一个汉字的机内码需用______字节存储？... 一个汉字的机内码需用______字节存储？展开

 我来答

7个回答

#热议# 不吃早饭真的会得胆结石吗？

719270522

高粉答主

2019-06-12 · 说的都是干货，快来关注

知道答主

回答量：147

采纳率：0%

帮助的人：11.3万

我也去答题访问个人页

关注

展开全部

一个汉字的机内码需用2个字节存储。

我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》，代号为GB2312-80，共对6763个汉字和682个图形字符进行了编码，其编码原则为：汉字用两个字节表示。

原则上，两个字节可以表示 256×256=65536 种不同的符号，作为汉字编码表示的基础是可行的。但考虑到汉字编码与其它国际通用编码，如ASCII 西文字符编码的关系，我国国家标准局采用了加以修正的两字节汉字编码方案，只用了两个字节的低7位。

这个方案可以容纳 128×128=16384 种不同的汉字，但为了与标准ASCII码兼容，每个字节中都不能再用32个控制功能码和码值为32的空格以及127的操作码。所以每个字节只能有94个编码。这样，双七位实际能够表示的字数是：94×94=8836个。

扩展资料：

机内码的相关规定：

国家标准局颁布的《信息交换用汉字编码字符集基本集》（代号为GB2312-80）规定的汉字交换码作为国家标准汉字编码。

GB2312-80中共有7445个字符符号：汉字符号6763个一级汉字3755个（按汉语拼音字母顺序排列）二级汉字3008个（按部首笔划顺序排列）非汉字符号682个GB2312-80规定，键盘是当前微机的主要输入设备，输入码就是使用英文键盘输入汉字时的编码。

目前，我国已推出的输入码有数百种，但用户使用较多的约为十几种，按输入码编码的主要依据，大体可分为顺序码、音码、形码、音形码四类，如“保”字，用全拼，输入码为“BAO”，用区位码，输入码为“1703”，用五笔字型则为“WKS”。

参考资料来源：百度百科-机内码

已赞过 已踩过<

评论收起

wooden954
2016-02-04 · TA获得超过1万个赞

知道大有可为答主

回答量：6135

采纳率：93%

帮助的人：805万

我也去答题访问个人页

关注

展开全部

不同的编码方法，对于汉字机内码的存储空间要求是不同的：

GB码
GB码中只有汉字（和一些特殊符号等），它完全占用整个编码空间，使用两个字节作为一个字符的编码。
国家标准局颁布的《信息交换用汉字编码字符集"基本集》（代号为GB2312 80）规定的汉字交换码作为国家标准汉字编码。这个方案可以容纳 128×128=16384 种不同的汉字，但为了与标准ASCII码兼容，每个字节中都不能再用32个控制功能码和码值为32的空格以及127的操作码。
Unicode编码
Unicode有两种标识，Unicode-2使用2个字节表示一个字符。Unicode-4使用4个字节表示一个字符。
Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符，比如汉字"经"的编码是0x7ECF,注意字符码一般用十六进制来表示，为了与十进制区分，十六进制以0x开头，0x7ECF转换成十进制就是32463,UCS-2用两个字节来编码字符，两个字节就是16位二进制， 2的16次方等于65536,所以UCS-2最多能编码65536个字符。编码从0到127的字符与ASCII编码的字符一样，比如字母"a"的Unicode 编码是0x0061,十进制是97,而"a"的ASCII编码是0x61,十进制也是97, 对于汉字的编码，事实上Unicode对汉字支持不怎么好，这也是没办法的，简体和繁体总共有六七万个汉字，而UCS-2最多能表示65536个，才六万多个，所以Unicode只能排除一些几乎不用的汉字，好在常用的简体汉字也不过七千多个，为了能表示所有汉字，Unicode也有UCS-4规范，就是用 4个字节来编码字符。

已赞过 已踩过<

评论收起

听不清啊

高粉答主

推荐于2017-12-16 · 说的都是干货，快来关注

知道顶级答主

回答量：7.8万

采纳率：89%

帮助的人：1.9亿

我也去答题访问个人页

关注

展开全部

中文字符如国标字符集中，GB2312、GB12345、GB13000皆用双字节内码，GB18030（27,533汉字）双字节内码汉字为20,902个，其余6,631个汉字用四字节内码。

汉字内码：ANSI码是单一字节（8位二进制数）的编码集，最多只能表示256个字符，不能表示众多的汉字字符，各个国家和地区在ANSI码的基础上又设计了各种不同的汉字编码集，以能够处理大数量的汉字字符。这些编码使用单字节来表示ANSI的英文字符（即兼容ANSI码），使用双字节来表示汉字字符。由于一个系统中只能有一种汉字内码，不能识别其它汉字内码的字符，造成了交流的不便。
GB码：GB码是1980年国家公布的简体汉字编码方案，在大陆、新加坡得到广泛的使用，也称国标码。国标码对6763个汉字集进行了编码，涵盖了大多数正在使用的汉字。
GBK码：GBK码是GB码的扩展字符编码，对多达2万多的简繁汉字进行了编码，简体版的Win95和Win98都是使用GBK作系统内码。
BIG5码：BIG5码是针对繁体汉字的汉字编码，在台湾、香港的电脑系统中得到普遍应用。
HZ码：HZ码是在Internet上广泛使用的一种汉字编码。
ISO－2022CJK码：ISO－2022是国际标准组织（ISO）为各种语言字符制定的编码标准。采用二个字节编码，其中汉语编码称ISO－2022 CN，日语、韩语的编码分别称JP、KR。一般将三者合称CJK码。CJK码主要在Internet网络中使用。
Unicode码：Unicode码也是一种国际标准编码，采用二个字节编码，与ANSI码不兼容。在网络、Windows系统和很多大型软件中得到应用。

本回答被网友采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

心随心潮
2016-01-14 · 知道合伙人软件行家

心随心潮
知道合伙人软件行家

采纳数：5854 获赞数：45142

毕业后从事网页版面设计美工行业，至今已有四年工作经验。

向TA提问私信TA

关注

展开全部

为了避免ASCII码和国标码同时使用时产生二义性问题
大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。
这样既解决了汉字机内码与西文机内码之间的二义性，又使汉字机内码与国标码具有极简单的对应关系。

已赞过 已踩过<

评论收起

匿名用户
2013-05-25

展开全部

四个字节存储

已赞过 已踩过<

评论收起

更多回答（5）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

编码器，北京飞博尔，

抗振抗强电磁干扰，多种输出接口可选。高可靠性编码器，该角位移传感器是替代光电式编码器和磁编码器的理想产品。

一个汉字的机内码需用几个字节存储？

您可能关注的内容

其他类似问题

为你推荐：