计算机的汉字编码是如何实现的?
在输入汉字时使用英文ASCII码,
在输出汉字时使用双字节中文码。
计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。汉字交换码(国标码)主要用于汉字信息交换,《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码。
国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,国标码是不可能在计算机内部直接采用的,于是,汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变。
扩展资料:
汉字由两个字节表示。原则上,两个字节可以表示256×256=65536个不同的符号,作为汉字编码表示的基础是可行的。
但是,考虑到中文字符编码与ASCII西方字符编码等国际通用编码之间的关系,中国国家标准局采用了一种改进的双字节中文字符编码方案,仅使用两个字节的低7位。
该方案可容纳128×128=16,384个不同的汉字,但为了与标准ASCII码兼容,每个字节不能再使用32个控制功能码、32个带码值的空格和127个操作码。
所以每个字节只能有94个编码。这样,双七位数实际能表示的单词数为:94×94=8836。
参考资料来源:百度百科——内码