汉字的国家标准的编码原则是一个汉字用一个字节表示
汉字的国家标准的编码原则是一个汉字用一个字节表示。这句话是错误的。
汉字国标码,创建于1980年,目的为了使每个汉字有一个全国统一的代码而颁布了汉字编码的国家标准。每个汉字有个二进制编码,叫汉字国标码。 在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码。每个汉字使用2个字节。
GB2312-80 GB2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(20H)。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。
GB2312将收录的汉字分成两级:第一级是常用汉字计 3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。故而 GB2312最多能表示6763个汉字。
汉字编码国家标准,分为双字节部分和四字节部分,而双字节部分和GBK基本完全相同,四字节部分到目前为止,比GBK多了6582个汉字。现有汉字编码:GB2312至1980是信息交换用汉字编码字符集基本集,GBK1995为汉字内码扩展规范,GB130001至1993即为信息技术,通用则为多八位编码字符集。