计算机字符编码中GBK GB2312 GB18030有什么区别 谁包含的东西多?谁更早?
1、GBK和GB2312 都是16位的。
2、GBK支持简体中文和繁体中文,而GB2312只支持简体中文,GBK里面包含了GB2312,用GBK比较多。
3、GB18030是32位的,它支持简体中文、繁体中文 藏文、蒙文、维吾尔文等主要的少数民族文字,包含GBK和GB2312。
4、从GB2312(1980年)、GBK(1995年)到GB18030(2000年),这些编码方法是向下兼容的。
扩展资料
GB2312收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。
其中包括6763个汉字,其中一级汉字3755个,二级汉字3008个;包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。
GB2312中对所收汉字进行了“分区”处理,每区含有94个汉字/符号。这种表示方式也称为区位码。
它是用双字节表示的,两个字节中前面的字节为第一字节,后面的字节为第二字节。习惯上称第一字节为“高字节” ,而称第二字节为“低字节”。“高位字节”使用了0xA1-0xF7(把01-87区的区号加上0xA0),“低位字节”使用了0xA1-0xFE(把01-94加上0xA0)。
以GB2312字符集的第一个汉字“啊”字为例,它的区号16,位号01,则区位码是1601,在大多数计算机程序中,高字节和低字节分别加0xA0得到程序的汉字处理编码0xB0A1。计算公式是:0xB0=0xA0+16, 0xA1=0xA0+1。
参考资料来源:百度百科-计算机编码
1、GBK和GB2312 都是16位的。
2、GBK支持简体中文和繁体中文,而GB2312只支持简体中文,GBK里面包含了GB2312,用GBK比较多。
3、GB18030是32位的,它支持简体中文、繁体中文 藏文、蒙文、维吾尔文等主要的少数民族文字,包含GBK和GB2312。
4、从GB2312(1980年)、GBK(1995年)到GB18030(2000年),这些编码方法是向下兼容的。
扩展资料
GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。
基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码。
把换算成十六进制的区位码加上2020H,就得到国标码。国标码加上8080H,就得到常用的计算机机内码。1995年又颁布了《汉字编码扩展规范》(GBK)。
GBK与GB 2312—1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC10646—1和GB 13000—1的全部中、日、韩(CJK)汉字,共计20902字。
参考资料来源:百度百科-信息交换用汉字编码字符集