UTF-8 GBK UTF8 GB2312 Unicode 之间的区别和关系
一、主体不同
1、UTF-8 GBK :中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式。
2、UTF8 GB2312: 是基于 1980 年发布的《信息交换用汉字编码字符集基本集》,是中文信息处理的中国国家标准,是强制执行的中文编码。
二、特点不同
1、UTF-8 GBK :向下与 GB 2312 编码兼容,向上支持 ISO 10646.1国际标准,是前者向后者过渡过程中的一个承上启下的产物。
2、UTF8 GB2312:共收录 6763 个简体汉字、682 个符号,其中汉字部分:一级字 3755 个,以拼音排序,二级字 3008 个,以偏旁部首排序。该标准的制定和应用为规范、推动中文信息化进程起了很大作用。
三、字节数不同
1、UTF-8 GBK :是在GB2312-80标准基础上的内码扩展规范,使用了双字节编码方案,其编码范围从8140至FEFE(剔除xx7F),共23940个码位,共收录了21003个汉字,完全兼容GB2312-80标准。
2、UTF8 GB2312:标准涵盖了单字节、双字节、四字节的字符和汉字,共计约 28,000 多个。
参考资料来源:百度百科-GBK字库
参考资料来源:百度百科-仿宋_GB2312