展开全部
ANSII是标准国际编码,只有256个字符,没有汉字,所以表示不了汉字
你说的应该是ansi编码吧,那是系统根据当前地区然后确定的当地编码,例如大陆的ansi编码就代表 国标码GBK编码。
如果是台湾的话,ansi就应该是big5……
这里面涉及编码范围问题,Unicode,big5,gbk国标码都是两个字节表示一个汉字,而utf8是三个字节表示一个汉字。
而且这几种编码中有大量重叠,很难直接判断一个字是哪一种编码,
例如下面:汉字编码范围
名称 第一字节 第二字节
GB2312 0xB0-0xF7(176-247) 0xA0-0xFE(160-254)
GBK 0x81-0xFE(129-254) 0x40-0xFE(64-254)
Big5 0x81-0xFE(129-255) 0x40-0x7E(64-126)
0xA1-0xFE(161-254)
我这里有一些相关解释,可以看看
我曾经做过一个编码识别与转换的软件,
把你的要求再具体一点,
对这方面有一些了解,应该可以帮助你!
你说的应该是ansi编码吧,那是系统根据当前地区然后确定的当地编码,例如大陆的ansi编码就代表 国标码GBK编码。
如果是台湾的话,ansi就应该是big5……
这里面涉及编码范围问题,Unicode,big5,gbk国标码都是两个字节表示一个汉字,而utf8是三个字节表示一个汉字。
而且这几种编码中有大量重叠,很难直接判断一个字是哪一种编码,
例如下面:汉字编码范围
名称 第一字节 第二字节
GB2312 0xB0-0xF7(176-247) 0xA0-0xFE(160-254)
GBK 0x81-0xFE(129-254) 0x40-0xFE(64-254)
Big5 0x81-0xFE(129-255) 0x40-0x7E(64-126)
0xA1-0xFE(161-254)
我这里有一些相关解释,可以看看
我曾经做过一个编码识别与转换的软件,
把你的要求再具体一点,
对这方面有一些了解,应该可以帮助你!
展开全部
《信息交换用汉字编码字符集-基本集》 即 国家标准GB2312-80:
http://wenku.baidu.com/view/19810c2e4b73f242326c5f07.html
http://wenku.baidu.com/view/19810c2e4b73f242326c5f07.html
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询