对于Java的GBK文本转换成Byte数组为啥会出现负数?
已知文本文件他(123.txt)中的内容为""何abcdef"通过FileInputStream类FileInputStreamfis=newFileInputStrea...
已知文本文件他(123.txt)中的内容为
""何abcdef"
通过FileInputStream类
FileInputStream fis = new FileInputStream("d:\\123.txt")
byte[] buffer = new byte[1024];
fis.read(buffer);
得到的buffer数组中的前2个值为负数,为啥会这样。。
求解释? 展开
""何abcdef"
通过FileInputStream类
FileInputStream fis = new FileInputStream("d:\\123.txt")
byte[] buffer = new byte[1024];
fis.read(buffer);
得到的buffer数组中的前2个值为负数,为啥会这样。。
求解释? 展开
2个回答
展开全部
GBK采用双字节8位表示,总体编码范围为 8140 -- FEFE,首字节在 81 -- FE 之间,尾字节在 40 -- FE 之间。
ASCII是7位编码,只使用前7位,第8位补0,所以转换成整数始终为正数,而GBK是8位编码,也就是说一个字节中的第8位可以为1,如1010 1101,而将其转换成byte类型时,byte值为10101101,以补码存储,第8位被当成符号位,当然是负数了,值为:-83。
“何”字的GBK编码是:BA CE(1011 1010 1100 1110),两个字节第8位都为1,对byte类型来说,都被理解为最高位符号位。这样值就变成-70和-50了。
ASCII是7位编码,只使用前7位,第8位补0,所以转换成整数始终为正数,而GBK是8位编码,也就是说一个字节中的第8位可以为1,如1010 1101,而将其转换成byte类型时,byte值为10101101,以补码存储,第8位被当成符号位,当然是负数了,值为:-83。
“何”字的GBK编码是:BA CE(1011 1010 1100 1110),两个字节第8位都为1,对byte类型来说,都被理解为最高位符号位。这样值就变成-70和-50了。
追问
。。。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询