JAVA字符是以unicode处理，但是通过getbytes()方法，看到的是英文是一个byte而中文是三个byte

可以看出JAVA并不是使用固定长度的字节来编码的，目前我要处理一些固定2个字节16位的字节码，这些字节码在C++中可以用wchar*的方式，在java中如何能正确的转换为... 可以看出JAVA并不是使用固定长度的字节来编码的，目前我要处理一些固定2个字节16位的字节码，这些字节码在C++中可以用wchar*的方式，在java中如何能正确的转换为JAVA的编码格式，通过utf-8,utf-16,utf-32和其他的中文编码格式，都不能正确的转换，但是我通过手动删除每个字符的第二个字节码，可以转换为正确的JAVA格式，因为一些英文字等没有用到高位字节码，但是如果是用到多字节的字符就会出问题。请问是否有做过该字节码的兄弟请教一下如何转换？？？感激不尽，高分送上。分数还可追加。
举例:47 0 114 0 101 0 115 0 47 0 103 0 97 0 109 0 101 0 47 0 50 0 48 0 48 0 52 0 47 0 0 0
这是从流中读取的字节码了，通过JAVA转码转换为不正常字符串
手动删除高位：47 114 101 115 47 103 97 109 101 47 50 48 48 52 47
转换正确,这是在只用到一个字节的情况下展开

 我来答

4个回答

#热议# 生活中有哪些实用的心理学知识？

老冯文库
推荐于2017-11-28 · 知道合伙人软件行家

老冯文库
知道合伙人软件行家

采纳数：1139 获赞数：8734

向TA提问私信TA

关注

展开全部

字节码序列：47 114 101 115 47 103 97 109 101 47 50 48 48 52 47
表示的字符串应该是“/res/game/2004/”

在Java/C#中，将字符串转换为字节数组时，为了与其他语言兼容，一般应该将一个中文字符转换为2个字节。常见的地方：使用.NET发布Web Service，客户端使用Java访问Web Service，这里就要注意解码和编码的问题了，应该使用同一种字符集编码，否则读取会出现所谓的“中文乱码”。

再来一组测试：

public class Test30 {
public static void main(String[] args) throws Exception {
String source = "i我";
byte[] arr;
int i;

//按Java平台默认的字符集解码
arr = source.getBytes();
System.out.printf("%15s", "default : ");
for(i=0; i<arr.length; i++){
System.out.printf("%X " , arr[i]);
}
System.out.println();

//按GBK(中文平台的默认字符集)字符集解码
arr = source.getBytes("GBK");
System.out.printf("%15s", "GBK : ");
for(i=0; i<arr.length; i++){
System.out.printf("%X " , arr[i]);
}
System.out.println();

//按utf-8字符集解码
arr = source.getBytes("utf-8");
System.out.printf("%15s", "utf-8 : ");
for(i=0; i<arr.length; i++){
System.out.printf("%X " , arr[i]);
}
System.out.println();

//按utf-16字符集解码
arr = source.getBytes("utf-16");
System.out.printf("%15s", "utf-16 : ");
for(i=0; i<arr.length; i++){
System.out.printf("%X " , arr[i]);
}
System.out.println();

//按ISO-8859-1(ASCII字符集的扩展，0~255)字符集解码
arr = source.getBytes("ISO-8859-1");
System.out.printf("%15s", "ISO-8859-1 : ");
for(i=0; i<arr.length; i++){
System.out.printf("%X " , arr[i]);
}
System.out.println();
}
}

测试结果：

default : 69 CE D2
GBK : 69 CE D2
utf-8 : 69 E6 88 91
utf-16 : FE FF 0 69 62 11
ISO-8859-1 : 69 3F

分析：原来GBK(还有gb2312)字符集的解码结果和Java平台的解码结果完全一致，这不是偶然，因为我的测试平台是Windowx中文平台，GBK是Java中文平台的默认字符集，一个汉字解码成为2个字节，1个字符转换为1个字节。

解决方案：如果多种语言之间需要进行编码、解码，对汉字应该按双字节处理，目前绝大多数语言都支持这种解码方案，针对Java语言，采用默认的字符集(或显示使用GBK或gb2312字符集)就可以了。

扩展：C#的默认字符集不是GBK，即使所处环境是中文平台。

已赞过 已踩过<

评论收起

百度网友bae7667
2012-03-21 · TA获得超过936个赞

知道小有建树答主

回答量：404

采纳率：100%

帮助的人：147万

我也去答题访问个人页

关注

展开全部

全局通过XML格式传输，包括JS也是传XML对象。

更多追问追答
追问

跟传输没关系，读取的是本地字节流文件
追答

你在得出字节流前拿到的字符串是不是就可以处理了？为什么非要等到转成字节流以后再做事。
我说用XML的意思就是从源头规避掉这些
追问

字节流文件就是字节流，里面还有其他东西的，比如dword,word,wchar等多个类型需要分别转换，这是本是在C++中处理的文件
追答

你如果框上原来就是这样  这个条件。。那就帮不上忙了。。。
JAVA里用类似DOM4J，你说的几种类型都能封装成XML对象。前提要去做这些事。。。
追问

你说的都是xml处理的东西，跟这没一点关系，不过还是谢谢你
追答

代码是相同的，你有之前的系统在，传输的参数里有这些类型
我说的意思是想从你字节流文件获取的阶段就去做这些事，从源头开始就规避掉这些问题，而不是传到要用了，才去解决。。。
除非您拿到的参数就已经是这样了（比如在数据库里存的就是这种），如果是通过什么算法或方法得到的字节流文件，那问题的根源还是在那

已赞过 已踩过<

评论收起

匿名用户
2012-03-21

展开全部

顶顶

已赞过 已踩过<

评论收起

百度网友845f74e61
2012-03-21 · TA获得超过6929个赞

知道大有可为答主

回答量：4050

采纳率：50%

帮助的人：1623万

我也去答题访问个人页

关注

展开全部

对这个有兴趣，研究一下。
再问一下，如是是单字节与双字节混合，这样去高位是不是会出错？

已赞过 已踩过<

评论收起

2条折叠回答

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

"Kimi AI编程助手，让代码更智能"

"Kimi AI您的智能编程助手，让编程更简单"一站式极致体验尽在Kimi~

kimi.moonshot.cn广告

JAVA字符是以unicode处理，但是通过getbytes()方法，看到的是英文是一个byte而中文是三个byte

您可能关注的内容

其他类似问题

为你推荐：