Java读取properties文件乱码,通过 newString(str.getBytes(),"UTF-8")无法正确转换个别字符求更好的办法 10
properties的load方法没有重载的load(InputStream,Charset),谁有更好的方法分享一下由于百度好像没有自己回答的功能,关于我的问题解决方法...
properties的load方法没有重载的load(InputStream,Charset),谁有更好的方法分享一下
由于百度好像没有自己回答的功能,关于我的问题解决方法:InputStreamReader in= new InputStreamReader(Parser.class.getResourceAsStream(dataFile),"UTF-8");这样再调用properties.load(in),读取配置文件的时候就没问题了 展开
由于百度好像没有自己回答的功能,关于我的问题解决方法:InputStreamReader in= new InputStreamReader(Parser.class.getResourceAsStream(dataFile),"UTF-8");这样再调用properties.load(in),读取配置文件的时候就没问题了 展开
4个回答
2011-04-02
展开全部
是偶数个字的时候正常,奇数个的时候乱码,具体的字码长度我也不是很了解
String str1 = new String(str.getBytes("UTF-8"),"GBK");
System.out.println(str1.length());
String str2 = new String(str1.getBytes("GBK"),"UTF-8");
System.out.println(str2.length());); 打印出来的字符串长度就不一样的
UTF8每个汉字占用3个字节,这样在某些地方文字个数的计算就和GBK编码的不一样,UTF-8使用可变长度字节来储存 Unicode字符,例如ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。辅助平面字符则使用4字节。 GB 18030标准采用单字节、双字节和四字节三种方式对字符编码。单字节部分使用0×00至0×7F码(对应于ASCII码的相应码)。双字节部分,首字节码从0×81至0×FE,尾字节码位分别是0×40至0×7E和0×80至0×FE。四字节部分采用GB/T 11383未采用的0×30到0×39作为对双字节编码扩充的后缀,这样扩充的四字节编码,其范围为0×81308130到0×FE39FE39。其中第一、三个字节编码码位均为0×81至0×FE,第二、四个字节编码码位均为0×30至0×39。
按照程序员的称呼,GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。
另外,团IDC网上有许多产品团购,便宜有口碑
String str1 = new String(str.getBytes("UTF-8"),"GBK");
System.out.println(str1.length());
String str2 = new String(str1.getBytes("GBK"),"UTF-8");
System.out.println(str2.length());); 打印出来的字符串长度就不一样的
UTF8每个汉字占用3个字节,这样在某些地方文字个数的计算就和GBK编码的不一样,UTF-8使用可变长度字节来储存 Unicode字符,例如ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。辅助平面字符则使用4字节。 GB 18030标准采用单字节、双字节和四字节三种方式对字符编码。单字节部分使用0×00至0×7F码(对应于ASCII码的相应码)。双字节部分,首字节码从0×81至0×FE,尾字节码位分别是0×40至0×7E和0×80至0×FE。四字节部分采用GB/T 11383未采用的0×30到0×39作为对双字节编码扩充的后缀,这样扩充的四字节编码,其范围为0×81308130到0×FE39FE39。其中第一、三个字节编码码位均为0×81至0×FE,第二、四个字节编码码位均为0×30至0×39。
按照程序员的称呼,GB2312、GBK到GB18030都属于双字节字符集 (DBCS)。
另外,团IDC网上有许多产品团购,便宜有口碑
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
ResourceBundle bundle = ResourceBundle.getBundle("MessageResouces");
其中MessageResouces是资源文件的名字
String startPath = bundle.getString("startPath");
其中startPath是资源文件中等号前面的名字
这样就能去得等号后面的内容。
其中MessageResouces是资源文件的名字
String startPath = bundle.getString("startPath");
其中startPath是资源文件中等号前面的名字
这样就能去得等号后面的内容。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
往properties文件里存汉字的时候,把汉字转成Unicode码,类似/u0000这种
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询