java可供判断某字符串是什么编码的一行代码
2018-08-04 · 百度知道合伙人官方认证企业
育知同创教育
1【专注:Python+人工智能|Java大数据|HTML5培训】 2【免费提供名师直播课堂、公开课及视频教程】 3【地址:北京市昌平区三旗百汇物美大卖场2层,微信公众号:yuzhitc】
向TA提问
关注
展开全部
明确告诉你,没有办法,你必须先知道编码,才能把byte数组转成字符,如果已经是java的String对象的话,则一定是Unicode的,这个没有为什么,Java就是这么定的。
展开全部
System.out.println("中文");
System.out.println("中文".getBytes());
System.out.println("中文".getBytes("GB2312"));
System.out.println("中文".getBytes("ISO8859_1"));
System.out.println(new String("中文".getBytes()));
System.out.println(new String("中文".getBytes(), "GB2312"));
System.out.println(new String("中文".getBytes(), "ISO8859_1"));
System.out.println(new String("中文".getBytes("GB2312")));
System.out.println(new String("中文".getBytes("GB2312"), "GB2312"));
System.out.println(new String("中文".getBytes("GB2312"), "ISO8859_1"));
System.out.println(new String("中文".getBytes("ISO8859_1")));
System.out.println(new String("中文".getBytes("ISO8859_1"), "GB2312"));
System.out.println(new String("中文".getBytes("ISO8859_1"), "ISO8859_1"));
eg:判断当前字符串的编码格式。
//判断当前字符串的编码格式
if(destination.equals(new String(destination.getBytes("iso8859-1"), "iso8859-1")))
{
destination=new String(destination.getBytes("iso8859-1"),"utf-8");
}
刚学习java的人,对于java中方法request.getParameter(“”),返回值若是中文,有时会莫名其妙的值变成了乱码比较厌烦。
即使在处理中加入了
response.setContentType("text/html;charset=utf-8");
request.setCharacterEncoding("utf-8");
response.setCharacterEncoding("utf-8");
但效果并没有达到预期。究其原因在于以下几点:
ServletRequest接口中定义了一个getCharacterEncoding方法,该方法用于返回请求消息中的实体内容的字符集编码名称。如果请求消息中没有指定实体内容的字符集编码名称,则getCharacterEncoding方法返回null。
ServletRequest接口中定义了一个 setCharacterEncoding方法,该方法用于覆盖请求消息中的实体内容的字符集编码名称的设置。getParameter和getReader方法将读取到的实体内容从字节数组形态转换成字符串返回时,都要参照请求消息中的实体内容的字符集编码名称,所以,setCharacterEncoding方法应早于getParameter或getReader方法之前进行调用。
ServletRequest对象的getParameter等方法以哪种字符集编码对参数进行URL编码,需记下以下三种情况:
(1) 对于HTTP请求消息的请求行中的URL地址后的参数,getParameter等方法进行URL解码时所采用的字符集编码在Servlet规范中没有明确规定,它由各个Servlet引擎厂商自行决定。对于这种情况,Tomcat中的ServletRequest对象的getParameter等方法默认采用ISO8859-1字符集编码进行URL解码,因此无法返回正确的中文参数信息。
(2) 对于POST方式下的”application/x-www-form-urlencoded”编码格式的实体内容,getParameter等方法以ServletRequest对象的getCharacterEncoding方法返回的字符集编码对其进行URL解码。事实上,对于IE浏览器产生的HTTP请求消息中没有通过任何方式指定对实体内容进行URL编码所采用的字符集编码,那么,Servlet引擎将无法知道请求消息中的实体内容的字符集编码,getCharacterEncoding()方法的返回值为null。对于这种情况,ServletRequest对象的getParameter等方法将使用默认的ISO8859-1字符集编码对实体内容中的参数进行URL解码,因此也将无法返回正确的中文参数信息。
(3) ServletRequest接口中定义了一个 setCharacterEncoding方法来设置请求消息中的实体内容的字符集编码名称,getParameter方法将以该方法设置的字符集编码对实体内容进行URL解码,所以,只要使用ServletRequest.setCharacterEncoding方法设置实体内容的字符集编码为其URL编码前的字符集编码,那么getParameter方法就可以从实体内容返回正确的中文参数信息。但是,应该注意一点:ServletRequest.setCharacterEncoding方法设置的是请求消息中的实体内容的字符集编码名称,它只影响getParameter方法对POST方式下的”application/x-www-form-urlencoded”编码格式的实体内容进行URL解码的结果,而不能影响getParameter方法对HTTP请求消息的请求行中的URL地址后的参数进行URL解码的结果。
所以在servlet开发中对于中文参数值的处理,完整代码如下:
response.setContentType("text/html;charset=utf-8");
request.setCharacterEncoding("utf-8");
response.setCharacterEncoding("utf-8");
String name=Tool.ObjToStr(request.getParameter("name"), "美国");
if(name.equals(new String(name.getBytes("iso8859-1"), "iso8859-1")))
{
name=new String(request.getParameter("name").getBytes("iso8859-1"),"utf-8");
}
System.out.println("中文".getBytes());
System.out.println("中文".getBytes("GB2312"));
System.out.println("中文".getBytes("ISO8859_1"));
System.out.println(new String("中文".getBytes()));
System.out.println(new String("中文".getBytes(), "GB2312"));
System.out.println(new String("中文".getBytes(), "ISO8859_1"));
System.out.println(new String("中文".getBytes("GB2312")));
System.out.println(new String("中文".getBytes("GB2312"), "GB2312"));
System.out.println(new String("中文".getBytes("GB2312"), "ISO8859_1"));
System.out.println(new String("中文".getBytes("ISO8859_1")));
System.out.println(new String("中文".getBytes("ISO8859_1"), "GB2312"));
System.out.println(new String("中文".getBytes("ISO8859_1"), "ISO8859_1"));
eg:判断当前字符串的编码格式。
//判断当前字符串的编码格式
if(destination.equals(new String(destination.getBytes("iso8859-1"), "iso8859-1")))
{
destination=new String(destination.getBytes("iso8859-1"),"utf-8");
}
刚学习java的人,对于java中方法request.getParameter(“”),返回值若是中文,有时会莫名其妙的值变成了乱码比较厌烦。
即使在处理中加入了
response.setContentType("text/html;charset=utf-8");
request.setCharacterEncoding("utf-8");
response.setCharacterEncoding("utf-8");
但效果并没有达到预期。究其原因在于以下几点:
ServletRequest接口中定义了一个getCharacterEncoding方法,该方法用于返回请求消息中的实体内容的字符集编码名称。如果请求消息中没有指定实体内容的字符集编码名称,则getCharacterEncoding方法返回null。
ServletRequest接口中定义了一个 setCharacterEncoding方法,该方法用于覆盖请求消息中的实体内容的字符集编码名称的设置。getParameter和getReader方法将读取到的实体内容从字节数组形态转换成字符串返回时,都要参照请求消息中的实体内容的字符集编码名称,所以,setCharacterEncoding方法应早于getParameter或getReader方法之前进行调用。
ServletRequest对象的getParameter等方法以哪种字符集编码对参数进行URL编码,需记下以下三种情况:
(1) 对于HTTP请求消息的请求行中的URL地址后的参数,getParameter等方法进行URL解码时所采用的字符集编码在Servlet规范中没有明确规定,它由各个Servlet引擎厂商自行决定。对于这种情况,Tomcat中的ServletRequest对象的getParameter等方法默认采用ISO8859-1字符集编码进行URL解码,因此无法返回正确的中文参数信息。
(2) 对于POST方式下的”application/x-www-form-urlencoded”编码格式的实体内容,getParameter等方法以ServletRequest对象的getCharacterEncoding方法返回的字符集编码对其进行URL解码。事实上,对于IE浏览器产生的HTTP请求消息中没有通过任何方式指定对实体内容进行URL编码所采用的字符集编码,那么,Servlet引擎将无法知道请求消息中的实体内容的字符集编码,getCharacterEncoding()方法的返回值为null。对于这种情况,ServletRequest对象的getParameter等方法将使用默认的ISO8859-1字符集编码对实体内容中的参数进行URL解码,因此也将无法返回正确的中文参数信息。
(3) ServletRequest接口中定义了一个 setCharacterEncoding方法来设置请求消息中的实体内容的字符集编码名称,getParameter方法将以该方法设置的字符集编码对实体内容进行URL解码,所以,只要使用ServletRequest.setCharacterEncoding方法设置实体内容的字符集编码为其URL编码前的字符集编码,那么getParameter方法就可以从实体内容返回正确的中文参数信息。但是,应该注意一点:ServletRequest.setCharacterEncoding方法设置的是请求消息中的实体内容的字符集编码名称,它只影响getParameter方法对POST方式下的”application/x-www-form-urlencoded”编码格式的实体内容进行URL解码的结果,而不能影响getParameter方法对HTTP请求消息的请求行中的URL地址后的参数进行URL解码的结果。
所以在servlet开发中对于中文参数值的处理,完整代码如下:
response.setContentType("text/html;charset=utf-8");
request.setCharacterEncoding("utf-8");
response.setCharacterEncoding("utf-8");
String name=Tool.ObjToStr(request.getParameter("name"), "美国");
if(name.equals(new String(name.getBytes("iso8859-1"), "iso8859-1")))
{
name=new String(request.getParameter("name").getBytes("iso8859-1"),"utf-8");
}
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询