java 怎么判断文本内容的编码 200

 我来答

2个回答

#热议# 为什么说不要把裤子提到肚脐眼？

超级迷离
2017-08-09 · 超过37用户采纳过TA的回答

知道小有建树答主

回答量：66

采纳率：100%

帮助的人：53.8万

我也去答题访问个人页

关注

展开全部

简单判断是UTF-8或不是UTF-8，因为一般除了UTF-8之外就是GBK，所以就设置默认为GBK。

按照给定的字符集存储文件时，在文件的最开头的三个字节中就有可能存储着编码信息，所以，基本的原理就是只要读出文件前三个字节，判定这些字节的值，就可以得知其编码的格式。其实，如果项目运行的平台就是中文操作系统，如果这些文本文件在项目内产生，即开发人员可以控制文本的编码格式，只要判定两种常见的编码就可以了：GBK和UTF-8。由于中文Windows默认的编码是GBK，所以一般只要判定UTF-8编码格式。
对于UTF-8编码格式的文本文件，其前3个字节的值就是-17、-69、-65
反之基本是GBK

已赞过 已踩过<

评论收起

匿名用户
2017-08-09

展开全部

字符的编码那么多种，光是有字符串，是判断不了的，，，，，但范围缩小就可以判断，如ANSI和中文之间，就是判断字符的ASCII，可以认为>0xff就是中文

~
~
~

已赞过 已踩过<

评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

java 怎么判断文本内容的编码 200

其他类似问题

为你推荐：