从哪里看编码格式?转换格式?
展开全部
要想完全自动地判断一个文件的编码方式从理论上是不可能的,所以你还是要自己判断某个文件是什么编码方式,然后再做转换。
以下是理由:
理想的情况,判断一个文件是哪种编码方式,可以通过开头的几个字节来实现,比如:
开头字节:编码方式
EF BB BF: UTF-8
FE FF :UTF-16/UCS-2, little endian
FF FE :UTF-16/UCS-2, big endian
FF FE 00 00 :UTF-32/UCS-4, little endian.
00 00 FE FF :UTF-32/UCS-4, big-endian.
遗憾的是,一些早期的和一些设计不良的软件在保存Unicode文本时不插入这些位于开头的字符集标记,还有ANSI字符集也没有这些位于开头的字符集标记。
如果你留心,会发现microsoft word有时候也会弹出一个对话框询问用户,让用户决定使用的是哪种编码方式,就是因为它也无法判断正确的编码方式。
当然,你如果想判断某个文件是什么编码方式,Replace Pioneer可以辅助你完成,参看一下百度百科replace pioneer里面这一小段的内容:
如何用Replace Pioneer检测出一个文件是什么编码:
1. 选择Tools->Encoding Detection
2. 在"File to Check"里输入文件名,点击Start
3. 文件就会被用70多种编码方式显示出来
哪一个显示正确就可能是这种编码,当然,某个文件可能在多种编码方式下都显示正确。
以下是理由:
理想的情况,判断一个文件是哪种编码方式,可以通过开头的几个字节来实现,比如:
开头字节:编码方式
EF BB BF: UTF-8
FE FF :UTF-16/UCS-2, little endian
FF FE :UTF-16/UCS-2, big endian
FF FE 00 00 :UTF-32/UCS-4, little endian.
00 00 FE FF :UTF-32/UCS-4, big-endian.
遗憾的是,一些早期的和一些设计不良的软件在保存Unicode文本时不插入这些位于开头的字符集标记,还有ANSI字符集也没有这些位于开头的字符集标记。
如果你留心,会发现microsoft word有时候也会弹出一个对话框询问用户,让用户决定使用的是哪种编码方式,就是因为它也无法判断正确的编码方式。
当然,你如果想判断某个文件是什么编码方式,Replace Pioneer可以辅助你完成,参看一下百度百科replace pioneer里面这一小段的内容:
如何用Replace Pioneer检测出一个文件是什么编码:
1. 选择Tools->Encoding Detection
2. 在"File to Check"里输入文件名,点击Start
3. 文件就会被用70多种编码方式显示出来
哪一个显示正确就可能是这种编码,当然,某个文件可能在多种编码方式下都显示正确。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询