2个回答
展开全部
[XP下乱码的原因]
Windows 2000和Windows XP中,诸如记事本(notepad.exe)等,可以侦查到缺乏字节序标记的Unicode文件。这个功能由一个Windows API提供,名为IsTextUnicode()。
但是,这个功能是不完美的,副作用是一些小写字体的ASCII文字,会错误判断为UTF-16。
(Win2000,winXp下该功能不完美,不过winVista,Win7以后的操作系统上已经完善了。
所以win7下可以输出中文,但Xp下可能乱码)
[对策]
所以你最好在往csv文件里输入内容之前,先输出用于标识unicode的字节序:0xFF 0xEF。
避免让文本编辑器去猜格式。
[补充解释/说明]
BOM(Byte Order Mark)
为了说明一个文件采用的是什么编码,在文件最开始的部分,可以有BOM。
比如
0xFE 0xFF:表示UTF-16BE;
0xFF 0xFE 0x00 0x00:表示UTF-32LE。
UTF-8原本是不需要BOM的,因为其自我同步的特性,
但是为了明确说明这是UTF-8(而不是让文本编辑器去猜),
也可以加上UTF-8的BOM:0xEF 0xBB 0xBF
Windows 2000和Windows XP中,诸如记事本(notepad.exe)等,可以侦查到缺乏字节序标记的Unicode文件。这个功能由一个Windows API提供,名为IsTextUnicode()。
但是,这个功能是不完美的,副作用是一些小写字体的ASCII文字,会错误判断为UTF-16。
(Win2000,winXp下该功能不完美,不过winVista,Win7以后的操作系统上已经完善了。
所以win7下可以输出中文,但Xp下可能乱码)
[对策]
所以你最好在往csv文件里输入内容之前,先输出用于标识unicode的字节序:0xFF 0xEF。
避免让文本编辑器去猜格式。
[补充解释/说明]
BOM(Byte Order Mark)
为了说明一个文件采用的是什么编码,在文件最开始的部分,可以有BOM。
比如
0xFE 0xFF:表示UTF-16BE;
0xFF 0xFE 0x00 0x00:表示UTF-32LE。
UTF-8原本是不需要BOM的,因为其自我同步的特性,
但是为了明确说明这是UTF-8(而不是让文本编辑器去猜),
也可以加上UTF-8的BOM:0xEF 0xBB 0xBF
展开全部
csv是纯文本文件。因此对unicode的处理并不好,你先通过UE等二进制编辑器,确认一下文本文件的头部是否有FF FE字头,这个是unicode编码标记,如果没有,那么就需要系统进行兼容或者程序中只能使用多字节编码(非UNICODE)。而VS2012默认的MFC程序,一般是UNICODE模式。
推荐首先尝试的办法:
在程序写文件的时候,先用一个WCHAR写一个文件头,后面继续写内容,其它不变。
WCHAR uhead = 0xFFEF;
本回答被提问者和网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询