C++中怎么读取UTF-8编码的文件
展开全部
1.windows上 默认使用的是 GBK,所以处理UTF8稍微麻烦点,甚至都不能直接显示utf8.
2.任何文件都是二进制数据。
3.将文件读取到的字节数组 byte[] C++里面实际上是 unsigned char[]类型,使用windows api里面的一个函数进行转换,转换成unicode 也就是 wchar_t的字符数组 —— MultiByteToWideChar
4.对于wchar_t的字符,可以直接显示,也可以直接使用,因为基本上所有操作系统都支持这种编码。
5.如果需要使用GBK的字符编码数组,那么使用上面函数的另一个兄弟函数——WideCharToMultiByte
提示:Windows MFC里面的字符串 CStringA CAtlStringA 这些都是基于GBK的
如果用CStringA保存UTF8的编码,直接输出会乱码,所以避免混淆,应该使用std::string 保存 utf8
std::wstring保存 unicode。而CStringA只在调用系统API的时候临时使用而已,而不作为长久数据保存于系统中。
2.任何文件都是二进制数据。
3.将文件读取到的字节数组 byte[] C++里面实际上是 unsigned char[]类型,使用windows api里面的一个函数进行转换,转换成unicode 也就是 wchar_t的字符数组 —— MultiByteToWideChar
4.对于wchar_t的字符,可以直接显示,也可以直接使用,因为基本上所有操作系统都支持这种编码。
5.如果需要使用GBK的字符编码数组,那么使用上面函数的另一个兄弟函数——WideCharToMultiByte
提示:Windows MFC里面的字符串 CStringA CAtlStringA 这些都是基于GBK的
如果用CStringA保存UTF8的编码,直接输出会乱码,所以避免混淆,应该使用std::string 保存 utf8
std::wstring保存 unicode。而CStringA只在调用系统API的时候临时使用而已,而不作为长久数据保存于系统中。
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询