
文本文档里有unicode的文字。最后用txt格式保存后,文字乱码。求大神来解决啊
1个回答
展开全部
选择另存为,在‘保存’键左侧下拉框“编码”选 择“utf-8”保存就可以了;
附带小知识:
你输入的内容叫“字符串”,也就是我们(地球人)能看懂的各种各样的文字,符号的序列(有顺序)等
输入会转到内存里存储:这是每个字符需要转换成“二进制代码如01010010”才能存;
怎么转呢:国际组织把地球上所有的符号/字符(文字也是一种符号,有意义的符号)统一进行编号:这个编号就叫unicode码:即一个符号对应一个10进制的数字如5900,10进制可以转化为2进制(结果一样的,只是规则不一样)
于是你输入的字符串首先会拆解成一个个字符,然后挨个与unicode表查找并转成数字/二进制,计算机存储是一个字节组byte list,即通常是2个字节表示一个字符(如果全是英文ascii会用一个字节),字符串就是【2个字节】的组合序列
当你写完了后,这时候需要保存文件;
保存文件触发写入操作:就好比录音机把声单录在磁带上(我是80后哈哈),其实是把存储在内存上的字节数据流用转到磁盘上,这个时候需要数据按一定的格式编码,这就是《编码》的含 义,
编码:通常是按utf-8来编码的,意思就是用可变长度的字节把之前固定字节长度的字符用一定的格式转化成可以用1,2,3不同长度的字节,这样可以节省存储空间;
附带小知识:
你输入的内容叫“字符串”,也就是我们(地球人)能看懂的各种各样的文字,符号的序列(有顺序)等
输入会转到内存里存储:这是每个字符需要转换成“二进制代码如01010010”才能存;
怎么转呢:国际组织把地球上所有的符号/字符(文字也是一种符号,有意义的符号)统一进行编号:这个编号就叫unicode码:即一个符号对应一个10进制的数字如5900,10进制可以转化为2进制(结果一样的,只是规则不一样)
于是你输入的字符串首先会拆解成一个个字符,然后挨个与unicode表查找并转成数字/二进制,计算机存储是一个字节组byte list,即通常是2个字节表示一个字符(如果全是英文ascii会用一个字节),字符串就是【2个字节】的组合序列
当你写完了后,这时候需要保存文件;
保存文件触发写入操作:就好比录音机把声单录在磁带上(我是80后哈哈),其实是把存储在内存上的字节数据流用转到磁盘上,这个时候需要数据按一定的格式编码,这就是《编码》的含 义,
编码:通常是按utf-8来编码的,意思就是用可变长度的字节把之前固定字节长度的字符用一定的格式转化成可以用1,2,3不同长度的字节,这样可以节省存储空间;
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询