乱码是什么意思
乱码是电脑在系统出现错误的情况下,显示出来的一种无规则的杂乱符号。
乱码是由于系统或软件缺乏对某种字符编码的支持,而产生的不能正常阅读的混内乱字符。常容见的内码错误有GB码和BIG5码冲突,日文,韩文显示问题等。修正乱码,可以使用系统内码转换工具,如“南极星”等,将系统内码转换为对应内码,字符即可正确显示。
简单来说,就是编码解码采用了不同的标准,下面我们来分析下这个问题更深层面的原因。首先我们的第一个问题是,计算机为什么需要编码?为什么需要编码? 我们知道计算机处理的数据实际上都是二级制的数据,也就是计算机实际上只识别0和1两种状态。
发明计算机的过程中人们需要解决的第一个问题就是文字的处理问题,也就是我们如何将文字符号转化为二级制数据,同时我们也需要能够将转化后的二进制数据重新转化为文字符号供我们阅读。前面的过程我们称之为编码,后面的这个过程我们称之为解码。这和电信领域更著名的一套编解码规则莫尔斯码是一个原理。
乱码产生的原因如下:
把软件a这一个字符串保存在磁盘上,软件b如果以gbk的方式解码那必然是正常的,那如果用utf-8,这里软件b就会告诉显示器这个字符串它是以utf-8的形式解码,所以显示器会对这个字符串按utf-8的形式进行解码展示,但是实际的字符串存储的格式却是以gbk这种编码格式保存的,所以必然会导致显示器上面看到的是乱码,这就是乱码产生的过程。
编码和解码使用的不是同一套编码格式,会导致乱码现象的产生,因此在产生乱码时,我们可以借助一些编辑器或浏览器去更换编码来找到原先的格式。