计算机常用的信息编码有哪几种?
计算机常用的信息编码有文字编码、语义编码、电子编码、PCM编码、神经编码等。
一、文字编码
文字编码(Text encoding)使用一种标记语言来标记一篇文字的结构和其他特征,以方便计算机进行处理。
二、语义编码
语义编码(Semantics encoding),以正式语言乙对正式语言甲进行语义编码,即是使用语言乙表达语言甲所有的词汇(如程序或说明)的一种方法。
三、电子编码
电子编码(Electronic encoding)是将一个信号转换成为一个代码,这种代码是被优化过的以利于传输或存储。转换工作通常由一个编解码器完成。
四、PCM编码
PCM脉冲编码调制是Pulse Code Modulation的缩写(又叫脉冲编码调制):数字通信的编码方式之一。主要过程是将话音、图像等模拟信号每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的幅值。
五、神经编码
神经编码(Neural encoding)是指信息在神经元中被如何描绘的方法。
2024-10-28 广告
计算机常用的编码有:ASCII码,汉字编码等
字符编码就是以二进制的数字来对应字符集的字符,目前用得最普遍的字符集是ANSI,对应ANSI字符集的二进制编码就称为ANSI码,DOS和Windows系统都使用了ANSI码,但在系统中使用的字符编码要经过二进制转换,称为系统内码。
汉字进入计算机的三种途径:
①机器自动识别汉字:计算机通过“视觉”装置(光学字符阅读器或其他),用光电扫描等方法识别汉字。
②通过语音识别输入:计算机利用人们给它配备的“听觉器官”,自动辨别汉语语音要素,从不同的音节中找出不同的汉字,或从相同音节中判断出不同汉字。
③通过汉字编码输入:根据一定的编码方法,由人借助输入设备将汉字输入计算机。
以上内容参考:百度百科-汉字编码
字符编码就是以二进制的数字来对应字符集的字符,目前用得最普遍的字符集是ANSI,对应ANSI字符集的二进制编码就称为ANSI码,DOS和Windows系统都使用了ANSI码,但在系统中使用的字符编码要经过二进制转换,称为系统内码。
1.汉字内码:ANSI码是单一字节(8位二进制数)的编码集,最多只能表示256个字符,不能表示众多的汉字字符,各个国家和地区在ANSI码的基础上又设计了各种不同的汉字编码集,以能够处理大数量的汉字字符。这些编码使用单字节来表示ANSI的英文字符(即兼容ANSI码),使用双字节来表示汉字字符。由于一个系统中只能有一种汉字内码,不能识别其它汉字内码的字符,造成了交流的不便。
2.GB码:GB码是1980年国家公布的简体汉字编码方案,在大陆、新加坡得到广泛的使用,也称国标码。国标码对6763个汉字集进行了编码,涵盖了大多数正在使用的汉字。
3.GBK码:GBK码是GB码的扩展字符编码,对多达2万多的简繁汉字进行了编码,简体版的Win95和Win98都是使用GBK作系统内码。
4.BIG5码:BIG5码是针对繁体汉字的汉字编码,目前在台湾、香港的电脑系统中得到应用。
5.HZ码:HZ码是在Internet上广泛使用的一种汉字编码。
6.ISO
-2022CJK码:IOS-2022是国际标准组织(ISO)为各种语言字符制定的编码标准。采用二个字节编码,其中汉语编码称ISO-
2022
CN,日语、韩语的编码分别称JP、KR。一般将三者合称CJK码。目前CJK码主要在Internet网络中使用。
7.Unicode码:Unicode码也是一种国际标准编码,采用二个字节编码,与ANSI码不兼容。目前,在网络、Windows系统和很多大型软件中得到应用。
一般应有的代码有两类,一类是有意义的代码,即赋予代码一定的实际意义,便于分类处理;一类是无意义的代码,仅仅是赋予信息元素唯一的代号,便于对信息的操作。常用的代码类型有:
(1)顺序码,即接信息元素的顺序依次编码;
(2)区间码,即用一代码区间代表某一信息组;
(3)记忆码,即能帮助联想记忆的代码。
信息的表现形式多种多样,因而编码的方案也非常多。例如:我国制定的包括一、二级汉字和常用符号的图形字符代码(GB 5007-85),日文、韩文等其他文字与符号的“大5码”(BIG 5),英文字符的“ASCII码”(American Standard Code for Information Interchange) 。
(1)顺序码,即接信息元素的顺序依次编码;
(2)区间码,即用一代码区间代表某一信息组;
(3)记忆码,即能帮助联想记忆的代码。
信息的表现形式多种多样,因而编码的方案也非常多。例如:我国制定的包括一、二级汉字和常用符号的图形字符代码(GB 5007-85),日文、韩文等其他文字与符号的“大5码”(BIG 5),英文字符的“ASCII码”(American Standard Code for Information Interchange) 。