语音识别系统主要包含哪四大部分
一个完整的语音识别系统通常包括信号处理和特征提取、声学模型、语音模型和解码搜索这四个模块。
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。
功能特点
1、多为中、小词汇量的语音识别系统,即只能够识别10~100词条。只有近一两年来,才有连续数码或连续字母语音识别专用芯片实现。
2、一般仅限于特定人语音识别的实现,即需要让使用者对所识别的词条先进行学习或训练这一类识别功能对语种、方言和词条没有限制。有的芯片也能够实现非特定人语音识别,即预先将所要识别的语句码本训练好而装入芯片,用户使用时不需要再进行学习而直接应用。
3、由此芯片组成一个完整的语音识别系统。因此,除了语音识别功能以外,为了有一个好的人机界面和识别正确与否的验证,该系统还必须具备语音提示(语音合成)及语音回放(语音编解码记录)功能。
4、多为实时系统,即当用户说完待识别的词条后,系统立即完成识别功能并有所回应,这就对电路的运算速度有较高的要求。
5、除了要求有尽可能好的识别性能外,还要求体积尽可能小、可靠性高、耗电省、价钱低等特点。
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。
以上内容参考 百度百科-语音识别技术
2024-11-04 广告
1.特征提取和信号处理。对连续的模拟信号进行转化,通过采样和量化,转化成数字信号。
2.声学模型是语音识别系统中最为重要的部分之一,主流系统多采用隐马尔科夫模型进行建模。
3.语言模型用来表示词序列出现的可能性,用文本数据训练而成,是语音识别系统重要的组成部分
4.解码搜索。解码器是将语音中的信息解码识别并输出的一个关键结构。针对输入的语音信号,根据己经训练好的声学模型、语言模型及字典建立一个识别网络, 使用搜索算法在该网络中寻找最佳的一条路径 ,输出最大概率的情况下的文字。