语音信号处理

语音信号处理的论坛有推荐一下或者有高手留个邮箱小弟有问题请教谢谢了!!!!!!你给的这个根本下不下来!要钱的!... 语音信号处理的论坛 有推荐一下 或者有高手留个邮箱 小弟有问题请教 谢谢了!!!!!!你给的这个根本下不下来!要钱的! 展开
 我来答
班漠绮南
2008-11-28 · TA获得超过1258个赞
知道小有建树答主
回答量:1737
采纳率:90%
帮助的人:8万
展开全部
mfcc是计算语音信号的mel频率倒谱系数,mel频率是基于人耳听觉特性提出来的,它与hz频率成非线性对应关系。mel频率倒谱系数(mfcc)则是利用它们之间的这种关系,计算得到的hz频谱特征,mfcc已经广泛地应用在语音识别领域。由于mel频率与hz频率之间非线性的对应关系,使得mfcc随着频率的提高,其计算精度随之下降。因此,在应用中常常只使用低频mfcc,而丢弃中高频mfcc。
mfcc参数的提取包括以下几个步骤:

预滤波(低通):前端带宽为300-3400hz的抗混叠滤波器。

a/d变换:采样频率,线性量化精度。

预加重:通过一个一阶有限激励响应高通滤波器,使信号的频谱变得平坦,不易受到有限字长效应的影响。

分帧:根据语音的短时平稳特性,语音可以以帧为单位进行处理,实验中选取的语音帧长为32ms,帧叠为16ms。

加窗:采用哈明窗对一帧语音加窗,以减小吉布斯效应的影响。

快速傅立叶变换(fast
fourier
transformation,
fft):将时域信号变换成为信号的功率谱。

三角窗滤波:用一组mel频标上线性分布的三角窗滤波器(共24个三角窗滤波器),对信号的功率谱滤波,每一个三角窗滤波器覆盖的范围都近似于人耳的一个临界带宽,以此来模拟人耳的掩蔽效应。

求对数:三角窗滤波器组的输出求取对数,可以得到近似于同态变换的结果。

离散余弦变换(discrete
cosine
transformation,
dct):去除各维信号之间的相关性,将信号映射到低维空间。

谱加权:由于倒谱的低阶参数易受说话人特性、信道特性等的影响,而高阶参数的分辨能力比较低,所以需要进行谱加权,抑制其低阶和高阶参数。

倒谱均值减(cepstrum
mean
subtraction,
cms):cms可以有效地减小语音输入信道对特征参数的影响。

差分参数:大量实验表明,在语音特征中加入表征语音动态特性的差分参数,能够提高系统的识别性能。可用到了mfcc参数的一阶差分参数和二阶差分参数。
采样前的低通滤波,主要是消除采样时的频谱混叠。由硬件完成。
预加重主要是提高高频的频谱分量。软件,硬件都可以完成。
预加重前,也可以用高通滤波器,消除低频噪音。
如果计算mfcc是有了预加重。之前的预加重就不要做。
采样前的硬件低通滤波是一定要做的。
计算mfcc时的滤波,看起的作用是什么?如果是进一步消除噪音,那就必须做。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式