在说话人识别中,提取了MFCC倒谱系数,一帧语音信号有多少个MFCC倒谱系数呢? 20

我看网上说,C2-C16是说话人识别更好,但是我提取的一帧语音信号的MFCC系数怎么只有12个呢?我觉得一帧的MFCC系数的维数是和DCT的维数和倒谱提升窗口决定的。网上... 我看网上说,C2-C16是说话人识别更好,但是我提取的一帧语音信号的MFCC系数怎么只有12个呢?我觉得一帧的MFCC系数的维数是和DCT的维数和倒谱提升窗口决定的。网上说MFCC一共20维。。这是怎么回事呢? 展开
 我来答
junshi00
2011-11-20 · TA获得超过246个赞
知道小有建树答主
回答量:361
采纳率:0%
帮助的人:264万
展开全部
好几个地方可以决定你有几个参数,
fft.用的多少点,之后,取了几个三角形框频谱,再之后,DCT用几维的。
这些都可以调整的。
中智卫安
2024-11-20 广告
深圳中智卫安机器人技术有限公司,聚焦智能楼宇商用服务机器人整体解决方案,是国内优秀的服务机器人研发制造、销售服务企业。已申请机器人领域相关专利近300项,成功申报了国家、省、市各级科技项目,在技术层面形成深厚的积累。中智卫安已推出迎宾巡更机... 点击进入详情页
本回答由中智卫安提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式