如何在MATLAB里使用HTK? 15
小弟现在在用MATLAB做语音识别,接触到HTK,现在一头雾水,HTK到底是一个可以直接在MATLAB里使用的工具包还是什么其他的?下载了一个完全不会用,安装还要用到VC...
小弟现在在用MATLAB做语音识别,接触到HTK,现在一头雾水,HTK到底是一个可以直接在MATLAB里使用的工具包还是什么其他的? 下载了一个完全不会用,安装还要用到VC,这样可以用到MATLAB里吗?
请教HTK包的安装过程和在MATLAB里具体怎样使用。(我已经通过MFCC获取了语音特征) 如果好的肯定会加分的,求各位大神帮助。 展开
请教HTK包的安装过程和在MATLAB里具体怎样使用。(我已经通过MFCC获取了语音特征) 如果好的肯定会加分的,求各位大神帮助。 展开
5个回答
展开全部
先下载HTK然后根据用户手册安装好(其实就是把HTK的路径添加到windows的path里面去)。然后通过matlab里面的system来调用所有的htk指令,其实还是通过系统控制台就是了,输入输出都是文本文件,matlab只是用来写个运行脚本而已。
1、使用HSLab yes.sig 回车进行录音的时候,在标注的时候很容易让这个程序崩溃,最好是标注不用删除,要是崩溃了直接关闭程序,然后再dos下按ctrl +c可以终止这个程序,然后重新运行HSLab yes.sig 回车。在htk/bin.win32里面找不到的话可以去C盘找找看。(整个文件目录基本上都是在/htk/bin.win32里面,特殊的需要在里面新建文件夹,不用担心位置问题)
2、新建hmm_yes,hmm_no,hmm_sil时需要把后面的注释去掉。
1、使用HSLab yes.sig 回车进行录音的时候,在标注的时候很容易让这个程序崩溃,最好是标注不用删除,要是崩溃了直接关闭程序,然后再dos下按ctrl +c可以终止这个程序,然后重新运行HSLab yes.sig 回车。在htk/bin.win32里面找不到的话可以去C盘找找看。(整个文件目录基本上都是在/htk/bin.win32里面,特殊的需要在里面新建文件夹,不用担心位置问题)
2、新建hmm_yes,hmm_no,hmm_sil时需要把后面的注释去掉。
展开全部
voicebox :语音处理工具箱的MATLAB
导言
voicebox是一个语音处理工具箱包括MATLAB的套路是保持的,而且大部分写的迈克布鲁克斯系,电机及电子工程,帝国学院,展览路,伦敦sw7 2bt ,英国。几个例程需要MATLAB的V5的。
该例程,可作为压缩tar文件或者作为一个ZIP档案,并提供了根据合同条款在GNU公共许可证。
请发送任何意见,建议,错误报告等,以mike.brookes @ ic.ac.uk.
目录
音频文件输入/输出
阅读和书写WAV和其他语音文件格式
频率表
转换之间的赫兹,梅尔,雇员再培训局和MIDI频率表
傅立叶/ DCT变换/ Hartley变换
各类相关变换
随机数生成
产生随机向量与噪声信号
向量距离
计算之间的距离向量名单
语音分析
活跃水平估计,在光谱图
的LPC分析的讲话
线性预测编码例程
语音合成
声门波形模式
语音增强
谱噪声减法
语音编码
PCM编码,矢量量化
语音识别
前端处理认可
实用功能
杂项实用功能
音频文件输入/输出
例程可供阅读,并在某些情况下,写信,各种文件格式:
读写后缀
readwav writewav 。 WAV等,这些例程允许任意数量的渠道,也能对付线性的PCM (任何精度高达32位) ,律PCM和木法的PCM 。大型文件,可以读,写在小大块。
问题补充: readhtk writehtk 。 HTK液读写波形文件所用熵的隐马尔可夫工具箱。
readsfs 。自力更生支援讲话备案系统档案,由马克huckvale在UCL的。
readsph 。 NIST的手机领域中的格式文件(包括timit ) 。
readaif 。 AIF的音频交换文件格式所使用的Mac用户。
频率大规模改建
该梅尔表是基于人类感知的正弦波足球场。该例程mel2frq和frq2mel转换之间的这种规模和频率在Hz的。
雇员再培训局,规模化,是基于等价矩形带宽的人耳。该例程erb2frq和frq2erb转换之间的利率再培训局的规模和频率赫兹。
使用MIDI标准,还明确规定了编号的半音中c正60 。该例程frq2midi和midi2frq间进行转换,这音乐频率规模和赫兹。 frq2midi会除了输出注意到在名称中字符格式。 midi2frq可以使用一般同等规模的锻炼,否则毕达哥拉斯规模只是音调。
导言
voicebox是一个语音处理工具箱包括MATLAB的套路是保持的,而且大部分写的迈克布鲁克斯系,电机及电子工程,帝国学院,展览路,伦敦sw7 2bt ,英国。几个例程需要MATLAB的V5的。
该例程,可作为压缩tar文件或者作为一个ZIP档案,并提供了根据合同条款在GNU公共许可证。
请发送任何意见,建议,错误报告等,以mike.brookes @ ic.ac.uk.
目录
音频文件输入/输出
阅读和书写WAV和其他语音文件格式
频率表
转换之间的赫兹,梅尔,雇员再培训局和MIDI频率表
傅立叶/ DCT变换/ Hartley变换
各类相关变换
随机数生成
产生随机向量与噪声信号
向量距离
计算之间的距离向量名单
语音分析
活跃水平估计,在光谱图
的LPC分析的讲话
线性预测编码例程
语音合成
声门波形模式
语音增强
谱噪声减法
语音编码
PCM编码,矢量量化
语音识别
前端处理认可
实用功能
杂项实用功能
音频文件输入/输出
例程可供阅读,并在某些情况下,写信,各种文件格式:
读写后缀
readwav writewav 。 WAV等,这些例程允许任意数量的渠道,也能对付线性的PCM (任何精度高达32位) ,律PCM和木法的PCM 。大型文件,可以读,写在小大块。
问题补充: readhtk writehtk 。 HTK液读写波形文件所用熵的隐马尔可夫工具箱。
readsfs 。自力更生支援讲话备案系统档案,由马克huckvale在UCL的。
readsph 。 NIST的手机领域中的格式文件(包括timit ) 。
readaif 。 AIF的音频交换文件格式所使用的Mac用户。
频率大规模改建
该梅尔表是基于人类感知的正弦波足球场。该例程mel2frq和frq2mel转换之间的这种规模和频率在Hz的。
雇员再培训局,规模化,是基于等价矩形带宽的人耳。该例程erb2frq和frq2erb转换之间的利率再培训局的规模和频率赫兹。
使用MIDI标准,还明确规定了编号的半音中c正60 。该例程frq2midi和midi2frq间进行转换,这音乐频率规模和赫兹。 frq2midi会除了输出注意到在名称中字符格式。 midi2frq可以使用一般同等规模的锻炼,否则毕达哥拉斯规模只是音调。
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2011-08-26
展开全部
nonono,你连matlab都不会
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
给你材料
追问
是在MATLAB里使用HTK吗?发到我的邮箱吧~sharon81818@hotmail.com,谢谢啦
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询