人类的听觉感知
1个回答
展开全部
今天,语音识别课程学习了人类的听觉感知,通过感知系统,我们可以知道说话的人是谁,知道这个人的方位信息以及距离我们的远近,我们知道他说的话是什么意思,在什么样的真实场景等等,主要用在音乐上。
在语音信号处理的过程中,包含噪声的处理以及混响的处理,在传输过程中的信道畸变以及加性噪声,处理语音信息是困难的,其中以人声的噪声处理最为困难。
语音分离是最近几年做的比较火的方向之一,大部分都是基于CASA(计算机处理听觉分析)的基础上进行的扩展,CASA用于在不同的场景,根据不同的说话人如何识别目标人的语音信息,主要的作用是做助听器,语音识别,耳机降噪,以及音频信息的解锁。
语音分离原来很难,分离效应比较难攻克,深度学习出现后,大量的人转到此方向上,其他的方向人数减少,通过监督学习进行语音分离成为趋势,其中信息包含代价函数以及优化函数,增强算法以及网络结构等等。IBM是一种算法,是一种二值逻辑,当信噪比大于一定的阈值时,输出为1,否则输出为0. IRM是另外一种算法,其数值在0到1之间。1953年提出听觉感知的概念后,大量应用于各个学科,包罗语音学,心理学等。
基于DNN的说话人分离算法,训练的与测试的说话人是相同的,在训练阶段增加说话人干扰可以提高识别率。大部分都是基于指定人的识别。现在的论文中大部分都是用IBM做语音分离,直接通过实验得出结论,但是为什么IBM可以用于语音分离的论文没有,这方面的理论有待挖掘,现在提倡端到端,不再考虑算法问题,算法问题交由深度学习进行提取。
在语音信号处理的过程中,包含噪声的处理以及混响的处理,在传输过程中的信道畸变以及加性噪声,处理语音信息是困难的,其中以人声的噪声处理最为困难。
语音分离是最近几年做的比较火的方向之一,大部分都是基于CASA(计算机处理听觉分析)的基础上进行的扩展,CASA用于在不同的场景,根据不同的说话人如何识别目标人的语音信息,主要的作用是做助听器,语音识别,耳机降噪,以及音频信息的解锁。
语音分离原来很难,分离效应比较难攻克,深度学习出现后,大量的人转到此方向上,其他的方向人数减少,通过监督学习进行语音分离成为趋势,其中信息包含代价函数以及优化函数,增强算法以及网络结构等等。IBM是一种算法,是一种二值逻辑,当信噪比大于一定的阈值时,输出为1,否则输出为0. IRM是另外一种算法,其数值在0到1之间。1953年提出听觉感知的概念后,大量应用于各个学科,包罗语音学,心理学等。
基于DNN的说话人分离算法,训练的与测试的说话人是相同的,在训练阶段增加说话人干扰可以提高识别率。大部分都是基于指定人的识别。现在的论文中大部分都是用IBM做语音分离,直接通过实验得出结论,但是为什么IBM可以用于语音分离的论文没有,这方面的理论有待挖掘,现在提倡端到端,不再考虑算法问题,算法问题交由深度学习进行提取。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询