人类的听觉感知

 我来答
机器1718
2022-06-15 · TA获得超过6798个赞
知道小有建树答主
回答量:2805
采纳率:99%
帮助的人:157万
展开全部
    今天,语音识别课程学习了人类的听觉感知,通过感知系统,我们可以知道说话的人是谁,知道这个人的方位信息以及距离我们的远近,我们知道他说的话是什么意思,在什么样的真实场景等等,主要用在音乐上。

    在语音信号处理的过程中,包含噪声的处理以及混响的处理,在传输过程中的信道畸变以及加性噪声,处理语音信息是困难的,其中以人声的噪声处理最为困难。

    语音分离是最近几年做的比较火的方向之一,大部分都是基于CASA(计算机处理听觉分析)的基础上进行的扩展,CASA用于在不同的场景,根据不同的说话人如何识别目标人的语音信息,主要的作用是做助听器,语音识别,耳机降噪,以及音频信息的解锁。

    语音分离原来很难,分离效应比较难攻克,深度学习出现后,大量的人转到此方向上,其他的方向人数减少,通过监督学习进行语音分离成为趋势,其中信息包含代价函数以及优化函数,增强算法以及网络结构等等。IBM是一种算法,是一种二值逻辑,当信噪比大于一定的阈值时,输出为1,否则输出为0. IRM是另外一种算法,其数值在0到1之间。1953年提出听觉感知的概念后,大量应用于各个学科,包罗语音学,心理学等。

    基于DNN的说话人分离算法,训练的与测试的说话人是相同的,在训练阶段增加说话人干扰可以提高识别率。大部分都是基于指定人的识别。现在的论文中大部分都是用IBM做语音分离,直接通过实验得出结论,但是为什么IBM可以用于语音分离的论文没有,这方面的理论有待挖掘,现在提倡端到端,不再考虑算法问题,算法问题交由深度学习进行提取。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式