什么是声纹识别?

 我来答
匿名用户
2017-01-13
展开全部

语音携带的信息非常丰富,大家普遍了解的语音识别是指对语音内容的识别技术,即解决了“给定语音到底说了什么”的问题。

      声纹识别简单的说就是判断给定的一句话到底是谁说的技术。早在上世纪40年代末期就有相关研究者开始进行相关技术的探索,主要应用于军事情报领域。其理论基础就是“每个人的说话特性都具有其独特的特征”,而决定这种独特特征的主要因素有:

1、声腔的差异,其包括咽喉、鼻腔、口腔以及胸腔等,这些欺诳的形状、尺寸和位置决定了声腔的差异。因此大家可以感受到,不同的人说话,其声音的频率分布是不同的;

2、发声的操作方式,主要是指唇、口齿、舌头等部位在发声时的相互作用。

      一般而言,人在逐渐的学习过程中就会慢慢的形成了自己的声纹特性,正常说话时的声纹状态还是相对稳定的。但是声纹特性仍然具有易变性,因为影响声纹特性的两个因素非常容易受身体状况、年龄、情绪等情况的干扰,从而导致声纹特性的变化。例如:人随着年龄的变化声纹特性也在随之变化,尤其是小时候和成年后;人在感冒时由于鼻腔堵塞等问题会明显感觉到声纹特性的不一致等。当然,人也可以通过刻意的模仿等形成不同的声纹特性。总而言之,声纹特征是类似于虹膜、指纹等一种具有独特性的生物特征。

      声纹识别从任务上来说,主要分为声纹确认技术(1:1)和声纹识别技术(1:N)两类。声纹确认技术回答的是两句话到底是不是一个人说的问题,而声纹识别技术回答的则是”给定的一句话属于样本库中谁说的”问题。

百度网友de2dd8c
2017-08-07
知道答主
回答量:5
采纳率:0%
帮助的人:4931
展开全部

声纹识别也叫“说话人识别”,是生物识别技术中的一种,简单来说的话,声纹识别技术可以“确认说话人是谁”。我们说话的时候,每个人的发音器官、发音通道和发音习惯上有个体差异,声纹识别技术就是为了识别出说话人之间这些差异,

 

根据目的不同,声纹识别也可分为“说话人辨认”和“说话人确认”两种类型:

“说话人辨认”可以理解为:一堆人在说话,从这堆人当中辨认出某一个人的说话声,俗称“1:N”;

“说话人确认”可以理解为:从一堆人当中辨认出了某一个人的说话声,对这个人进行再确认,确认这个人就是已有声纹的持有者,俗称“1:1”。


在声纹识别技术中,比较关键的指标有:

FAR(FalseAccept Rate)错误接受率:即把A的声音当做了B的声音;

FRR(FalseReject Rate)错误拒绝率:即未把A的声音当做A本人的声音;

EER(EqualError Rate)等错误率:即FAR=FRR时的错误率


EER是评价声纹识别技术的核心标准,简单来说,EER越小,说话人声纹识别的准确率就越高。比如国内厂商SpeakIn为公安及司法机构提供的“搏音”声纹算法的EER为0.5,识别准确率就是99.5%。

此外,声纹采样率、采样信噪比、语音时长、文本内容等音素也会在不同程度上影响声纹识别准确率。

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
秒懂百科
2020-12-26 · TA获得超过5.9万个赞
知道大有可为答主
回答量:25.3万
采纳率:88%
帮助的人:1.2亿
展开全部

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(1)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式