语音合成芯片的产生背景

 我来答
手机用户33274
2016-06-03 · 超过58用户采纳过TA的回答
知道答主
回答量:209
采纳率:0%
帮助的人:120万
展开全部

伴随着各种家用电器设备,车载设备的功能增加,设备的操控性越来越复杂;人机交互设计在系统设计中的地位越来越重要。受到系统成本、体积等多方面的限制,应用开发人员可以选择的人机交互设计方法并不多。利用语音合成芯片来增强人机交互性能的方法又重新开始受到应用开发人员的重视。
语音合成芯片的核心技术是语音数据压缩。这项技术在二战前就开始被研究,但其转化为芯片并被实际产品采用却是在70年代末。由于受到存储器容量的限制,当时比较流行的是参数合成方式,这是一种模拟人体发声器官,建立数学模型,并以此作为参数进行压缩合成的方法。但是这种方法的实际使用效果并不能满足人们的要求,最终在市场上受到认可的是基于ADPCM(Adaptive differential PCM)技术的语音压缩合成方式。
OKI公司从70年代就从事ADPCM的研究开发工作,并不断进行改进,相继推出了具有更大压缩率和更高音质的OKI ADPCM、OKI ADPCM2方式。OKI语音芯片完美的音质,优秀的性能得到了客户的认可,25年的累计出货量达到了4亿个。 高音质语音合成芯片增强人机交互性能 在使用语音合成芯片时,最令应用开发人员头痛的问题是如何在有限的存储器当中,放入更多的语音数据。通常的做法是将播放内容中重复出现的地方进行切割,在需要利用的时候,对这些重复内容进行复用。虽然这个做法可以解决问题,但一般在使用当中,如果有大量需要复用的语音段出现时,将会使播放控制程序非常冗长。而且在不同的地方进行复用时,音调、语速等都会有微妙变化,这些变化如果不加以区分处理,就会在播放时造成不自然和失真。因此在播放不同内容时需要适当加入不同的延时。比如在实现图1的播放内容时,一般需要程序写成如下形式。 Play(Address1); Delay(xxx); Play(Address2); Delay(xxx); Play(Address4); Delay(xxx); Play(Address5); 这种实现方法无疑是对程序存储器的一种极大浪费。而且由于在播放指令发出时,MCU必须对相应的控制线或者IO进行操作,指令的反复使用也是对CPU资源的浪费。更糟糕的是在播放指令执行过程当中,一旦有中断等意外发生的话,很容易出现播放异常现象。

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
苏州千视通视觉科技股份有限公司_
2024-11-04 广告
千视通是国内第一梯队推出多模态AI大模型网关和边缘大模型一体机产品方案的领先AI企业。 拥有行业领先的多模态视觉语言大模型技术,践行“Make high-quality AI quickly”理念,平台基于多模态预训练,支持用户自定义算法可... 点击进入详情页
本回答由苏州千视通视觉科技股份有限公司_提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式