语音识别芯片的基本原理
语音芯片根据集成电路类型来分,凡是与声音有关系的集成电路被统称为语音芯片(又称语音IC,这里应该叫成Voice IC),但是在语音芯片的大类型中,又被分为语音IC(这里应该叫成Speech IC),音乐IC(这里应该叫成Music IC)两种.(a)现在市场上常见语音芯片分类:短时间芯片有10秒,20秒,40秒,80秒,170秒的芯片,常用的模块有:6分钟,8分钟,16分钟,1小时的等。通用的芯片有:3秒到340秒。(b)现在市场上常见音乐芯片分类:单音片:是一种很基本的音乐IC,是音乐单通道的,同一时间音符输出的多少,决定了单音片的成效,有70多,100多音符等等.音乐通道:2通道、3通道、4通道、8通道、12通道等更多,控制方式:按键控制,一线串口控制,二线串口控制,三线串口控制,并口控制,单片机控制,等等 。(c)现行的语音芯片主要是在广州和深圳两地研发并且生产,主要的语音芯片大概分20秒、40秒、80秒、170秒等等,与传统的芯片相比,这些ic多数采用的是8脚封装,使操作变得更加简单了。
深圳唯创知音电子有限公司,于1999年创立,公司专注于音乐芯片,语音模块,声音IC,录音芯片,语音识别芯片,语音识别模块等产品的研发和生产;语音芯片线主要包括OTP语音芯片、可重复烧写语音芯片、远程下载系列、录音系列、MP3系列、语音模块、语音识别系列,知名品牌有WT588F、WT2605、WT2000H、WT2003、WT588E、WTK6900等系列产品,提供语音个性化定制方案,拥有软硬件实力,WT为我司自有品牌,目前我司已服务于超过5000家国内外知名企业.想了解更多相关信息,可以咨询深圳唯创知音电子有限公司,谢谢!
2024-05-10 广告
语音识别芯片的工作原理,可以分为以下几个主要步骤:
语音采集:语音识别芯片通过麦克风或其他录音设备,采集语音信号。
语音信号处理:语音识别芯片接收到语音信号后,会对语音信号进行预处理,包括去噪、起伏处理等。
语音信号特征提取:对预处理后的语音信号进行特征提取,包括时域特征、频域特征、神经特征等。
模型训练:使用已提取的特征数据训练语音识别模型,包括基于规则的模型、基于统计模型的模型等。
语音识别:使用训练好的模型对输入的语音信号进行识别,将识别结果转换为文本形式。
NRK10语音识别芯片为广州九芯电子自主研发的一款高性能、低成本的离线语音识别芯片,具有语音识别及播报功能,需要外挂 SPI-Flash,存储词条或者语音播内容。他具有识别率高,工业级性能、简单易用,更新词条方便等优势。广泛应用在智能家居、AI人工智能、玩具等多种领域。
产品特征:
• 工作电压:3.3V~5.5V,一般为 4.2V
• 休眠电流:<7uA
• 未休眠待机电流:25~50mA
• 唤醒方式:休眠后可以从任何GPIO、RTC、或WDT中断来唤醒,使其进入待机状态;待机状态下通过唤醒词或者词条来进入工作状态。
• 固定词条,非特定人识别
• 可识别 20个词条(每个词条建议三字或以上),总字数在50~60字之间。
• 识别环境:安静无回声.
• 识别效果:安静无回声环境,2 米内识别率可达 90%及以上,最远距离可以达到5米.
• 识别语种:可识别 32 种语种,如英语,中文,日语,粤语等等(不可同时识别多种语种,即一个模块无法同时识别中文,英文,日语).
• PWM输出,可直接驱动8欧0.5W喇叭;DAC输出,可外接功放。
• 音频输出的内容需要放置在外挂的SPI_Flash中。.
• 低电压复位:低于1.6V芯片进行复位
• 内置低压差稳压器(LDO) -可在3.3V提供25ma负载电流 -可配置的输出电压:8个选项1.5v/1.7v/1.8v/2.4v/2.5v/2.7v/3v/3.3v,默认 为3.3V。
• 工作温度:-10°C~+70°C.
• 芯片程序与词条存储方式是OTP存储方式,• 一次性烧录,都存在主控芯片里面,方便试样与量产。播报的语音存储在外挂SPI FLASH。支持8M/16M/32Mbit SPI FLASH。
• 内置UART串口,方便单片机控制与通信.
• 内置MIC 2级偏压放大电路,以及自置AGC增益控制,以及率噪电路。
• 封装形式有LQFP32、COB.