音频压缩详细资料大全
展开全部
音频压缩技术指的是对原始数字音频信号流(PCM编码)运用适当的数位讯号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。它必须具有相应的逆变换,称为解压缩或解码。音频信号在通过一个编解码系统后可能引入大量的噪声和一定的失真
音频压缩技术的出现及早期套用,音频信号的冗余信息,频谱掩蔽效应。,时域掩蔽效应。,压缩编码方法,压缩方法其它划分,音频压缩算法的主要分类及典型代表,时域压缩(或称为波形编码)技术,子带压缩技术,音频压缩技术的标准化和MPEG-1,音频压缩技术的出现及早期套用
音频压缩技术指的是对原始数字音频信号流(PCM编码)运用适当的数位讯号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。它必须具有相应的逆变换,称为解压缩或解码。音频信号在通过一个编解码系统后可能引入大量的噪声和一定的失真。 数位讯号的优势是显而易见的,而它也有自身相应的缺点,即存储容量需求的增加及传输时信道容量要求的增加。以CD为例,其采样率为44.1KHz,量化精度为16比特,则1分钟的立体声音频信号需占约10M位元组的存储容量,也就是说,一张CD唱盘的容量只有1小时左右。当然,在频宽高得多的数字视频领域这一问题就显得更加突出。是不是所有这些比特都是必需的呢?研究发现,直接采用PCM码流进行存储和传输存在非常大的冗余度。事实上,在无损的条件下对声音至少可进行4:1压缩,即只用25%的数字量保留所有的信息,而在视频领域压缩比甚至可以达到几百倍。因而,为利用有限的资源,压缩技术从一出现便受到广泛的重视。 对音频压缩技术的研究和套用由来已久,如A律、u律编码就是简单的准瞬时压扩技术,并在ISDN话音传输中得到套用。对语音信号的研究发展较早,也较为成熟,并已得到广泛套用,如自适应差分PCM(ADPCM)、线性预测编码(LPC)等技术。在广播领域,NICAM(Near Instantaneous Companded Audio Multiplex - 准瞬时压扩音频复用)等系统中都使用了音频压缩技术。音频信号的冗余信息
数字音频压缩编码在保证信号在听觉方面不产生失真的前提下,对音频数据信号进行尽可能大的压缩。数字音频压缩编码采取去除声音信号中冗余成分的方法来实现。所谓冗余成分指的是音频中不能被人耳感知到的信号,它们对确定声音的音色,音调等信息没有任何的帮助。冗余信号包含人耳听觉范围外的音频信号以及被掩蔽掉的音频信号等。例如,人耳所能察觉的声音信号的频率范围为20Hz~20KHz,除此之外的其它频率人耳无法察觉,都可视为冗余信号。此外,根据人耳听觉的生理和心理声学现象,当一个强音信号与一个弱音信号同时存在时,弱音信号将被强音信号所掩蔽而听不见,这样弱音信号就可以视为冗余信号而不用传送。这就是人耳听觉的掩蔽效应,主要表现在频谱掩蔽效应和时域掩蔽效应,现分别介绍如下:频谱掩蔽效应。
一个频率的声音能量小于某个阈值之后,人耳就会听不到,这个阈值称为最小可闻阈。当有另外能量较大的声音出现的时候,该声音频率附近的阈值会提高很多,即所谓的掩蔽效应。 合并图册时域掩蔽效应。
当强音信号和弱音信号同时出现时,还存在时域掩蔽效应。即两者发生时间很接近的时候,也会发生掩蔽效应。时域掩蔽分为前掩蔽、同时掩蔽和后掩蔽三部分。前掩蔽是指人耳在听到强信号之前的短暂时间内,已经存在的弱信号会被掩蔽而听不到。同时掩蔽是指当强信号与弱信号同时存在时,弱信号会被强信号所掩蔽而听不到。后掩蔽是指当强信号消失后,需经过较长的一段时间才能重新听见弱信号,称为后掩蔽。这些被掩蔽的弱信号即可视为冗余信号。压缩编码方法
音频信号编码按照压缩原理不同,分为波形编码、参数编码以及多种技术相互融合的编码形式 (1)波形编码直接对音频信号的时域或频域波形按一定速率采样,然后将幅度样本分层量化,变换为数字代码,由波形数据产生一种重构信号编码系统源于信号原始样值,波形与原始声音波形尽可能地一致,保留了信号的细节变化和各种过渡特征。 (2)参数编码首先根据不同的信号源,如语言信号、自然声音等形式建立特征模型,通过提取特征参数和编码处理,力图使重建的声音信号尽可能高的保持原声音的语意,但重建信号的波形同原声音信号的波形可能会有相当大的差别。常用的特征参数有共振峰、线性预测系数、频带划分滤波器等参数编码技术可实现低速率的声音信号编码,比特率可压缩到2Kbit/s - 4.8Kbit/s ,但声音的质量只能达到中等,特别是自然度较低,仅适合语言语言的传递与表达。 (3)混合编码将波形编码和参数编码组合起来的编码形式克服了原有波形编码和参数编码的弱点,力图保持波形编码的高质量和参数编码的低速率,在4 - 16Kbit/s速率上能够得到高质量的合成声音信号。混合编码的基础是线性预测编码(LPC ),常用脉冲激励线性预测编码(MPLPC )、规划脉冲激励线性预测编码(KPELPC)码本激励线性预测编码(CELPC)等编码方式。压缩方法其它划分
在音频压缩领域,有两种压缩方式,分别是有损压缩和无损压缩!我们常见到的MP3、WMA、OGG被称为有损压缩,有损压缩顾名思义就是降低音频采样频率与比特率,输出的音频档案会比原档案小。另一种音频压缩被称为无损压缩,也就是我们所要说的主题内容。无损压缩能够在100%保存原档案的所有数据的前提下,将音频档案的体积压缩的更小,而将压缩后的音频档案还原后,能够实现与源档案相同的大小、相同的码率。无损压缩格式有APE、FLAC、WavPack、LPAC、WMALossless、AppleLossless、La、OptimFROG、Shorten,而常见的、主流的无损压缩格式只有APE、FLAC。音频压缩算法的主要分类及典型代表
一般来讲,可以将音频压缩技术分为无损(lossless)压缩及有损(lossy)压缩两大类,而按照压缩方案的不同,又可将其划分为时域压缩、变换压缩、子带压缩,以及多种技术相互融合的混合压缩等等。各种不同的压缩技术,其算法的复杂程度(包括时间复杂度和空间复杂度)、音频质量、算法效率(即压缩比例),以及编解码延时等都有很大的不同。各种压缩技术的套用场合也因之而各不相同。时域压缩(或称为波形编码)技术
直接针对音频PCM码流的样值进行处理,通过静音检测、非线性量化、差分等手段对码流进行压缩。此类压缩技术的共同特点是算法复杂度低,声音质量一般,压缩比小(CD音质> 400kbps),编解码延时最短(相对其它技术)。此类压缩技术一般多用于语音压缩,低码率套用(源信号频宽小)的场合。时域压缩技术主要包括 G.711、ADPCM、LPC、CELP,以及在这些技术上发展起来的块压扩技术如NICAM、子带ADPCM(SB-ADPCM)技术。子带压缩技术
子带编码理论最早是由Crochiere等于1976年提出的。其基本思想是将信号分解为若干子频带内的分量之和,然后对各子带分量根据其不同的分布特性采取不同的压缩策略以降低码率。通常的子带压缩技术和下面介绍的变换压缩技术都是根据人对声音信号的感知模型(心理声学模型),通过对信号频谱的分析来决定子带样值或频域样值的量化阶数和其它参数选择的,因此又可称为感知型(Perceptual)压缩编码。这两种压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。一般来讲,子带编码的复杂度要略低于变换编码,编码延时也相对较短。音频压缩技术的标准化和MPEG-1
由于数字音频压缩技术具有广阔的套用范围和良好的市场前景,因而一些研究机构和公司都不遗余力地开发自己的专利技术和产品。这些音频压缩技术的标准化工作就显得十分重要。 在音频压缩标准化方面取得巨大成功的是MPEG-1音频(ISO/IEC11172-3)。在MPEG-1中,对音频压缩规定了三种模式,即层Ⅰ、层Ⅱ(即MUSICAM,又称MP2),层Ⅲ(又称MP3)。由于在制订标准时对许多压缩技术进行了认真的考察,并充分考虑了实际套用条件和算法的可实现性(复杂度),因而三种模式都得到了广泛的套用。VCD中使用的音频压缩方案就是MPEG-1层Ⅰ;而MUSICAM由于其适当的复杂程度和优秀的声音质量,在数字演播室、DAB、DVB等数位元组目的制作、交换、存储、传送中得到广泛套用;MP3是在综合MUSICAM和ASPEC的优点的基础上提出的混合压缩技术,在当时的技术条件下,MP3的复杂度显得相对较高,编码不利于实时,但由于MP3在低码率条件下高水准的声音质量,使得它成为软解压及网路广播的宠儿。可以说,MPEG-1音频标准的制订方式决定了它的成功,这一思路甚至也影响到后面将要谈到的MPEG-2和MPEG-4音频标准的制订。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
上海巴鲁图工程机械科技有限公司_
2022-05-15 广告
2022-05-15 广告
解码器是一种将信息从编码的形式恢复到其原来形式的器件,能将数字视音频数据流解码还原成模拟视音频信号的硬件/软件设备。解码器是一个重要前端控制设备。在主机的控制下,可使前端设备产生相应的动作。解码器,国外称其为接收器/驱动器是为带有云台、变焦...
点击进入详情页
本回答由上海巴鲁图工程机械科技有限公司_提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询