音频的构架以及原理(6)

来源：网络收集时间：2019-03-03 下载这篇文档手机版

说明：文章内容仅供预览，部分内容可能不全，需要完整文档或者需要复制内容，请下载word后使用。下载word有问题请添加微信号:或QQ：处理（尽可能给您提供完整文档），感谢您的支持与谅解。

一段振幅较大的声音信号此时会产生较大的量化误差，如果在解码中又经过反变换则这个量化误差又会再被放大，这就产生前回应的现象（如下图所示）。后面就提到了MDCT(离散余弦变换)的长短窗口来解决这一问题。

以44.1KHZ的取样频率为例。MP3一个编码框包含1152个声音信号，相当于26.1ms的时间长度，则前回音按照回音遮蔽效应原理其涵盖范围为20MS左右，无法很好的遮蔽前回音。此时我们用MDCT短窗口（相当于在时间上的细分）就可以把26.1Ms时间长度缩短到8.7MS，这样以来前回音就不会被发觉了。MP3编码中是由PE（后面有说）值来决定使用MDCT长窗还是短窗的。当PE值大于1800时我们就需要使用长框（当然这里是指44.1KHZ/24bit的CD音质的采样）。因为PE大于1800时表示需要用较多的位元来编码，表示此时声音信号的变化比较大，容易出现前回音。

5.3 PE 值的计算

了解了心里声学模型我们接下去就可以讨论如何通过这一模型来压缩我们的音频信号的数据。

在这里我们引入一个量PE来说明。PE的单位是bits/sample。其意思是每个采样数据需要占用的bit数。（我们所说的24/32bits是最大情况下的采样精度并不是每个采样信号都用这么多，我们压缩就是从这里入手的）下面讨论PE的计算方法。（我们编码是按照一帧一帧来编码的。以1152个采样值为一帧。因此我们这里的PE其实是一个编码帧中所需要的比特数）

P(w)=Re(w)^2+Im(w)^2 P(w)为每个频线的能量。??.2.2

i?bhBi=i?bl?P(w) i代表第i个频带，Bi是第i个频带的能量。?.2.3

SFdb(X)?15.81?7.5*(x?0.474)?17.51?(x?0.474)2dB SF（x）相

邻???.2.4

频带带来的遮蔽作用。其中X是频带之间的距离。 Ci=Bi*SF(X)?????2.5

SFM?μGμA 其中μG,与μA分别是各个临界频带的几何平均数和算术品均

数。

SFMdbα=min(,１）-60然后得出单频系数

然后再得出offest如下

Qi?α*（14.5?i）?（1-i）*5.5 ????2.6

lgCi?0.1*QiT?10再得出临界频带的门限值 i

当然我们最后还要把静音门限考虑进来所以最终的门限值为 Ti=max(Ti,

Tqi)。其中

Tqi为静音门限值。（是一个固定值，可以查表得到）。

最终我们得到PE。

PE???[log2(ninti?1w?bli?25bhRe(w)Im(w)?1)?log2(nint)]6Ti/ki6Ti/ki???????.2.

PE表示维持在CD音质下的最低取样的位元数。

5.3位元的分配以及帧格式

位元的分配是由MNR来决定我们只要保证MNR大于0就可以，因此可

以根据不同频带的SMR来合理的分配位元使得其MNR(SMR-SNR)大于0.当然为了达到更好的效果，其实是一个反复的过程，每次找出最小的MNR的频带，分配位元给此频带以提高MNR，接着重新计算个频带的MNR然后再重复此过程直到位元分配完毕。

位元数的计算。比如128kbps的传输率，其中1152是每个编码框44.1khz为取样频率。则可编码的位元数是

N=128*1024/(44.1*1000/1152)=3344个编码单元。

MP3的位元串格式。P3的一个位元串就表示一个编码框的编码资料。其位元串包含：档头区，错误侦测码区，附属资料和主要资料。档头和附属资料是我们解码时所需要的资料。错误侦测码是解码是做侦测作用防止因为当头出现错误而无法解码资料。

MP3档头的格式：

档头包含同步化参考标记，错误侦测，辨认ID，位元率，错误侦测，取样频率，音频模式等等。

MP3位元储藏处

因为MP3每个编码框对应的音频信号不尽相同，所以为了维持一定的音频质量，每个编码框所需要的位元数也不尽相同。因此MP3使用位元储藏的机制来调制，使得所需位元少的编码框得到较少的位元数，所需位元数多的得到更多的位元。每个编码框都有一个9个位元的暂存器存放与其附属资料内。每个暂存器指定了编码框资料的开始位置。这样以来就可以动态的决定每个编码框的开端。如下图所示frame1有未用完的空间，frame2的指标main_data_benin指向frame1未用完的区域。

5.5MP3的编码过程

MP3的编码主要是去除采样信号中冗余的和根据第二心里声学模型所示的被屏蔽的量。对音频的编码也是一步步来的，对于刚开始的语音信号由于它比较粗糙流量比较小我们一般只是用DPCM，ADPCM等一系类比较简单的编码技术。到后来的高保真语音编码技术就开始用子带滤波以及心里声学的原理了。刚开始的子带滤波与现在的还不同，其过程是：先把模拟音频信号通过带通滤波器滤波，再对其进行采样，再对其采样值根据心理声学模型进行量化，分配不同的比特率。但是这个有一个显著的缺陷就是音频信号经过模拟的带通滤波器会带来失真。另外带通滤波器本身也存在很大的失真。所以MP3编码就现采样，然后通过数字带通滤波器对其数字信号进行滤波。

图3-1

MP3的编码过程如上图所示。输入的音频采样信号先经过一个滤波器组分成32个子频带的信号；同时输入信号经过离散傅立叶变换得到频域的信号；接着32

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读，免费范文网，提供经典小说综合文库音频的构架以及原理(6)在线全文阅读。

音频的构架以及原理(6).doc 将本文的Word文档下载到电脑，方便复制、编辑、收藏和打印下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档

本文链接：https://www.77cn.com.cn/wenku/zonghe/488880.html（转载请注明文章来源）

上一篇：信息化安全管理制度
下一篇：人教版小学六年级上册语文期中测试题