其中,滤波器组与MPEG层III所采用的滤波器组相比,由于层III算法在对滤波器进行选择时考虑了兼容性问题,因而具有固有的结构上的不足;而AAC则直接采用了MDCT变换滤波。同时,AAC增加了窗口长度,由1152点增至2048,使MDCT的性能优于原来的滤波器组。
时域噪声整形(TNS)技术是时域/频域编码中一项新颖的技术。它利用频域的自适应预测的结果来对时域中量化噪声的分布进行整形处理。通过采用TNS技术,可以使特殊环境下的话音信号质量得到显著的提高。
后向自适应预测是一项在语音信号编码系统领域建立起来的技术。它主要利用了某一特定形式的音频信号易于预测的特点。
在量化过程中,通过对量化精度更为精细的控制,可以使给定的码率得到更加有效的利用。在码流复接时,通过对必须传输的信息进行熵编码使冗余度降至最低。
通过以上各种编码技术的运用以及采用一种可变的码流结构,使AAC编码算法在得到大大优化的同时, 也为将来进一步提高编码效率提供了可能性。
事实上,在AAC编码的三种类型中,各种编码技术的使用也是不同的,也就是说,三种类型的算法复杂度是不同的。这一不同考虑了编、解码两端的算法复杂度。例如,后向自适应预测约占解码运算量的45%左右,在LC和SSR类型中都没有采用这一技术。另外,在LC类型中,TNS滤波器的长度被限制为12个系数,但仍保持了18 KHz带宽;在SSR类型中,TNS也只使用12个系数,并且带宽限制为6 KHz,同时该类型也没有采用声道耦合技术,在混合滤波器组的结构及增益控制方面也与另两种类型不同。
AAC可以在低数据率的情况下提供较高质量的音频信息,如每个声道仅64kb/s时就会有比较好的性能。
AAC当前的应用主要用于日本的数字音频广播及美国的IBOC(带内同频技术)。
6、 用于DTS的相干声学编码
DTS系统中采用的数字音频压缩算法——相干声学编码,主要目的就是用于提高民用音频重放设备重放的音频质量的,其音频重放质量可以超越原有的如CD唱片的质量。同时通过更多扬声器的使用,使得听众可以感受到普通立体声无法达到的声音效果。因此总体目标就是将听众真正的带入专业的音响领 域及多声道环绕声的天地。
相干声学编码器是一种感知、优化、差分子带音频编码器,它使用了多种技术对音频数据进行压缩。下面将分别对其进行详细的描述。从整体来看,编码器与解码器的实现是不对称的。理论上编码器可以设计的非常复杂,但实际上,编码器
图19 相干声学解码器流程图
第二步是通过在每个子带中传输的辅助信息指令,对子带中的差分信号进行反量化得到子带PCM信号。这些通过反量化得到的子带PCM信号再进行反滤波处理,得到每个声道的全频带的时域PCM信号。在解码器中,没有程序用于音频质量的调整。
在解码器中包括一个可选的DSP功能模块,这个模块主要用于用户的编程使用。它允许对单个声道或全部声道中子带或是全频带PCM信号进行处理。这些功能诸如上矩阵变换、下矩阵变换、动态范围控制以及声道之间的延时调整等。
6.3
DTS系统最早是用于电影应用中的。在1993年的电影“Jurassic Park”(侏罗纪公园)中,没有使用AC-3,而是使用了DTS多声道数字音频系统。DTS系统中的音频数据是存储在一张CD-ROM上的,取代了将声音记录在胶片上的方式,而是在胶片上记录用于同步CD-ROM音频信息的时间码,通过电影胶片上的时间码来同步播放CD-ROM。由于CD-ROM与电影胶片磁迹相比,具有更大的容量和更稳定的可靠程度,因此它可以在4:1压缩比的情况下提供质量更高的多声道音频信息。对于AC-3来说,典型的压缩比为12:1。随着应用的普及,DTS系统又提出一种低数据率版本,其参数规范如下:
音频声道的个数DTS=1——10.1
FsDTS=8——192kHz
RDTS=16——24bit
BDTS=32——6144kb/s
数据帧大小DTS=512样本
在低数据率版本中,由0到24kHz的32个子带的频率,通过一个512抽头的多相正交镜象滤波器(PQMF)来实现从时域到频域的映射。另外8个附加的子带覆盖了24kHz到48kHz之间频率范围,2个附加的子带覆盖了48 kHz到96 kHz之间的频率范围。为了进一步减小冗余度,采用了前向自适应线性预测,同时心理声学模型用来对信号进行预测,在量化过程中使用了标度量化和矢量量化。
DTS的大多数应用都是采用相对较小的压缩比、工作在几乎无损情况的模式下的。一般来说,数据率在1Mb/s的情况下,DTS可以提供较好质量的音频。DTS的应用也主要是在电影、CD及DVD视频中。另外,DTS所具有的可变比特率编码方式使得它同样可以应用于DAB及DVD的广播中。
7、
数字音频广播系统的