音频压缩的成功者——感知编码

于这种编码方式所产生的数据量太大，存储和传输都既不方便也不经济，有时甚至是行不通的。对于电视广播来说，数据传输速率越高，每套节目所需的频宽就越大，在频带资源日趋紧张的今天，过宽的频带是不能允许的，同时对于有形载体（激光碟、磁带等），每种载体的记录密度都是有限的（受当时技术发展程度的制约），增大数据量就意味着缩短节目长度。因此需要开发一种新的编码方式，它应该使用较少的数据量，而又不会导致音质的主观听感有明显的下降。

二、感知编码原理

1 、理论基础——闻域和临界频段

音频压缩理论是建立在心理声学模型基础上，从研究人耳的听感系统开始的。

人耳实际上可看成一个多频段的听感分析器，在接收端的最后，它对瞬间的频谱功率进行了重新分配，这就为音频的数据压缩提供了依据。

众所周知，声源振动的能量通过声波传入人耳，使耳膜发生振动，人们就产生了声音的感觉。但是人耳能听到的振动频率约在 20 Hz 到 20KHz 之间，低于 20 Hz 或高于 20K Hz 的振动，不能引起人类听觉器官的感觉。心理声学模型中一个基本的概念就是听觉系统中存在一个听觉阈值电平，低于这个电平的声音信号就听不到，因此就可以把这部分信号去掉。听觉阈值的大小随声音频率的改变而改变，各个人的听觉阈值也不同。大多数人的听觉系统对 2kHz ～ 5kHz 之间的声音最敏感。一个人是否能听到声音取决于声音的频率，以及声音的幅度是否高于这种频率下的听觉阈值。这就是说在听觉阈值以外的电平可以去掉，相当于压缩了数据。另外，听觉阈值电平是自适应的，即听觉阈值电平会随听到的不同频率的声音而发生变化。也许你有这样的体验，在一安静房间里的普通谈话可以听得很清楚，但在播放摇滚乐的环境下同样的普通谈话就听不清楚了。声音压缩算法也同样可以确立这种特性的模型来取消更多的冗余数据。

2 、掩蔽效应

心理声学模型中的另一个概念是听觉掩饰特性—— 掩蔽效应，即一种频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应。前者称为掩蔽声音 (masking tone) ，后者称为被掩蔽声音 (masked tone) 。

掩蔽效应探讨的基础是感知编码中的一个重要的概念——临界频段，即人耳对不同频率段声音信号的反应灵敏程度有所差别。人耳中包含了约 3 万个毛细胞，它们能够检测到基膜的振动，通过生理脉冲将音频信息传到大脑，但这些细胞在不同频率的敏感程度不同，在低频区域对几赫兹的差异都能分辨出来，而在高频区域，必须要有几百赫兹的差别才能分辨。所以，一般毛细胞会对其周围的强刺激作出反应，这就是临界频段。实验结果表明，在低频区域临界频段比在高频区域临界频段窄，在低频段临界频段很窄，频段宽度只有 100 Hz 到 200 Hz ，在高于 5000 Hz 以后的临界频段的宽度有 1000 Hz 至几万 Hz 的频段宽度。 3/4 临界频段低于 5Khz ，人耳可以接收到的低频信息高于高频信息。

掩蔽可分成频域掩蔽和时域掩蔽。

所谓频域掩蔽是指掩蔽声与被掩蔽声同时作用时发生掩蔽效应，即较强的声音信号可以掩蔽临近频段中同时发声的较弱的信号。这种特性称为频域掩蔽，也称同时掩蔽 (simultaneous masking) 。这时，掩蔽声在掩蔽效应发生期间一直起作用，是一种较强的掩蔽效应。换言之，如果在某一频段中出现了一个较强的信号，那么该频段中所有低于某一门槛值的信号都将被强信号掩蔽掉，成为人耳不可闻的信号。掩蔽特性与掩蔽音的强弱，掩蔽音的中心频率，掩蔽音与被掩蔽音的频率相对位置等有关。通常，频域中的一个强音会掩蔽与之同时发声的附近的弱音，弱音离强音越近，一般越容易被掩蔽；反之，离强音较远的弱音不容易被掩蔽。滤除这一弱信号将不会对音质产生不良影响，而且能减少编码后的数据量，所以可以把它们作为噪声信号来对待。

除了同时发出的声音之间有掩蔽现象之外，在时间上相邻的声音之间也有掩蔽现象，并且称为时域掩蔽。所谓时域掩蔽是指掩蔽效应发生在掩蔽声与被掩蔽声不同时出现时，又称异时掩蔽。时域掩蔽又分为超前掩蔽 (pre-masking) 和滞后掩蔽 ( post-masking) ，若掩蔽声音出现之前的一段时间内发生掩蔽效应，则称为导前掩蔽；否则称为滞后掩蔽。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间。一般来说，超前掩蔽很短，只有大约 5 ～ 20 ms ，而滞后掩蔽可以持续 50 ～ 200 ms 。异时掩蔽也随着时间的推移很快会衰减，是一种弱掩蔽效应。

如上图左图所示，当有黑线所示的某频率信号存在时，靠近它的本来可以听见的噪声

《音频压缩的成功者——感知编码(第2页)》

« 1 2 3 4 »

本文链接地址：http://www.oyaya.net/fanwen/view/167900.html

上一篇范文：键控技术的发展及其在电视领域的新应用

下一篇范文：论主持人与记者整体形象定位