声音是物体的振动产生的。物体的振动引起空气的振动,传到人的耳朵以后引起耳膜的振动,通过听觉神经传到大脑,使人听到了声音。这个过程中首先需要振动源(就是发声的物体),同时需要传播振动的介质(在真空中声音是不能传播的),然后才是接收声音的人耳。如果用一个话筒来代替人耳,使得声音的振动转化成电信号,以电信号电压的变化表示声音的变化,这就是模拟音频信号;普通物理学告诉我们,磁和电是一对亲密无间的好兄弟,模拟音频信号可以转化成磁信号,而磁信号可以存储在磁带中,还可以转化成机械轨迹固化在唱片中,这就是模拟音频的录制;在一定的条件下,我们把磁带里的磁信号和唱片里的轨道信号转换成机械振动,再次通过空气来传播,这就是模拟音频的重放。关于模拟音频,就说这几句,说得很简单,对于我们学音乐的朋友,就这样吧!
在电脑里面,一切信息都转化成数字(不是我们熟悉的十进位制数字,而是由无数个0和1组成的二进位数字),声音信息也不例外。要把连续变化的的模拟音频信号转换成间隔断续的(即离散的、不连续的)数字信号的数列,就产生了两个问题,也就是数字声音的两个基本参数:采样和量化。
大家知道,声音是一个随着时间的变化而不断变化的流动过程。我们可以用一个示意图来表示声音波形的一个片段。如下图,横向代表时间的过程,往右是时间的增加;纵向代表声音的强弱,往上是声音振幅的增加。
大家可以看到,在横向时间的每一瞬间变化都会引起声音振幅的变化,实际上这是一个连绵不断的过程,我们不可能将所有的变化全都用数字记录下来,只能是在时间轴上每隔一个固定的时间在声音波形曲线上抽取一个点进行一次取值,称为“采样”。采样频率就是每秒钟抽取的点的个数。显然,抽取的点的数量越多越密,取值的结果就会和真正的声音越一致,也就是说采样频率越高音质就越好越真,但是生成的电脑文件的“个头儿”也就越大,所以凡事都得有个限度。技术上常用的采样频率是以下3种:每秒11025次、每秒22050次和每秒44100次,分别标记为11.025KHz、22.05KHz和44.1KHz。
同样的,在纵向轴上每一瞬间声音振幅的大小也具有无穷多的可能性,也不可能完全都记录下来。我们只能将一定幅度以下的数值变化予以忽略,只用一个数字表示。这就叫做量化。量化位数就是2的平方数字,例如量化位数为4,就是24=16;量化数字为8,就是28=256;量化位数为16,就是216=65536,将声音幅度分为65536份。这已经是很细的划分了,对声音的描述非常精确,远远超过了人耳所能辨别的精度。
一个采样频率,一个量化位数,这就是数字音频的两个基本性质,或者说两个基本参数。实践中还有一个声道数:单声道、双声道还是更多声道,很好理解,就不多说了。
|