采样率表示了每秒钟的采样次数。
采样率类似于动态影像的帧数,比如电影的采样率是24赫兹,PAL制式的采样率是25赫兹,NTSC制式的采样率是30赫兹。当我们把采样到的一个个静止画面再以采样率同样的速度回放时,看到的就是连续的画面。
同样的道理,把以44.1kHZ采样率记录的CD以同样的速率播放时,就能听到连续的声音。显然,这个采样率越高,听到的声音和看到的图像就越连贯。当然,人的听觉和视觉器官能分辨的采样率是有限的,基本上高于44.1kHZ采样的声音,绝大部分人已经觉察不到其中的分别了。
而声音的位数就相当于画面的颜色数,表示每个取样的数据量,当然数据量越大,回放的声音越准确,不至于把开水壶的叫声和火车的鸣笛混淆。同样的道理,对于画面来说就是更清晰和准确,不至于把血和西红柿酱混淆。不过受人的器官的机能限制,16位的声音和24位的画面基本已经是普通人类的极限了,更高位数就只能靠仪器才能分辨出来了。比如电话就是3kHZ取样的7位声音,而CD是44.1kHZ取样的16位声音,所以CD就比电话更清楚。
当你理解了以上这两个概念,比特率就很容易理解了。以电话为例,每秒3000次取样,每个取样是7比特(bit),那么电话的比特率是21000。而CD是每秒44100次取样,两个声道,每个取样是13位PCM编码,所以CD的比特率是44100*2*13=1146600,也就是说CD每秒的数据量大约是144KB(1146600/1000/8),而一张CD的容量是74分等于4440秒,就是639360KB=640MB。
比特率:指每秒传送的比特(bit)数。单位为 bps(Bit Per Second)
帧率:每秒传输的帧数, 单位Fps(frame Per Second)
码率:视频中比特率又叫码率,单位是kbps即千位每秒。 计算:码率(kbps)=文件大小(字节)X8 /时间(秒)/1000
首先关于采集到得声音源的格式是PCM-16bit的格式,PCM就是无压缩的声音源,每次读320个字节
为什么是320呢?
传统是MS的,语音帧的最小单位是20m,每20ms对应的数据就是320字节,当然这是对应16bit,8Khz.
附注:
320个字节是这么算出来的: 8Khz=8000个采样/秒 那么20毫秒就是160个采样,又因为每个采样16bit=2byte,所以160个采样就是320字节。