物体 发生 震动 , 在 空气中传播 , 被 人耳 接收 产生 我们理解中的声音 ;
物体 震动 , 产生 的 振幅 , 就是 声音的 响度 , 振幅 越大 , 响度越大 ;
如 :
物体 震动 的 振幅 , 就是 声音 的 响度值 , 就是 采样值 ;
假设 采样位数 是 8 位 , 可以 表示 256 种响度值 , 取值范围是 -128 ~ 127 ;
使用 录音设备 , 录制音频 , 某个时间戳 时刻 获取的 采样值 100 , 此时 100 这个值 , 是一个数值 , 这个数值 单独 拿出来 没有任何意义 ;
将 这个数值 100 输出 到 音响中 , 此时 音响的输出设置 的 采样位数 也是 8 位 , 将 100 放到音响中 , 就可以 还原 录制视频时的 震动振幅 , 发出对应 时间戳时刻 的声音 ;
100 这个值 与 真实的音量响度 , 也就是分贝值 , 没有关系 , 播放的声音大小只与录音设备参数有关 ;
如 : 录制 50 分贝的声音 , 不同的录音设置录制的 采样值 是不同的 , 相同的录音设备 使用不同的参数 录制的采样值也是不同的 , 50 分贝的声音可以是 100 采样值 , 也可以是 50 采样值 ;
100 采样值 在 播放设备中 播放的 声音分贝数 大小 也是无关 的 , 在 手机中 播放 100 采样值 是 40 分贝 , 在 大功率 扬声器 中播放 100 采样值 可能就是 80 分贝 , 播放 100 采样值 的 分贝数 与 播放设备及参数有关 ;
这个 100 的采样值 , 拿在手里 没有任何作用 , 也听不到声音 , 只有在 播放环境 中 , 在 音响 / 扬声器 设备中 才有意义 ;
如果 播放的设备 的 采样位数 不是 8 位 , 而是 16 位 , 那么 就需要 将 100 这个值 转为 16 位 的采样值 ,
将 100 处于 取值范围 -128 ~ 127 , 等比例放大到 -32768 ~ +32767 取值范围中 , 计算过程如下 :
最后将 重采样的 25600 采样值 输入到 16 位采样位数的 音响中 ;
常用的音频采样频率 :
人耳 能听到的 频率范围是 20Hz ~ 20000Hz , 那么 根据 " 奈奎斯特 Nyguist 采样定理 " , 想要保证 人耳听到的声音 不失真 , 需要使用 40000Hz 以上的采样率 ;
人耳听到的 超过 44100Hz 的采样频率 的 音频 , 与 更高采样频率 的音频 , 效果是一样的 ;
注意 : 使用 高端 音响设备 发出的 超过 44100Hz 的采样频率 的 声音 与 低端设备发出的 声音 , 是不同的 , 因为谐振不同 ;
音频采样精度 , 就是 采样值 的位数 , 常见的采样位数有 :
个不同的值来表示 , 这种精度相对较低 , 产生的音频质量较为粗糙 , 有明显的量化噪声 ;
不同的值来表示每个采样点 , 该精度可以提供相当高的音频质量 , 适用于大多数 音乐 / 电影 / 多媒体应用 ;
个不同的值 , 可以捕获更细微的音频细节 ;
( 大约 43 亿 ) 个不同的值来表示每个采样点 , 几乎可以消除量化噪声 ;
音频通道数 :