时域和频域是音频应用中最常用的两个概念,也是衡量音频特征的两个维度概念。
时域图如下:
横轴是时间,纵轴是声音强度,可知时域图是从时间维度来衡量一段音频。
频域图如下:
横轴是频率,纵轴是当前频率的能量大小,可知频域图是从频率分布维度来衡量一段声音。
时域与频域的转换:FFT - 离散傅立叶变换的快速算法。
从时间坐标轴上看 , 混响和延时是两个重要的时域概念
室内声音包括直达声 、 前期反射声和混响声三个部分。
直达声:指从声源直接到达话 筒 ( 人耳 ) 的声音 , 它是话筒拾音的主体 。
前期反射声:是指经过反射前期到达的反射声,是指未达到稳定状态时的反射声
混响:是指声音信号的反射声在达到一个稳定的状态之后再进行衰减的过程 。
直达声反映了声音的本质 , 而前期反射声和混响则反映了声音的空间位置 。
应用例子:
在广播剧录音的过程中 , 演员与话筒位置的远近体现了直达声和前期反射声 、 混响之间的关系。 演员与话筒位置越远 , 直达声越弱,而前期反射声和混响声越强 。
混响实现原理:
是指反射声达到话筒 ( 人耳 ) 与直达声之间的时间差,反映了声音的远近。
应用例子:
比如模拟一个在广场大喇叭的扩声音效 , 我们就需要对喇叭声在加以混响处理的同时 , 还要加上 一定的延时 , 这样广场的那种空旷的感觉才能体现出来。
频域应用中一般有EQ 均衡器,调制,激励等。
声音信号 的频谱覆 盖从 2 0 H Z 一 20 K H Z 。 对人耳监听而言 , 150 一 250H Z 之间是 人声的低频敏感部分。 4KHZ 一 6KHZ部分是人耳最敏感 的部分 (即中高频部分 ) , 10KHZ 左右是人声的高频敏感部分 。
例子:
戏剧录制中,有一段戏是主人公在沙漠里 , 对人声的处理就是简单地在调音台 E Q 单元上 , 衰减 15 0 H Z 一 2 5 0 H Z 低频部分 , 使声音高频相对增加 , 听起来比较干 , 较好反映了主人公在沙漠里干渴难涯的 一种声音状态 。
播放器均衡器:
摇滚:
人声:
可见播放器均衡器在调整不同风格时,其实就是在调整不同频率的输出大小。
通过数字信号处理技术,将低频数字信号(如音频、视频、数据等)调制到高频数字信号。
调制可以使声音的音调产生变化,对声音信号进行诸如变调处理和其它特殊音效处理,比如变色处理等。
对声音信号产生高次谐波 , 以增加它的层次感和穿透力。
音高为 C 的元音 “ 啊” 就是一个单音, 它的主体是以245HZ为基次谐波的音频信号 , 除此之外就是 它在频谱轴上 的二次谐波 , 三 次谐波依次类推逐渐递 减 。
我们常说一 个声音好听在它的泛音区 , 其实就是指它的高次谐波非常的好听 。
可以说声音的高次谐波反映了声音音质是否有磁性和是否有穿透力 , 这是判断某个声音音质好坏的一个参照条件。
例子:
录音师 对大鼓拾音 , 在E Q单元除了提升 15 0 H Z 左右的频段 , 常 常还要提升高频区 ( 6 K 一 SK H Z ) , 为的就是使鼓的音质除了厚重之外 , 还要有那种鼓锤与鼓皮之 间撞击发出的“脆”的感觉 。
sox是最为著名的声音处理开源库,已经被广泛移植到Windows、 Linux、Mac OS X等多个平台。sox项目是由Lance Norskog创立的,后被众多开发者逐步完善,现在已经能够支持很多种声音文件格式和处理声音效果。它默认支持的输入/输出是WAV文件。
首页:https://sourceforge.net/projects/sox/
支持均衡器,压缩器,混响器等。
iOS系统自带的AudioUnit就支持均衡器,压缩器,混响器。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。