问题是寻找任何开源或简单的实现来衡量iOS应用程序上的两个音频之间有多相似。
简单地说,音频可以用一维矢量来表示,来计算一维矢量之间的距离。但是音频的长度会有所不同,因此需要一些预处理等.
希望能在这里找到一些线索,谢谢
发布于 2013-03-27 11:05:25
用DTW可以有效地计算两个可变长度序列之间的相似性:
翘曲
这个算法很容易自己实现,并且在wiki页面上链接了很多现有的实现。
简单地说,音频可以用一维矢量表示,
在帧上分割音频并将其转化为二维特征向量是合理的,对于每个帧,您都有一个与不同频带相对应的值(特征)数组。如果你想处理音乐,对每一个帧进行快速傅立叶变换是个好主意,对于语音来说,最好是计算梅频倒谱
同样,您可以使用许多现有的mel频率特性库,其中之一是语音识别工具包CMUSphinx。
https://stackoverflow.com/questions/15653466
复制相似问题