首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >测量两个短音频相似程度的最简单算法

测量两个短音频相似程度的最简单算法
EN

Stack Overflow用户
提问于 2013-03-27 07:09:19
回答 1查看 4.3K关注 0票数 6

问题是寻找任何开源或简单的实现来衡量iOS应用程序上的两个音频之间有多相似。

简单地说,音频可以用一维矢量来表示,来计算一维矢量之间的距离。但是音频的长度会有所不同,因此需要一些预处理等.

希望能在这里找到一些线索,谢谢

EN

回答 1

Stack Overflow用户

发布于 2013-03-27 11:05:25

用DTW可以有效地计算两个可变长度序列之间的相似性:

翘曲

这个算法很容易自己实现,并且在wiki页面上链接了很多现有的实现。

简单地说,音频可以用一维矢量表示,

在帧上分割音频并将其转化为二维特征向量是合理的,对于每个帧,您都有一个与不同频带相对应的值(特征)数组。如果你想处理音乐,对每一个帧进行快速傅立叶变换是个好主意,对于语音来说,最好是计算梅频倒谱

同样,您可以使用许多现有的mel频率特性库,其中之一是语音识别工具包CMUSphinx

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15653466

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档