腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4067)
视频
沙龙
1
回答
什么是MFCC值?
、
、
所以我知道什么是MFCC (Mel频率
倒
谱
系数
)。但我需要了解每个值是什么.它是某种声音频率值还是什么?让我们假设我们有这样的矩阵。所以每一行代表一帧的
系数
,但是这些数字是什么呢?
浏览 0
提问于2017-06-04
得票数 2
1
回答
倒
谱分析:如何找到频率步长?
、
、
我是
倒
谱分析的新手。所以这就是问题所在。 我有一个长度为4096,采样率为8000 Hz的信号。我做了快速傅立叶变换,得到了长度为4096*2的数组(2*i位置是余弦
系数
,2*i+1位置是正弦
系数
)。然后,我进行
倒
谱
变换。我不明白如何找到频率步长,以及如何找到给定频率的频率。
浏览 3
提问于2013-08-28
得票数 1
3
回答
用
Python
读取.sph文件
、
我正在做一个项目,我需要从音频信号中提取Mel-
倒
谱
频率
系数
(MFCC)。此过程的第一步是将音频文件读入
Python
。由于我要处理的音频文件是大的,我宁愿不转换为.wav格式阅读。
浏览 2
提问于2015-05-26
得票数 6
回答已采纳
1
回答
Mel mfcc的组成部分是什么?
、
在查看这一行代码的输出时:print("MFCC Shape = ", mfccs.shape)任何见解都将受到极大的赞赏!
浏览 0
提问于2020-12-08
得票数 1
回答已采纳
1
回答
如何将声音作为输入输入到神经网络?
、
、
、
、
我正在计划建立一个软件,可以使用人工神经网络将一段音乐分类为好坏。为此,我需要将音频转换为一些数值,以便作为输入提供给NN。因此,为了训练NN,我首先下载了billboard Hot100歌曲(我认为它们应该被归类为好音乐),还下载了一些糟糕的噪音音频文件(它们将被归类为糟糕的音乐)。然后,我将它们转换为.wav格式,然后将每个文件拆分为多个.wav文件,每个文件的长度为2秒。我计划使用快速傅立叶变换将这些音频剪辑转换为频率-振幅对,但问题是,即使我们使用2秒的剪辑,它的FFT也会生成大约100,000个这样的对的数组。对数以千计的音频文件这样做会产生具有太多特征的太大的数据集。 我想知道,有
浏览 2
提问于2018-02-27
得票数 4
1
回答
Autocepstrum加速框架
、
、
如何使用accelerate框架进行自
倒
谱
(
倒
谱
+自相关)分析?有没有示例代码或项目?
浏览 0
提问于2013-01-16
得票数 2
1
回答
时间传播回波的检测
、
、
、
、
在只有少量回波的情况下,利用
倒
谱
相关来捕捉编码信号中的回波峰并不难。当我只添加几个回波时,下面的
倒
谱
相关给出了我想要的峰值,但它不适用于时间传播的回波。作者提出利用回波信号的
倒
谱
与PN序列的互相关。我已经在复
倒
谱
xcorr(ifft(log(fft(signal))), pr)上尝试过,并且有许多可能的变体,包括实
倒
谱
。
浏览 1
提问于2017-03-10
得票数 1
1
回答
基于logistic回归的二值分类婴儿哭检测模型
、
现在,我已经成功地将音频剪辑转换成
谱
图图像。但是我被困在训练模型上,因为我无法理解如何训练模型(代码在我到现在为止见过的任何地方都是非常复杂的)。
浏览 0
提问于2021-02-28
得票数 1
1
回答
加速框架
倒
谱
峰值查找
、
、
我正在尝试用accelerate框架寻找
倒
谱分析的峰值。我总是在帧的末尾或开始时获得峰值。我正在实时分析,从麦克风里获取音频。我的代码有什么问题?
浏览 1
提问于2013-02-05
得票数 2
1
回答
python
语音输入傅里叶变换的语音识别
、
我的问题是: 如何在
python
中用音频输入来绘制傅里叶变换?如果这是可行的,我如何在神经网络中输入傅里叶变换(我想也许给每个神经元一个y值,神经元作为对应的x值)。
浏览 0
提问于2018-09-19
得票数 1
回答已采纳
1
回答
如何实现基音检测的
倒
谱
、
、
、
好吧,这里有很多问题,还有谷歌上的大量阅读材料,但我不知怎么搞不明白。我想得到一段演讲的基本频率。基本步骤应该是: var signal:Vector.<Number> = my1024PointSignal; // an audio signal 1024 samples long var imx:Vector.<Number&
浏览 2
提问于2014-12-09
得票数 0
回答已采纳
1
回答
如何从
倒
谱
中提取基频?
、
、
、
如何用
倒
谱
法从这个
谱
中求出基频? 我已经做了大量的研究,尝试了很多代码,并在堆栈溢出上询问了三次(这对我很有帮助),而且我确信
倒
谱
方法是发现我的情况下基频的最好方法。我只是不知道该怎么做。
浏览 6
提问于2011-02-12
得票数 3
4
回答
哪些图书馆是用来存放乔木的还是kd树的?
、
、
(我正坐下来写我自己的球体-球体,球体-射线,射线-aabb,圆锥-aabb,锥-
倒
谱
,aabb-
倒
谱
和八叉树实现;肯定有更好的方法,比如有人已经这样做了,并做了一个很好的包?!!)(
Python
或C/C++ w/binding首选)
浏览 0
提问于2011-01-07
得票数 8
回答已采纳
3
回答
从潜在谐波中确定基频的算法
、
、
、
我试图从一个声源中提取一个基本频率。也许有人在对着麦克风唱A3,所以我想要探测到~110 be (Peak1.power=1047.764893,.freq=3070.605225(Peak3.power=1011.707825,.freq=6963.769043 (Peak4.
浏览 11
提问于2011-01-17
得票数 17
回答已采纳
1
回答
使用
倒
谱
的基频
、
、
我正在绘制具有频率的
倒
谱
。结果是否与quefrequncy的绘图相同,或者我是否需要在时域中绘图?
浏览 0
提问于2014-02-24
得票数 0
1
回答
使用处理和最小化进行音符检测
、
、
我正在尝试创建一个处理应用程序,能够检测乐器(吉他)的音符。例如,如果播放了打开的"A“音符,我想基于此来做一些事情,比如在屏幕上显示音符或显示图像。如果你看不出来,我是新来的,所以要温柔点;)这是我目前所知道的:import
浏览 5
提问于2013-04-26
得票数 1
2
回答
如何从音频流中检测语音
、
、
我需要确定某人在音频流中讲话的时间。我应用了汉明窗口并计算了FFT。我怎么能从这里检测到人类的声音?
浏览 1
提问于2011-12-04
得票数 2
回答已采纳
1
回答
为什么在使用CNN识别语音命令方面,Mel-filterbank的能量超过MFCC?
、
、
、
、
在Mel
谱
图上进行卷积比对去相关
系数
进行卷积更有意义。 如果我错了,请纠正我,因为将DCT应用于Mel-filterbank能量,在这种情况下,相当于IDFT
浏览 3
提问于2020-02-27
得票数 7
1
回答
将
倒
谱
用于PDA
、
我试图使用
倒
谱
来区分这两种情况。我使用MATLAB来实现。*window')).^2+eps))); 谁能给我一个小演示,这将把帧转换为功率
倒
谱
,所以在音高频率下只有一个棒棒糖。例如,使用下面的代码来生成频率。
浏览 2
提问于2010-05-08
得票数 1
回答已采纳
2
回答
如何知道fft/lomb对基频的正确检测?
、
我使用了两种方法,fft和,为一个时序点寻找周期。只有当我微调采样率时,我才能得到正确的结果。如何知道结果是否可靠?
浏览 4
提问于2013-12-26
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python之父教你如何搞倒对象
Python中如何对集合进行倒序操作
Python中使用DataFrame生成相关系数矩阵的方法
杭州Python高薪就业靠谱吗?
30岁自学Python转行靠谱吗?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券