我有两个来自一个文件的音频文件,我把它分为“信号”文件和“噪音”文件--背景,我需要知道录音的主导频率、分布模式或频率,以便比较不同动物发出的不同声音。
我对每个文件进行了fft运算,然后从信号中扣除背景噪声。
我不管发生什么,低于20千赫和100 kHz以上,对我来说,他们是噪音被丢弃。
振幅是我无法控制的东西,所以每次录音都必须标准化。
规范这些数据并使不同的统计记录之间的比较可行的最佳方法是什么?
function bindel=binset(raw_data_val,signal,noise)
%in case all the recording is only noise
我正在尝试使用pocketsphinx (.语法非常简单,例如:
public <grammar> = (Matt, Anna, Tom, Christine)+ (One | Two | Three | Four | Five | Six | Seven | Eight | Nine | Zero)+ ;
例如:
Tom Anna Three Three
收益率
Tom Anna 33
我调整了声学模型(考虑到我的外国口音),之后我得到了不错的表现(~94%的准确率)。我使用了大约3分钟的训练数据集。现在,我正试着做同样的事情,不过是对着麦克风低声说话。在没有训练的情况下,准确率
在Matlab上使用FFT计算信号的频谱时,我遗漏了一些东西。我的代码:
%% compute the spectrum of the data (data(t))
L = length(time); % length of the sample
NFFT = 2^(nextpow2(L)-1); % Next power of 2 from length of y
Y = fft(data,NFFT);%/NFFT;%L;
Fs = 1/(mean(time(2:end)-time(1:end-1))); % compute the sampling frequency
f = Fs/2*