首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我如何知道哪些频谱图帧属于哪些音频样本?

我如何知道哪些频谱图帧属于哪些音频样本?
EN

Stack Overflow用户
提问于 2021-07-13 06:48:32
回答 1查看 27关注 0票数 3

我一直在使用这个脚本:

代码语言:javascript
复制
spgram = torchaudio.transforms.Spectrogram(512, hop_length=32)
audio = spgram(audio)

去获取一些立体声音乐音频的频谱图。我期望得到的频谱图具有[2,257,shape o.shape1/32]的形状,然而,事实并非如此。例如,大小为2, 199488的音频剪辑生成大小为2, 257, 6241的语谱图。为什么会这样呢?以及如何将帧位置转换为示例位置?

EN

回答 1

Stack Overflow用户

发布于 2021-10-04 20:30:12

请参见center参数。

是否在两侧填充waveform,以便t-th框架在时间t x hop_length处居中。(默认值:True)

因此,默认情况下,信号是用零填充的。填充长度可能是(win_length - hop_length)。这最终使得(win_length - hop_length) / hop_length的结果变得更长,在您的例子中是7。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68354602

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档