腾讯云

文章/答案/技术大牛

发布

社区首页 >问答首页 >如何用神经网络处理可变大小的输入

问如何用神经网络处理可变大小的输入
EN

Software Engineering用户

提问于 2017-03-26 20:23:33

回答 1查看 827关注 0票数 1

我试图用Python编写一个程序，它将接受.wav (声音)文件的输入，并确定用户是说“是”还是“不是”。

问题是声音文件并不总是相同的长度。

我担心有一个静态输入维度(即5秒的音频)，我可能有一个超过该维度的样本。

我最近读过谷歌的Deepmind写的本论文，它使用声音，但我不知道他们是如何处理这个问题的。

任何关于如何允许我的神经网络处理可变大小的输入的洞察力将不胜感激。

neural-networks

回答 1

Software Engineering用户

回答已采纳

发布于 2017-03-26 21:53:09

一般来说，大多数声音处理与其他自然语言处理类似，因为第一步之一是将数据分割成基本的标记，即单词--在人类声音处理中，我们根据它们之间的沉默来分割单词。因此，您可以预先处理以下内容：

过滤掉声音外的正常、显着的语音带宽，这是电话公司为节省带宽所做的事情。
根据空白将每个样本分割成块。

这相当于视觉深度学习系统标准化了图像的大小和位深度。

对于一些人，谁把他们的话在彼此之间，软件将有一些问题，但也是大多数听众。

票数 2

页面原文内容由Software Engineering提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://softwareengineering.stackexchange.com/questions/344980

复制

一个小问题：深度学习模型如何处理大小可变的输入

机器学习神经网络深度学习人工智能 keras

前几天在学习花书的时候，和小伙伴们讨论了“CNN如何处理可变大小的输入”这个问题。进一步引申到“对于大小可变的输入，深度学习模型如何处理？”这个更大的问题。因为这里面涉及到一些概念，我们经常搞混淆，比如RNN单元明明可以接受不同长度的输入，但我们却在实际训练时习惯于使用padding来补齐；再比如CNN无法直接处理大小不同的输入，但是去掉全连接层之后又可以；再比如Transformer这种结构，为何也可以接受长度不同的输入。因此，这里我想总结一下这个问题：

beyondGuo

2021/06/29

3K0

【pytorch】改造resnet为全卷积神经网络以适应不同大小的输入

opencv

因为resnet最后有一个全连接层。正是因为这个全连接层导致了输入的图像的大小必须是固定的。

西西嘛呦

2020/08/26

3.7K0

python3函数可变输入参量

python https 网络安全编程算法

通常我们在python中定义一个函数的时候，需要给出明确的函数输入参量，比如对于一个数学函数

DechinPhy

2021/05/21

1.3K0

[知乎作答]·神经网络对于输入的维度不一致的处理

神经网络机器学习深度学习人工智能批量计算

[知乎作答]·神经网络对于输入的维度不一致的处理本文内容选自笔者在知乎上的一个作答，总结下来作为神经网络对于输入的维度不一致的处理教程。。 1.问题描述神经网络中，如果每次输入的维度不一致应该怎么处理？神经网络中，如果每次输入的维度不一致应该怎么处理？假设一队人，有时候这队人有三个（3个输入神经元），有时候这堆人有四个（四个输入）。 2.笔者作答由于一般网络对输入尺寸有固定的要求。这是为什么呢？因为网络的机构和参数决定了需要固定。这是一个在深度学习开发很常遇到的问题。解决方

小宋是呢

2019/06/27

3K0

CNN 卷积层输入Map大小计算

filter height input padding width

对于输出的size计算： out_height=（(input_height - filter_height + padding_top+padding_bottom)/stride_height ）+1 out_width=（(input_width - filter_width + padding_left+padding_right)/stride_width ）+1 在以下情况下： 1.四边的padding大小相等。padding_top=padding_bottom=padding_lef

10JQKA

2018/05/09

4090

如何用StreamAPI处理BigDecimal的add

api mapreduce

一个不错的特性是支持对数字流的操作，比如sum操作。但是，我们不能以这种方式处理所有数值类型

用户1516716

2020/06/17

1.1K0

如何用tensorflow优化神经网络

tensorflow

梯度下降算法主要用户优化单个参数的取值，而反向传播算法给出了一个高效的方式在所有参数上使用梯度下降算法，从而使神经网络模型在训练数据上的损失函数尽可能小。反向传播算法是训练神经网络的核心算法，他可以根据定义好的损失函数优化神经网络中参数的取值，从而使神经网络在训练数据集上的损失函数达到一个最小值。神经网络模型中参数的优化过程直接决定了模型的质量，是使用神经网络时非常重要的一步。

狼啸风云

2019/01/18

1.1K0

如何用tensorflow训练神经网络

神经网络 tensorflow 批量计算

设置神经网络参数的过程就是神经网络的训练过程。只有经过有效训练的神经网络模型才可以真正地解决分类或者回归问题使用监督学习的方式设置神经网络参数需要有一个标注好的训练数据集。监督学习最重要的思想是，在一直答案的标注数据集上，模拟给出预测结果要尽量逼近真实的答案。通过调整神经网络中地参数对训练数据进行拟合，可以使得模块对未知的样本提供预测的能力在神经网络优化算法中，最常用的方法是反向传播算法(backpropagation)。反向传播算法的具体工作原理如下图

狼啸风云

2019/01/18

1.4K0

批处理 %~0_批处理输入

https 网络安全

全栈程序员站长

2022/11/05

1.9K0

Python用户输入处理与异常处理

python 爬虫

处理用户输入和异常是编写Python程序中的重要部分，因为它们可以帮助确保程序在不受控制的输入或意外情况下能够正常运行。下面是处理用户输入和异常的一些建议：

华科云商小徐

2024/04/09

2320

【C语言】va_list（可变参数处理）

存储 list 变量函数指针

C 语言中的 va_list 类型允许函数接受可变数量的参数，这在编写需要处理不定数量参数的函数时非常有用。va_list 类型是在 stdarg.h 头文件中定义的，它允许函数处理可变数量的参数。下面我们将详细介绍 va_list 的用法以及实际应用示例。

DevKevin

2024/03/19

1.3K0

shell处理用户输入总结

shell

shaonbean

2019/05/26

5380

React处理多表单输入

react button email form 表单

明知山

2023/07/24

1680

如何用卷积神经网络构建图像？

python 机器学习人工智能深度学习

这张图片其实是由一个叫人工智能的程序生成的。是不是看起来很真实？非常不错，不是吗？

AI研习社

2019/07/23

9070

四.Vue处理用户输入

https 网络安全 jquery ide 编程算法

四.Vue处理用户输入

Java架构师必看

2021/05/14

7940

如何用神经网络“寻找威利”

机器学习神经网络 tensorflow

本文介绍了一种使用TensorFlow物体检测API寻找特定人物位置的方法。首先，作者通过创建一个包含目标人物位置信息的二维图像，然后使用TensorFlow物体检测API训练一个CNN模型，将图像中的目标人物识别出来。该模型可以用于在其它图像中定位和识别特定人物，具有较好的精度和实时性。

企鹅号小编

2017/12/29

1.1K0

【DL】训练神经网络时如何确定batch的大小？

批量计算神经网络编程算法

当我们要训练一个已经写好的神经网络时，我们就要直面诸多的超参数啦。这些超参数一旦选不好，那么很有可能让神经网络跑的还不如感知机。因此在面对神经网络这种容量很大的model前，是很有必要深刻的理解一下各个超参数的意义及其对model的影响的。

yuquanle

2020/02/20

9120

一维卷积神经网络的理解是什么_卷积神经网络的输入

神经网络 https 网络安全

如下，设置一维卷积网络的输入通道为16维，输出通道为33维，卷积核大小为3，步长为2

全栈程序员站长

2022/11/09

9250

如何用神经网络判断奇偶数？

神经网络机器学习深度学习人工智能特征工程

这个题目挺有意思【看着简单，实际上。。。】，有点玄学的味道，又有点知识的味道，这也太难为神经网络了。

算法进阶

2022/06/02

7730

【Pytorch基础】处理多维特征的输入

神经网络批量计算编程算法

到目前为止，我们讨论的都是只有一个实数输入的模型。但实际情况要复杂的多，因此，如何处理多维输入是个非常重要的问题。

yhlin

2023/02/27

9350

相似问题

神经网络输入预处理

人工神经网络的矢量输入？

尺寸样式:大小(类型)还是大小可变？

给定可变输入流的WPM计算

批处理不可变对象更改？

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问如何用神经网络处理可变大小的输入
EN