腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
为什么
有些人
将
两个
不同
网络
的
参数
链接
在一起
,
并用
相同
的
优化
器
训练
它们
?
python
、
deep-learning
、
pytorch
、
generative-adversarial-network
我在看CycleGAN
的
官方pytorch实现,在那里,作者
链接
了
两个
网络
的
参数
,并为
两个
网络
使用了一个单独
的
优化
器
。这是怎么回事?这比为
两个
不同
的
网络
使用
两个
不同
的
优化
器
更好吗?
浏览 89
提问于2020-05-17
得票数 5
2
回答
loss.backward()与模型
的
适当
参数
有何关系?
machine-learning
、
deep-learning
、
pytorch
我是PyTorch
的
新手,我很难理解loss是如何知道如何通过loss.backward()计算梯度
的
?当然,我知道
参数
需要有requires_grad=True,并且我知道它将x.grad设置为适当
的
梯度,以便
优化
器
稍后执行梯度更新。
优化
器
在实例化时
链接
到模型
参数
,但损失永远不会
链接
到模型。我一直在通过,但我认为没有人清楚地回答了这个问题,这个帖子
的
发起人似乎和我有同样
浏览 2
提问于2019-11-14
得票数 3
1
回答
keras中
两个
.h5文件夹
的
平均权重
keras
、
deep-learning
、
conv-neural-network
、
keras-layer
我已经在
不同
的
数据集上
训练
了
两个
模型,并将每个模型
的
权重保存为ModelA.h5和ModelB.h5。我想平均这些权重,并创建一个名为ModelC.h5
的
新文件夹,并将其加载到
相同
的
模型架构上。
浏览 20
提问于2020-02-08
得票数 0
回答已采纳
1
回答
不同
TF版本
的
DIfferent
优化
tensorflow
、
keras
、
version
、
adam
我试图用keras和Tensorflow版本2.6
训练
一个卷积神经
网络
,我也用Tensorflow版本1.11来
训练
它。我想我做了迁移测试(
两个
神经
网络
收敛了),但是当我看到
它们
的
结果非常
不同
时,在TF2.6中最糟糕
的
是,对于具有
相同
的
超
参数
(learning_rate = 0.001)
的
两种情况,我都使用了一个
优化
器
Adam,
浏览 20
提问于2022-11-11
得票数 0
2
回答
从测试集绘制验证集
python
、
neural-network
、
cross-validation
、
correlation
、
ensemble-modeling
我正在建立一个数据集上
的
3个神经
网络
模型,该模型已经分离为
训练
集和测试集。根据我
的
分析,我发现这个数据集在测试集上有不存在于火车集中
的
值。这给了我
的
神经
网络
模型(S)一定
的
限制或最大容量。我
的
意思是,即使我改变了我
的
模型
的
超
参数
或
参数
,我似乎也不能提高精度。我已经建立了3个神经
网络
模型,几乎所有的内容都
不同
: 数字节点/
浏览 0
提问于2019-10-08
得票数 0
4
回答
LightGBM根据列
的
顺序给出
不同
的
结果(度量)
machine-learning
、
classification
、
lightgbm
我有
两个
几乎
相同
的
数据集A和B,
它们
只是在列排序方面有所
不同
。然后,通过以下步骤对这
两个
数据集中
的
每个数据集进行LightGBM模型
的
培训:
将
超
参数
保留为几乎默认
的
使用网格搜索
优化<
浏览 0
提问于2019-04-30
得票数 15
3
回答
为什么
不在火车数据集上
优化
超
参数
呢?
machine-learning
、
neural-network
、
training-data
在开发神经
网络
时,通常会将
训练
数据划分为列车、测试和保留数据集(许多人
将
这些数据分别称为列车、验证和测试)。同样
的
东西,
不同
的
名字)。许多人建议根据测试数据集中
的
性能选择超
参数
。我
的
问题是:
为什么
?
为什么
不在列车数据集中最大限度地提高超
参数
的
性能,当我们通过测试数据集中
的
性能下降检测到过度拟合时,停止对超
参数
的
浏览 1
提问于2016-07-05
得票数 5
回答已采纳
1
回答
对提取
的
特征进行
训练
的
神经
网络
是否与冻结层
的
完整
网络
具有
相同
的
精度?
machine-learning
、
neural-network
、
keras
、
optimization
、
feature-extraction
假设我在完全
相同
的
数据集上
训练
两个
神经
网络
。基本上,我通过VGG19
的
卷积层传递所有数据,
将
最后一个卷积层
的
输出保存到磁盘。然后,
将
数据加
浏览 0
提问于2021-03-26
得票数 0
回答已采纳
1
回答
SGD权重空间通过异步
训练
进行更新
machine-learning
、
neural-network
、
ensemble-learning
我正在寻找创造性
的
方法来加快我
的
神经
网络
的
训练
时间,还可能减少消失
的
梯度。我在考虑
将
网络
拆分到
不同
的
节点上,在每个节点上使用分类
器
作为后盾“助推
器
”,然后用每个节点之间
的
稀疏连接
将
节点堆叠
在一起
(尽可能多地避免以太网
网络
饱和,使其变得毫无意义)。如果我这样做,我不确定我是否必须在节点之间维护某种状态并在同一个例
浏览 2
提问于2015-08-09
得票数 0
2
回答
GAN中发电机和鉴别
器
的
不同
优化
器
optimization
、
gan
我看到了关于GAN实现
的
建议,对于生成器(G)和鉴别
器
(D),应该有
不同
的
优化
器
。据我所知,这取决于每个模型(G和D)
的
收敛速度。我想澄清这个问题。
为什么
它可以说,例如,GSD必须选择为D,亚当只为G,而不是反面?(两种解释都欢迎直觉或数学解释)
浏览 0
提问于2019-08-25
得票数 2
1
回答
链接
器
通常对
不同
c++模板实例中
的
重复代码进行
优化
吗?
c++
、
templates
、
linker
、
instance
、
multiple-instances
最近,由于我对嵌入式编程
的
尝试,我一直在想
的
是,在模板
参数
不同
的
模板实例中,
链接
器
应该如何处理代码重复。 对于具有
相同
参数
的
相同
模板
的
多个实例,这是众所周知
的
在
链接
时间被
优化
(另见:)。然而,在我
的
例子中,我感兴趣
的
是
链接
器
是否会识别用
不同
浏览 1
提问于2016-07-29
得票数 2
回答已采纳
1
回答
图像与文本
的
分布差异
distribution
、
text
、
features
、
image
在图像标题
的
任务中,我曾经读过,从图像和文本中提取
的
深层
网络
特征来自
两个
不同
的
世界,并且得到了
不同
的
分布。我
的
问题是,
它们
之间
的
分布是怎样
的
,
它们
又有什么
不同
?
浏览 0
提问于2020-11-23
得票数 1
回答已采纳
2
回答
为什么
我
的
模型可以处理来自train_test_split
的
测试数据,而不能处理新
的
数据呢?
python
、
machine-learning
、
neural-network
、
regression
、
train-test-split
我是机器学习
的
新手。当我使用X_test和y_test对验证数据进行验证时,我可以得到很好
的
结果: 然而,当我使用这个模型预测另一个数据(X_real、y_real) (
它们
与X_test和y_test没有太大
的
不同
,只是<
浏览 0
提问于2017-10-17
得票数 2
回答已采纳
1
回答
如何在TensorFlow中可视化依赖于输出类
的
DNN?
python-2.7
、
tensorflow
、
deep-learning
在TensorFlow中,在给定单个输入
的
情况下,可视化过滤器和激活层非常简单。 但我更感兴趣
的
是相反
的
方式:
将
一个类(作为一个热点向量)提供给输出层,然后查看该特定类
的
最佳输入图像。背景:我正在使用15个类
的
Googles Inception V3,并且我已经用大量数据
训练
了
网络
,达到了很好
的
精度。现在我有兴趣了解模型
为什么
以及如何区分
不同
的
类。
浏览 2
提问于2016-10-04
得票数 1
2
回答
将
多个机器学习算法结合使用
machine-learning
、
neural-network
、
svm
、
backpropagation
我对机器学习有点陌生,我想知道我们是否可以使用多种机器学习算法,例如支持向量机和反向传播一起解决一个特定
的
问题。
浏览 0
提问于2018-11-12
得票数 0
2
回答
Pycafe创建
两个
具有
相同
权重和偏差
的
网络
caffe
、
pycaffe
我尝试创建
两个
具有
相同
权重和偏差
的
网络
,我希望学习曲线相似。在迭代2中,
两个
网络
中
的
所有斑点都是
相同
的
( data & Diff),但
参数
(权重和偏差)是
不同
的
! 我到底做错了什么?注意:在
网络
中,数据集和丢弃层不存在任何混洗。
浏览 0
提问于2016-10-20
得票数 0
2
回答
Tensorflow中RNN、CNN和NN结果分析
python
、
tensorflow
、
machine-learning
、
deep-learning
我有很大
的
标签数据集。每行包含863标记化
的
单词。我正在尝试验证哪种类型
的
NN最适合分析这样
的
数据集。0.01), bias_regularizer=l2(0.01)), ]) tf.keras.layers.Dense(1, activation='sigmoid
浏览 1
提问于2020-04-29
得票数 0
1
回答
PyTorch中
的
最小化与最大化
pytorch
我想知道如何在PyTorch中对以下数学运算采取梯度步骤(A、B和C是
参数
为而不是重叠
的
PyTorch模块)这与生成性对抗性
网络
(GAN)
的
成本功能有些
不同
,所以我不能使用现成
的
GANs
的
例子,而且我在尝试将
它们
调整到上面的成本时被困住了。我想到
的
一种方法是构造
两个
优化
器
。
优化
器
opt1具有模块A和B
的
参数<
浏览 1
提问于2018-06-12
得票数 3
1
回答
当指定"retain_graph=True“时,PyTorch
的
loss.backward()是如何工作
的
?
python
、
python-3.x
、
pytorch
、
torchvision
我是PyTorch和对抗性
网络
的
新手。我试图从PyTorch文档和以前在PyTorch和StackOverflow论坛上
的
讨论中寻找答案,但我找不到任何有用
的
答案。我试着用发电机和鉴频
器
训练
GAN,但我不明白整个过程是否有效。就我而言,我应该先
训练
生成器,然后更新鉴别
器
的
权重(类似于)。) loss_d.backward()其中loss_g是发电机损耗,loss
浏览 2
提问于2020-06-01
得票数 1
回答已采纳
2
回答
如何解释机器学习模型
的
损失和准确性
machine-learning
、
neural-network
、
mathematical-optimization
、
deep-learning
、
objective-function
当我用Theano或Tensorflow
训练
我
的
神经
网络
时,他们会在每个时期报告一个名为"loss“
的
变量。 我应该如何解释这个变量?更高
的
损失是好是坏,或者它对我
的
神经
网络
的
最终性能(准确性)意味着什么?
浏览 227
提问于2015-12-30
得票数 251
回答已采纳
点击加载更多
相关
资讯
神经架构搜索研究指南,只看这一篇就够了
机器学习狗太苦逼了!自动化调参哪家强?
动图形象理解深度学习卷积
一文帮你梳理清楚深度神经网络的基础知识!
直观理解深度学习卷积部分
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
语音识别
活动推荐
运营活动
广告
关闭
领券