腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
PyTorch
中
训练
具有
多
学习
率
的
模型
、
、
我是
PyTorch
的
新手,并且正在习惯一些概念。 我需要
训练
一个神经网络。为了进行优化,我需要使用
具有
4个不同learning rates = [2e-5, 3e-5, 4e-5, 5e-5]
的
Adam优化器 优化器函数定义如下 def optimizer(no_decayoptimizer = BertAdam(optimizer_grouped_parameters, lr, warmup=.1) return optimizer 如何确保优化器使用我指定
的
学习</
浏览 35
提问于2019-09-22
得票数 1
回答已采纳
1
回答
如何正确地建立神经网络
训练
以保证稳定
的
精度和损失
、
、
、
、
针对每一个时代,对
训练
数据加载器进行迭代,计算损失,优化等。然后将最佳
模型
应用于测试数据。计算精度,绘制ROC曲线。我想知道如何扩展我<
浏览 0
提问于2021-01-30
得票数 1
回答已采纳
2
回答
Keras最简单
的
conv网络不
学习
任何东西
、
、
我编写了简单
的
代码来
学习
Keras: (x_train, y_train), (x_test, y_test但每一个时代都是一样
的
。tensorflow-gpu v1.9 我遗漏了什么?
浏览 1
提问于2018-07-26
得票数 0
回答已采纳
1
回答
如何在
Pytorch
中
应用分层
学习
率
?
、
、
、
我知道冻结网络
中
的
单层是可能
的
,例如,只
训练
预
训练
模型
的
最后一层。我正在寻找
的
是一种将特定
的
学习
率
应用于不同层
的
方法。 例如,第一层
的
学习
率
非常低,为0.000001,然后逐渐增加后续每一层
的
学习
率
。所以最后一层
的
学习
率
是
浏览 166
提问于2018-08-12
得票数 25
回答已采纳
2
回答
更改CatBoostRegressor
的
参数'learning_rate‘
、
、
、
在
训练
模型
CatBoostRegressor()期间,有没有可能改变(减少)参数‘
学习
率
’,梯度步长系数?它会减少迭代次数,加快
训练
速度?
浏览 6
提问于2017-12-30
得票数 0
1
回答
你能画出一个预先
训练
好
的
模型
的
精确度图吗?深度
学习
、
、
、
、
我是深度
学习
的
新手。我完成了一个花了8个小时运行
的
模型
的
训练
,但我忘记了
在
关闭jupyter笔记本之前绘制精度图。任何帮助都将不胜感激!谢谢!
浏览 0
提问于2020-12-09
得票数 0
1
回答
使用Tensorflow标记图像
中
的
区域
、
、
、
、
我对机器
学习
的
整个领域都是新手,但我之前确实有过一些AWS识别的经验。
在
Rekognition
中
,您可以自定义图像
中
的
不同部分,而不仅仅是整个图像。我希望
在
Tensorflow
中
做一些类似的事情,但尽管浏览了他们
的
文档并进行了搜索,但我还是找不到任何东西。 这在Tensorflow
中
是不可行
的
,还是我错过了什么?如果我
在
单独建模
的
图像上
训练
一个<
浏览 24
提问于2020-06-26
得票数 0
回答已采纳
1
回答
基于深度
学习
的
多
参数恢复
、
、
、
、
作为我实际研究问题
的
一个简化版本,假设我有一个二阶多项式函数y = a_x^2 + b_x +c,我想用一个深神经网络来预测给定变量x和函数y
的
值
的
参数a、b和c,变量x和参数a、b、c
在
0,1范围内从均匀分布
中
剔除当我尝试使用不同
的
体系结构、成本函数和超参数组合对网络进行最常用
的
训练
时,我总是会遇到同样
的
问题:
训练
损失和测试损失迅速收敛到一个明显高于0
的
值,然后开始以奇怪
的
方式波
浏览 14
提问于2021-12-14
得票数 0
1
回答
每次重启后降低最大
学习
率
、
、
、
、
我正在
训练
一个神经网络来完成一个基于计算机视觉
的
任务。对于优化器,我发现在整个
训练
中使用单一
的
学习
率
并不理想,人们所做
的
就是使用
学习
率
调度器以特定
的
方式衰减
学习
率
。因此,为了做到这一点,我尝试了
PyTorch
's CosineAnnealingWarmRestarts().,它
的
作用是以余弦方式退火/降低初始
学习</e
浏览 46
提问于2020-06-17
得票数 1
2
回答
在
TensorFlow/Keras
中
,当使用
学习
率
衰减时,恢复
训练
时
的
行为是什么?
、
、
、
我很难理解当
模型
从磁盘加载时,当使用像下面这样
的
调度器时,
训练
将如何恢复。tensorflow.keras.optimizers.schedules.ExponentialDecay(decay_steps=1000, staircase=True) 考虑这个假设
的
情况,我
训练
了一个时期
的
模型
并保存了下来。后来,我加载了
模型
并重新拟合。在这种情况下,
训练
是从先前保存
模型</
浏览 98
提问于2021-03-01
得票数 1
回答已采纳
2
回答
为什么我不能提高CNN
在
时尚MNIST数据集上
的
性能?
、
、
、
我正在使用
Pytorch
,我
在
MNIST数据集上实现了一个CNN,它在
训练
和测试集上都
具有
99+%准确性。 我决定切换到时尚MNIST,以了解我
的
网络架构是如何执行
的
。我
在
训练
集上获得了95%
的
准确
率
,
在
测试集上获得了91%
的
准确
率
。 然后,我开始尝试通过调整
模型
来提高性能。简而言之,我
的
模型
看起来像这样:
浏览 16
提问于2019-03-21
得票数 0
1
回答
使用
Pytorch
中
的
预
训练
模型
进行语义分割,然后使用我们自己
的
数据集仅
训练
完全连接
的
图层
、
我正在
学习
Pytorch
,并试图理解这个库是如何进行语义分割
的
。到目前为止,我所理解
的
是,我们可以
在
pytorch
中使用预先
训练
好
的
模型
。我找到了一篇
在
.eval()模式下使用该
模型
的
文章,但我还没有找到任何关于
在
我们自己
的
数据集上使用这种
模型
进行
训练
的
教程。我有一个非常小
的
浏览 27
提问于2019-12-13
得票数 0
2
回答
PyTorch
:如何在任何给定时刻更改优化器
的
学习
率
(无LR计划)
、
、
、
、
在
PyTorch
中
,是否可以
在
训练
过程
中
动态更改优化器
的
学习
率
(我不想预先定义
学习
率
计划)?假设我有一个优化器:现在,由于我
在
训练
期间进行了一些测试,我意识到我
的
学习
率
太高了,所以我想将其更改为
浏览 4
提问于2018-01-18
得票数 62
回答已采纳
3
回答
在
深度
学习
中
如何处理整个幻灯片图像
、
、
、
、
由于图像很大,我想知道可以用来处理它们
的
方法。到目前为止,我遇到了将图像分成多个部分,处理这些部分并合并结果
的
技术。然而,我想更多地了解其他更好
的
方法,以及它是否是好
的
方法。任何参考现有文献都会有很大
的
帮助。
浏览 3
提问于2019-11-04
得票数 1
3
回答
如何在N个时期后调整
学习
率
?
、
、
、
我在用Hugginface
的
训练
器。如何在N个时期后调整
学习
率
?例如,我将初始
学习
率
设置为lr=2e-6,并且我希望
在
第一个时期之后将
学习
率
更改为lr=1e-6,并在剩余
的
训练
中保持该
学习
率
。last_epoch=-1我知道有,但在这里,它每个时代都会降低
学习</
浏览 5
提问于2021-07-23
得票数 1
1
回答
计算
训练
中
迭代次数?
、
、
、
、
我有一个Caffe原型,如下所示:iter_size: 4gamma =0.1 其中,数据集
具有
40.000图像。这意味着
在
20000后,
学习
速度会降低10
的
次数。
在
pytorch
中
,我想要计算出
具有
相同行为
的
时代数(用于
学习
速率)。我应该用多少时间来降低10倍
的
学习
率
(注意,我们有iter_siz
浏览 0
提问于2019-01-27
得票数 1
2
回答
BERT作为特征提取器与微调BERT层固定
的
区别
、
、
、
据我所知,利用BERT进行某些NLP分类任务有两种方法: BERT可以执行“特征提取”,其输出将进一步输入到另一个(分类)
模型
中
。另一种方法是微调一些文本分类任务
的
BERT,方法是
在
预培训
的
BERT
中
添加一个或多个输出层,并对整个过程进行再培训(有不同数量
的
BERT层固定)。但是,如果在第二种情况下,我们修复了所有的层,并且添加了分类
模型
中
的
所有层,那么第一种和第二种方法实际上是相同
的
,对吗?
浏览 0
提问于2020-03-26
得票数 1
1
回答
如何使用1个以上
的
GPU
训练
PyTorch
迁移
学习
教程
、
、
、
、
我目前正在关注
中
的
PyTorch
迁移
学习
教程我正在使用谷歌云平台笔记本实例,并使用4个NVIDIA Tesla k80 x 4GPU。正是在这里,当我
在
超过1个GPU上
训练
网络时,遇到了服务器连接错误(无效响应: 504)错误num_ftrs =0.1) model_ft = train_model(model_ft, crit
浏览 1
提问于2019-08-08
得票数 1
1
回答
如何拆分和加载不适合内存
的
大型数据集到
pytorch
Dataloader?
、
、
、
我正在
训练
一个深度
学习
模型
,使用谷歌
的
Colab对NIH
的
胸部Xray-14数据集中
的
疾病进行
多
标签分类。我不能一次将所有图像加载到Dataloader
中
,因为大约有112k个
训练
样本和有限
的
RAM。有没有办法
在
pytorch
的
DataLoader
中
只存储图像
的
路径,
在
训练
期间只读取当前迭代所
浏览 10
提问于2019-09-08
得票数 2
回答已采纳
1
回答
Keras保存后继续
训练
、
、
我正在研究一个LSTM
模型
,我想保存它,并在它积累时继续使用额外
的
数据。我
的
问题是,下次运行脚本时,保存
模型
并再次加载它之后,预测是完全错误
的
,它只是模仿我输入
的
数据。下面是
模型
初始化:if retrain == 1: print "Creating a newly retrained networkload_model("model.{}.h5".format(
浏览 0
提问于2018-05-09
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在 PyTorch 中使用梯度检查点在GPU 上训练更大的模型
号称准确率97%的开源肺炎检测模型:照搬PyTorch教程、50张图片就训练完了
从仿真模型到预测模型——机器学习在项目开发中的应用
多模态学习方法在情感分析中的效果评估
Oracle开源Graphpipe:简化机器学习模型在框架中的部署
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券