腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
指向
可
训练
变量
子集
的
tensorflow
梯度
我想取损失函数
的
梯度
,仅相对于层中
的
单个权重。对于关于整个第一层
的
导数,下面的代码很好用 with tf.GradientTape() as tape:g = tape.gradient(loss(y, y_pred), model.trainable_variables我认为访
浏览 16
提问于2021-02-08
得票数 1
1
回答
如何在
Tensorflow
的
反向传播过程中获得不可
训练
变量
的
梯度
、
Tensorflow
优化器中
的
API函数compute_gradients只返回
可
训练
变量
的
梯度
,例如具有
可
训练
参数
的
每层
的
权重或偏差。是否有可能得到每一层
的
不可
训练
变量
的
梯度
,如dL/dx或dL/dy?如果没有对应此功能
的
API函数,是否可以手动获取这些
变量</e
浏览 3
提问于2018-05-30
得票数 0
1
回答
Tensorflow
所有的
变量
都受过
训练
吗?
、
、
当使用
tensorflow
的
自动微分时,它会更新每个迭代
的
具体
变量
吗?h_t = X_t W_x + h_{t-1} W_h + b
tensorflow
如何更新W_x、W_h和b
的
值,而不知道h_{t-1}
的
值?抱歉,如果我错过了一些显而易见
浏览 9
提问于2016-11-06
得票数 1
1
回答
嵌入矩阵是如何在这个代码片段中
训练
的
?
、
、
、
我遵循了coursera赋值
的
代码,它使用双向LSTM实现了一个NER标记器。你能帮助我理解嵌入是如何
训练
的
吗?
浏览 0
提问于2018-06-23
得票数 0
2
回答
TensorFlow
中
可
训练
变量
和不可
训练
变量
的
级联
、
假设
变量
A
的
形状为123,64,
变量
B
的
形状为123,32,则A和B tf.concat(A,B,axis=1)
的
级联可以生成具有123、96形状
的
变量
C。假设A被创建为
可
训练
的
,而B被创建为不可
训练
的
。C是A和B沿1轴
的
级联。 C是无
浏览 0
提问于2018-04-23
得票数 1
回答已采纳
1
回答
使用
Tensorflow
2对象检测API冻结哪些层?
、
如何从
Tensorflow
model Zoo 2中了解冻结了哪些层来微调检测模型?我已经成功地设置了fine_tune_checkpoint和fine_tune_checkpoint_type: detection
的
路径,并且在proto文件中我已经读到“检测”是指 // 2.
浏览 59
提问于2021-11-04
得票数 1
回答已采纳
1
回答
自定义层中
的
所有中间张量是否都被注册为“不可
训练
重量”?
、
、
、
、
但是“不可
训练
的
重量”让我困惑。假设我有一个简单
的
图层,如下所示(它只做一件事,除以平均数):K = tf.keras.backend class SharpeLayer(tf.keras.layers.Layer我
的
想法是:,我知道它不会影响最终
的
训练
结果。我
的
目标是估计我
的
模型
的
内存消耗。我不确定中间张量是否也会消耗GPU内存。如果是这样的话,我认为所有中间张量都
浏览 2
提问于2020-12-30
得票数 0
1
回答
我可以在
tensorflow
联邦中聚合
梯度
吗?
、
目前,
tensorflow
的
federated_learn似乎只包括像federated_averaging这样对模型
的
可
训练
变量
起作用
的
东西。我该如何在服务器上实现需要
梯度
聚合
的
算法呢? 谢谢
浏览 0
提问于2019-05-20
得票数 1
1
回答
如何计算
梯度
w.r.t。
TensorFlow
的
急迫执行模式中
的
一个非
变量
?
、
我试图计算我
的
模型
的
损失相对于它
的
输入
的
梯度
,以便创建一个对抗性
的
例子。由于模型
的
输入是不可
训练
的
,所以我需要计算关于张量
的
梯度
,而不是
变量
。但是,如果张量不是
可
训练
变量
,则
TensorFlow
的
GradientTape返回None
梯度
: import numpy as np
浏览 1
提问于2018-11-19
得票数 0
回答已采纳
1
回答
在
训练
具有批处理数据集
的
网络时,我应该如何跟踪总损失?
、
、
、
我正在尝试通过将
梯度
应用于优化器来
训练
鉴别器网络。但是,当我使用tf.GradientTape查找损失
的
梯度
w.r.t
训练
变量
时,没有返回任何结果。下面是
训练
循环: #Generate noisy seeds noise = tf.random.normal([BATCH_SIZE, noise_dim]返回
的
数据集是批处理
的
,因此我迭代数据集,并通过将此批处理
的
损失添加到
浏览 10
提问于2020-05-12
得票数 1
回答已采纳
1
回答
在
tensorflow
2.0中,如何计算输入
变量
的
损失
梯度
?
在
TensorFlow
2.0中,
TensorFlow
2.0不支持tf.gradients,并且GradientTape只计算
可
训练
权重
的
梯度
,那么如何像TF1.0那样获得输入
的
梯度
?
浏览 1
提问于2020-01-14
得票数 1
1
回答
无法将符号张量(dense_2_target_2:0)转换为numpy数组
、
、
、
、
我试图实现支持向量机作为CNN分类
的
最后一层,我试图实现以下代码: print(y_true)我得到了错误:不能将符号张量(dense_2_target_2:0)转换为SVM.fit(X,Y)上
的
numpy
浏览 2
提问于2020-07-10
得票数 0
1
回答
tf.GradientTape()
的
位置对模型
训练
时间
的
影响
、
、
、
、
我试图在每个时期更新权重,但我是成批处理数据
的
。问题是,为了使损失标准化,我需要在
训练
循环之外记录
TensorFlow
变量
(要跟踪和标准化)。但是当我这样做
的
时候,
训练
时间是很长
的
。我认为,它将所有批次
的
变量
累积到图形中,并在最后计算
梯度
。 我已经开始跟踪for循环外部和for循环内部
的
变量
,后者比第一个更快。我对为什么会发生这种情况感到困惑,因为无论我做什么,我
的</em
浏览 3
提问于2019-08-26
得票数 3
1
回答
在
tensorflow
中,
梯度
是否通过不可
训练
的
变量
?
、
、
、
我正在
训练
一个神经网络,其中包含了。这一过程如下: 采取监督架构,并复制它。让我们称原来
的
模型为学生,称新模式为教师。设教师权重为学生权重
的
指数移动平均(EMA)。也就是说,在每个
训练
步骤之后,将教师
的
权重稍微向学生
的
权重更新一点。另外,
tensorflow
文档说,EMA
变量
是用(trainable=False)创建
的
,并添加到GraphKeys.ALL_VARIABLES集合中。现在,由于他们不能
训练
,他们不会
浏览 3
提问于2019-02-28
得票数 1
2
回答
如何
训练
我自己
的
自定义词嵌入网页?
、
、
、
、
我有大量
的
文本数据在多个网页上
的
产品,我有兴趣出售给客户。我试着在维基百科上使用预先
训练
过
的
快速文本词嵌入,但它并没有给我分类任务带来好
的
结果。可能是因为网站上
的
文本数据包含了很多技术细节,它不同于维基百科中
的
文本数据。因此,我想做一些转移学习
的
词嵌入,保持预先
训练
的
快速文本词嵌入为基础。我如何使用Keras来
训练
我自己
的
自定义单词嵌入到这些网页上? 如何用快速文本预
训
浏览 2
提问于2019-01-24
得票数 1
1
回答
为什么moving_mean和moving_variance不在tf.trainable_variables()中?
、
通过tf.trainable_variables(),我可以看到所有
可
训练
的
变量
。但我在里面找不到moving_mean和moving_variances。代码如下: import
tensorflow
as tfa = np.array([[1, 2, 3], [4, 5, 6]]) a_pl = tf.placeholder
浏览 50
提问于2019-03-23
得票数 1
1
回答
在默认情况下,局部
变量
可
训练
吗?
、
,我对下面的描述(粗体)感到困惑: tf.GraphKeys.TRAINABLE_VARIABLES --
TensorFlow
计算
梯度
的
变量
。如果不希望
变量
是
可
训练
的
,则将其添加到tf.GraphKeys.LOCAL_VARIABLES集合
浏览 0
提问于2019-02-20
得票数 3
回答已采纳
2
回答
获取错误“资源耗尽:当分配形状为[1800,1024,28,28,28]
的
张量,并在/job上键入浮动时:localhost/.”
、
、
、
、
当我
的
对象检测
Tensorflow
2.5GPU模型启动
训练
时,我得到了一个资源扩展错误。我使用了18张
训练
图像和3张测试图像。我正在使用
的
预
训练
模型是来自
Tensorflow
动物园2.2
的
更快
的
using ResNet101 V1 640x640型号。我正在使用一个带有8GB专用内存
的
Nvidia RTX 2070来
训练
我
的
模型。 我感到困惑
的
是,为什么
浏览 4
提问于2021-10-12
得票数 1
回答已采纳
1
回答
裁剪
梯度
误差
、
、
在使用多层感知器工作时,我一直在跟踪这个
梯度
剪辑
的
。tf.clip_by_global_norm(gv[0],5), gv[1]) for gv in grads_and_vars]
tensorflow
显示以下错误trainable_variable是我在创建模型时创建
的</
浏览 3
提问于2017-10-20
得票数 2
回答已采纳
2
回答
Tensorflow
:依赖于评估
的
图形构建
、
、
我正在编写以下格式
的
tensorflow
图: return some_operation(label.eval()) 这个模型
的
问题是,我需要输出
的
值,以便按照我想要
的
方式处理我
的
标签,这样我就可以计算损失。
浏览 22
提问于2016-07-26
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
深度学习TensorFlow道术6
对比TensorFlow提升树与XGBoost:我们该使用怎样的梯度提升方法
分布式TensorFlow:使用多台GPU服务器,减少神经网络的实验与训练时间
Tensorflow入门教程(九)——Tensorflow数据并行多GPU处理
在C+中使用TensorFlow训练深度神经网络
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券