指向可训练变量子集的tensorflow梯度_Tensorflow -可训练变量不会随时间变化_Tensorflow Keras梯度带对于一个模型的可训练变量返回None，该变量受另一个模型的可训练变量的影响 - 腾讯云开发者社区

我想取损失函数的梯度，仅相对于层中的单个权重。对于关于整个第一层的导数，下面的代码很好用 with tf.GradientTape() as tape:g = tape.gradient(loss(y, y_pred), model.trainable_variables我认为访

浏览 16提问于2021-02-08得票数 1

1回答

如何在Tensorflow的反向传播过程中获得不可训练变量的梯度

、

Tensorflow优化器中的API函数compute_gradients只返回可训练变量的梯度，例如具有可训练参数的每层的权重或偏差。是否有可能得到每一层的不可训练变量的梯度，如dL/dx或dL/dy？如果没有对应此功能的API函数，是否可以手动获取这些变量</e

浏览 3提问于2018-05-30得票数 0

1回答

Tensorflow所有的变量都受过训练吗？

、、

当使用tensorflow的自动微分时，它会更新每个迭代的具体变量吗？h_t = X_t W_x + h_{t-1} W_h + b tensorflow如何更新W_x、W_h和b的值，而不知道h_{t-1}的值？抱歉，如果我错过了一些显而易见

浏览 9提问于2016-11-06得票数 1

1回答

嵌入矩阵是如何在这个代码片段中训练的？

、、、

我遵循了coursera赋值的代码，它使用双向LSTM实现了一个NER标记器。你能帮助我理解嵌入是如何训练的吗？

浏览 0提问于2018-06-23得票数 0

2回答

TensorFlow中可训练变量和不可训练变量的级联

、

假设变量A的形状为123，64，变量B的形状为123，32，则A和B tf.concat(A，B，axis=1)的级联可以生成具有123、96形状的变量C。假设A被创建为可训练的，而B被创建为不可训练的。C是A和B沿1轴的级联。 C是无

浏览 0提问于2018-04-23得票数 1

回答已采纳

1回答

使用Tensorflow* 2对象检测API冻结哪些层？*

、

如何从Tensorflow model Zoo 2中了解冻结了哪些层来微调检测模型？我已经成功地设置了fine_tune_checkpoint和fine_tune_checkpoint_type: detection的路径，并且在proto文件中我已经读到“检测”是指 // 2.

浏览 59提问于2021-11-04得票数 1

回答已采纳

1回答

自定义层中的所有中间张量是否都被注册为“不可训练重量”？

、、、、

但是“不可训练的重量”让我困惑。假设我有一个简单的图层，如下所示(它只做一件事，除以平均数)：K = tf.keras.backend class SharpeLayer(tf.keras.layers.Layer我的想法是：，我知道它不会影响最终的训练结果。我的目标是估计我的模型的内存消耗。我不确定中间张量是否也会消耗GPU内存。如果是这样的话，我认为所有中间张量都

浏览 2提问于2020-12-30得票数 0

1回答

我可以在tensorflow联邦中聚合梯度吗？

、

目前，tensorflow的federated_learn似乎只包括像federated_averaging这样对模型的可训练变量起作用的东西。我该如何在服务器上实现需要梯度聚合的算法呢？谢谢

浏览 0提问于2019-05-20得票数 1

1回答

如何计算梯度w.r.t。TensorFlow的急迫执行模式中的一个非变量？

、

我试图计算我的模型的损失相对于它的输入的梯度，以便创建一个对抗性的例子。由于模型的输入是不可训练的，所以我需要计算关于张量的梯度，而不是变量。但是，如果张量不是可训练变量，则TensorFlow的GradientTape返回None梯度： import numpy as np

浏览 1提问于2018-11-19得票数 0

回答已采纳

1回答

在训练具有批处理数据集的网络时，我应该如何跟踪总损失？

、、、

我正在尝试通过将梯度应用于优化器来训练鉴别器网络。但是，当我使用tf.GradientTape查找损失的梯度w.r.t训练变量时，没有返回任何结果。下面是训练循环： #Generate noisy seeds noise = tf.random.normal([BATCH_SIZE, noise_dim]返回的数据集是批处理的，因此我迭代数据集，并通过将此批处理的损失添加到

浏览 10提问于2020-05-12得票数 1

回答已采纳

1回答

在tensorflow* 2.0中，如何计算输入变量的损失梯度？*

在TensorFlow2.0中，TensorFlow2.0不支持tf.gradients，并且GradientTape只计算可训练权重的梯度，那么如何像TF1.0那样获得输入的梯度？

浏览 1提问于2020-01-14得票数 1

1回答

无法将符号张量(dense_2_target_2:0)转换为numpy数组

、、、、

我试图实现支持向量机作为CNN分类的最后一层，我试图实现以下代码： print(y_true)我得到了错误：不能将符号张量(dense_2_target_2:0)转换为SVM.fit(X，Y)上的numpy

浏览 2提问于2020-07-10得票数 0

1回答

tf.GradientTape()的位置对模型训练时间的影响

、、、、

我试图在每个时期更新权重，但我是成批处理数据的。问题是，为了使损失标准化，我需要在训练循环之外记录TensorFlow变量(要跟踪和标准化)。但是当我这样做的时候，训练时间是很长的。我认为，它将所有批次的变量累积到图形中，并在最后计算梯度。我已经开始跟踪for循环外部和for循环内部的变量，后者比第一个更快。我对为什么会发生这种情况感到困惑，因为无论我做什么，我的</em

浏览 3提问于2019-08-26得票数 3

1回答

我正在训练一个神经网络，其中包含了。这一过程如下：采取监督架构，并复制它。让我们称原来的模型为学生，称新模式为教师。设教师权重为学生权重的指数移动平均(EMA)。也就是说，在每个训练步骤之后，将教师的权重稍微向学生的权重更新一点。另外，tensorflow文档说，EMA变量是用(trainable=False)创建的，并添加到GraphKeys.ALL_VARIABLES集合中。现在，由于他们不能训练，他们不会

浏览 3提问于2019-02-28得票数 1

2回答

如何训练我自己的自定义词嵌入网页？

、、、、

我有大量的文本数据在多个网页上的产品，我有兴趣出售给客户。我试着在维基百科上使用预先训练过的快速文本词嵌入，但它并没有给我分类任务带来好的结果。可能是因为网站上的文本数据包含了很多技术细节，它不同于维基百科中的文本数据。因此，我想做一些转移学习的词嵌入，保持预先训练的快速文本词嵌入为基础。我如何使用Keras来训练我自己的自定义单词嵌入到这些网页上？如何用快速文本预训

浏览 2提问于2019-01-24得票数 1

1回答

为什么moving_mean和moving_variance不在tf.trainable_variables()中？

、

通过tf.trainable_variables()，我可以看到所有可训练的变量。但我在里面找不到moving_mean和moving_variances。代码如下： import tensorflow as tfa = np.array([[1, 2, 3], [4, 5, 6]]) a_pl = tf.placeholder

浏览 50提问于2019-03-23得票数 1

1回答

在默认情况下，局部变量可训练吗？

、

，我对下面的描述(粗体)感到困惑： tf.GraphKeys.TRAINABLE_VARIABLES -- TensorFlow计算梯度的变量。如果不希望变量是可训练的，则将其添加到tf.GraphKeys.LOCAL_VARIABLES集合

浏览 0提问于2019-02-20得票数 3

回答已采纳

2回答

获取错误“资源耗尽:当分配形状为[1800,1024，28，28，28]的张量，并在/job上键入浮动时:localhost/.”

、、、、

当我的对象检测Tensorflow 2.5GPU模型启动训练时，我得到了一个资源扩展错误。我使用了18张训练图像和3张测试图像。我正在使用的预训练模型是来自Tensorflow动物园2.2的更快的using ResNet101 V1 640x640型号。我正在使用一个带有8GB专用内存的Nvidia RTX 2070来训练我的模型。我感到困惑的是，为什么

浏览 4提问于2021-10-12得票数 1

回答已采纳

1回答

裁剪梯度误差

、、

在使用多层感知器工作时，我一直在跟踪这个梯度剪辑的。tf.clip_by_global_norm(gv[0],5), gv[1]) for gv in grads_and_vars]tensorflow显示以下错误trainable_variable是我在创建模型时创建的</

浏览 3提问于2017-10-20得票数 2

回答已采纳

2回答

Tensorflow:依赖于评估的图形构建

、、

我正在编写以下格式的tensorflow图： return some_operation(label.eval()) 这个模型的问题是，我需要输出的值，以便按照我想要的方式处理我的标签，这样我就可以计算损失。

浏览 22提问于2016-07-26得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云