开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

tf.Variable赋值方法破坏了tf.GradientTape

。tf.Variable是TensorFlow中用于定义可训练的变量的类。tf.GradientTape是用于自动求导的上下文管理器。

当我们使用tf.GradientTape记录某个操作的梯度时，如果在tf.GradientTape上下文中对tf.Variable进行了赋值操作，会破坏梯度的计算。

这是因为tf.GradientTape默认只追踪tf.Variable的读取操作，而不会追踪赋值操作。当我们对tf.Variable进行赋值时，梯度信息无法被记录下来，从而导致无法正确计算梯度。

为了解决这个问题，可以使用tf.Variable.assign方法来进行赋值操作。这样做可以保持梯度的计算正常进行。例如：

import tensorflow as tf

x = tf.Variable(2.0)

with tf.GradientTape() as tape:
    y = x * x

# 计算y对x的梯度
grad = tape.gradient(y, x)
print(grad)  # 输出: None

# 使用assign方法进行赋值操作
x.assign(3.0)

with tf.GradientTape() as tape:
    y = x * x

# 再次计算y对x的梯度
grad = tape.gradient(y, x)
print(grad)  # 输出: tf.Tensor(6.0, shape=(), dtype=float32)

在上述代码中，我们首先定义了一个可训练变量x，并使用tf.GradientTape记录了y对x的梯度。由于在赋值操作之后没有使用assign方法，导致梯度为None。然后我们使用assign方法将x赋值为3.0，并再次计算了y对x的梯度，此时可以正确得到梯度值6.0。

推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云TensorFlow：https://cloud.tencent.com/product/tensorflow
腾讯云机器学习平台：https://cloud.tencent.com/product/tiia
腾讯云AI开放平台：https://cloud.tencent.com/product/aiopen
腾讯云云服务器CVM：https://cloud.tencent.com/product/cvm
腾讯云云数据库MySQL版：https://cloud.tencent.com/product/cdb_mysql
腾讯云云原生容器服务TKE：https://cloud.tencent.com/product/tke
腾讯云云存储COS：https://cloud.tencent.com/product/cos
腾讯云区块链服务：https://cloud.tencent.com/product/tbaas
腾讯云物联网平台：https://cloud.tencent.com/product/iotexplorer
腾讯云移动应用分析：https://cloud.tencent.com/product/mapp
腾讯云音视频处理：https://cloud.tencent.com/product/vod
腾讯云安全产品：https://cloud.tencent.com/product/safety

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

扩展之Tensorflow2.0 | 20 TF2的eager模式与求导

之前讲解了如何构建数据集，如何创建TFREC文件，如何构建模型，如何存储模型。这一篇文章主要讲解，TF2中提出的一个eager模式，这个模式大大简化了TF的复杂程度。

02

TensorFlow2.X学习笔记(1)--TensorFlow核心概念

TensorFlow™ 是一个采用数据流图（data flow graphs），用于数值计算的开源软件库。节点（Nodes）在图中表示数学操作，图中的线（edges）则表示在节点间相互联系的多维数据数组，即张量（tensor）。它灵活的架构让你可以在多种平台上展开计算，例如台式计算机中的一个或多个CPU（或GPU），服务器，移动设备等等。TensorFlow 最初由Google大脑小组（隶属于Google机器智能研究机构）的研究员和工程师们开发出来，用于机器学习和深度神经网络方面的研究，但这个系统的通用性使其也可广泛用于其他计算领域。

01

【tensorflow2.0】自动微分机制

神经网络通常依赖反向传播求梯度来更新网络参数，求梯度过程通常是一件非常复杂而容易出错的事情。

01

TensorFlow 2.0 - 张量/自动求导/梯度下降

文章目录 1. 张量 2. 自动求导、梯度下降学习于：简单粗暴 TensorFlow 2 1. 张量 import tensorflow as tf print(tf.__version__) # 2.3.1 random_float = tf.random.uniform(shape=()) # tf.Tensor(0.80420315, shape=(), dtype=float32) zero_vec = tf.zeros(shape=(2)) # tf.Tensor([0. 0.], shap

01

Tensorflow之基础篇

终于有点时间学一下之前碎碎念的TensorFlow，主要代码为主，内容来源于《简明的TensorFlow2》作者李锡涵李卓恒朱金鹏，人民邮电出版社2020.9第1版。

02

tensorflow2线性拟合教程

一个线性拟合的例子，不懂可以问哈，我偶尔会登录看博客 import os import tensorflow as tf import numpy as np os.environ['CUDA_VISIBLE_DEVICES'] = "0" # Specify visible gpus. tf.debugging.set_log_device_placement(True) # Show the devices when calculating. x0 = np.array([i * 1.0 fo

01

人工智能|TensorFlow前向传播实例

举一个mnist手写数据集的识别的例子，这个数据集在机器学习中是非常经典的数据集，由60k个训练样本和10k个测试样本组成，每个样本都是一张28*28像素的灰度手写数字图片。这些高维图片无法用一个线性模型来实现，因此，就需要用一个非线性模型来实现。下面，就通过方法介绍和代码示例来完成这个实例。

03

低阶API示范

TensorFlow有5个不同的层次结构：即硬件层，内核层，低阶API，中阶API，高阶API。本章我们将以线性回归为例，直观对比展示在低阶API，中阶API，高阶API这三个层级实现模型的特点。

01

tf.GradientTape详解：梯度求解利器

tf.GradientTape定义在tensorflow/python/eager/backprop.py文件中，从文件路径也可以大概看出，GradientTape是eager模式下计算梯度用的，而eager模式（eager模式的具体介绍请参考文末链接）是TensorFlow 2.0的默认模式，因此tf.GradientTape是官方大力推荐的用法。下面就来具体介绍GradientTape的原理和使用。

03

Tensorflow2——Eager模式简介以及运用

使用过TensorFlow的大家都会知道, TF通过计算图将计算的定义和执行分隔开, 这是一种声明式（declaretive）的编程模型. 确实, 这种静态图的执行模式优点很多,但是在debug时确实非常不方便(类似于对编译好的C语言程序调用,此时是我们无法对其进行内部的调试), 因此有了Eager Execution, 这在TensorFlow v1.5首次引入. 引入的Eager Execution模式后, TensorFlow就拥有了类似于Pytorch一样动态图模型能力, 我们可以不必再等到see.run(*)才能看到执行结果, 可以方便在IDE随时调试代码,查看OPs执行结果. tf.keras封装的太好了。不利于适用于自定义的循环与训练，添加自定义的循环是一个命令式的编程环境，它使得我们可以立即评估操作产生的结果，而无需构建计算图。

02

tf.GradientTape

Record operations for automatic differentiation.

01

Eager Execution

参考 Tensorflow学习——Eager Execution - 云+社区 - 腾讯云

02

【tensorflow2.0】低阶api--张量操作、计算图、自动微分

开源电子书地址：https://lyhue1991.github.io/eat_tensorflow2_in_30_days/

02

自动微分和梯度带

在上一个教程中，我们介绍了 "张量"（Tensor）及其操作。本教程涉及自动微分（automatic differentitation），它是优化机器学习模型的关键技巧之一。

01

数据挖掘从入门到放弃（七）：TensorFlow和keras实现线性回归LinearRegression

从实践出发学习TensorFlow和teras机器学习框架，分别用tf和keras实现线性模型，两者区别在于前者相当于手推了线性回归模型，后者使用单层的感知机，很便捷。相同内容更新在：https://blog.csdn.net/yezonggang

03

你还弄不懂的傅里叶变换，神经网络只用了30多行代码就学会了

在我们的生活中，大到天体观测、小到MP3播放器上的频谱，没有傅里叶变换都无法实现。

03

使用TensorFlow Probability实现最大似然估计

TensorFlow Probability是一个构建在TensorFlow之上的Python库。它将我们的概率模型与现代硬件(例如GPU)上的深度学习结合起来。

02

TensorFlow2.X学习笔记(2)--TensorFlow的层次结构介绍

TensorFlow的层次结构 TensorFlow中5个不同的层次结构：硬件层，内核层，低阶API，中阶API，高阶API 最底层为硬件层，TensorFlow支持CPU、GPU或TPU加入计算资

02

TensorFlow 2.0 代码实战专栏（二）：线性回归示例

本示例使用TensorFlow v2库实现线性回归，此示例使用简单方法来更好地理解训练过程背后的所有机制。

00

2个范例带你读懂TensorFlow2低阶API构建模型方法

下面的范例使用TensorFlow的低阶API实现线性回归模型和DNN二分类模型。

02

TensorFlow 2.0快速上手指南12条：“Keras之父”亲授 | 高赞热贴

谷歌深度学习研究员、“Keras之父”François Chollet发表推特，总结了一份TensorFlow 2.0 + Keras做深度学习研究的速成指南。

04

《机器学习实战：基于Scikit-Learn、Keras和TensorFlow》第12章使用TensorFlow自定义模型并训练

目前为止，我们只是使用了TensorFlow的高级API —— tf.keras，它的功能很强大：搭建了各种神经网络架构，包括回归、分类网络、Wide & Deep 网络、自归一化网络，使用了各种方法，包括批归一化、dropout和学习率调度。事实上，你在实际案例中95%碰到的情况只需要tf.keras就足够了（和tf.data，见第13章）。现在来深入学习TensorFlow的低级Python API。当你需要实现自定义损失函数、自定义标准、层、模型、初始化器、正则器、权重约束时，就需要低级API了。甚至有时需要全面控制训练过程，例如使用特殊变换或对约束梯度时。这一章就会讨论这些问题，还会学习如何使用TensorFlow的自动图生成特征提升自定义模型和训练算法。首先，先来快速学习下TensorFlow。

03

中阶API示范

TensorFlow有5个不同的层次结构：即硬件层，内核层，低阶API，中阶API，高阶API。本章我们将以线性回归为例，直观对比展示在低阶API，中阶API，高阶API这三个层级实现模型的特点。

01

深度学习的数学理论与代码实战

在《FNN（DNN）的前向传播和反向梯度推导》中，我们学习了FNN（DNN）的前向传播和反向梯度求导，但知识仍停留在纸面。本篇章将基于深度学习框架tensorflow验证我们所得结论的准确性，以便将抽象的数学符号和实际数据结合起来，将知识固化。更多相关内容请见《深度学习的数学理论与代码实战》系列介绍。

01

对比PyTorch和TensorFlow的自动差异和动态子类化模型

使用自定义模型类从头开始训练线性回归，比较PyTorch 1.x和TensorFlow 2.x之间的自动差异和动态模型子类化方法。

02

Tensorflow入门

Tensorflow是由Google开发的开源深度学习框架，可以实现各种机器学习和深度学习任务。它提供了丰富的工具和库，使得开发者可以方便地构建、训练和部署机器学习模型。本文将介绍Tensorflow的基本概念和使用方法，帮助读者入门。

03

TensorFlow2.0代码实战专栏（六）：使用低级方法来构建神经网络以便更好地理解

原项目 | https://github.com/aymericdamien/TensorFlow-Examples/

02

前向传播（张量）- 实战

目录手写数字识别流程前向传播（张量）- 实战手写数字识别流程 MNIST手写数字集7000*10张图片 60k张图片训练，10k张图片测试每张图片是28*28，如果是彩色图片是28*28*3 0-255表示图片的灰度值，0表示纯白，255表示纯黑打平28*28的矩阵，得到28*28=784的向量对于b张图片得到[b,784];然后对于b张图片可以给定编码把上述的普通编码给定成独热编码，但是独热编码都是概率值，并且概率值相加为1，类似于softmax回归套用线性回归公式 X[b,784] W[

01

Tensorflow学习——Eager Execution

TensorFlow 的 Eager Execution 是一种命令式编程环境，可立即评估操作，无需构建图：操作会返回具体的值，而不是构建以后再运行的计算图。这样能让您轻松地开始使用 TensorFlow 和调试模型，并且还减少了样板代码。要遵循本指南，请在交互式 python 解释器中运行下面的代码示例。

02

我们期待的TensorFlow 2.0还有哪些变化？

为提高 TensorFlow 的工作效率，TensorFlow 2.0 进行了多项更改，包括删除了多余的 API，使API 更加一致统一，例如统一的 RNNs (循环神经网络），统一的优化器，并且Python 运行时更好地集成了 Eager execution 。

03

【干货】TensorFlow 2.0官方风格与设计模式指南（附示例代码）

【导读】TensorFlow 1.0并不友好的静态图开发体验使得众多开发者望而却步，而TensorFlow 2.0解决了这个问题。不仅仅是默认开启动态图模式，还引入了大量提升编程体验的新特性。本文通过官方2.0的风格指南来介绍新版本的开发体验。

01

TensorFlow与PyTorch在Python面试中的对比与应用

TensorFlow与PyTorch作为深度学习领域两大主流框架，其掌握程度是面试官评价候选者深度学习能力的重要依据。本篇博客将深入浅出地探讨Python面试中与TensorFlow、PyTorch相关的常见问题、易错点，以及如何避免这些问题，同时附上代码示例以供参考。

00

TensorFlow 2.0 快速入门指南：第一部分

在本部分中，我们将介绍 TensorFlow 2.00 alpha。我们将首先概述该机器学习生态系统的主要功能，并查看其使用示例。然后我们将介绍 TensorFlow 的高级 Keras API。我们将在本节结尾处研究人工神经网络技术。

01

[译]高效的TensorFlow 2.0：应用最佳实践以及有什么变化

在最近的一篇文章中，我们提到，TensorFlow 2.0经过重新设计，重点关注开发人员的工作效率、简单性和易用性。

03

TensorFlow 2.0 代码实战专栏（三）：逻辑回归

使用TensorFlow v2库实现逻辑斯谛回归，此示例使用简单方法来更好地理解训练过程背后的所有机制。

03

【tensorflow2.0】优化器optimizers

拿来药材（数据），架起八卦炉（模型），点着六味真火（优化算法），就摇着蒲扇等着丹药出炉了。

02

我们期待的TensorFlow 2.0还有哪些变化？

为提高 TensorFlow 的工作效率，TensorFlow 2.0 进行了多项更改，包括删除了多余的 API，使API 更加一致统一，例如统一的 RNNs (循环神经网络），统一的优化器，并且Python 运行时更好地集成了 Eager execution 。

06

高阶API示范

TensorFlow有5个不同的层次结构：即硬件层，内核层，低阶API，中阶API，高阶API。本章我们将以线性回归为例，直观对比展示在低阶API，中阶API，高阶API这三个层级实现模型的特点。

02

人工智能应用工程师技能提升系列1、——TensorFlow2

这里先说一下选择使用tensorflow2讲解的原因，在对比一下同类型的一个优势。由于我们这个系列的目标是学习，大家使用的都是win系统的电脑，故而这里选择tensorflow2方便得多。当前最新的版本是2.15

01

深度学习之神经风格迁移

神经风格迁移是一种优化技术，用于将两个图像——一个内容图像和一个风格参考图像（如著名画家的一个作品）——混合在一起，使输出的图像看起来像内容图像，但是用了风格参考图像的风格。

03

TensorFlow2.0正式版发布，极简安装TF2.0（CPU&GPU）教程

本篇文章就带领大家用最简单地方式安装TF2.0正式版本（CPU与GPU），由我来踩坑，方便大家体验正式版本的TF2.0。

00

深度学习算法中的深度信念网络（Deep Belief Networks）

深度学习是近年来人工智能领域的热门话题，它在图像识别、自然语言处理和推荐系统等任务中取得了显著的成就。深度信念网络（Deep Belief Networks，DBN）作为深度学习算法的一种，被广泛应用于无监督学习和特征学习任务中。本文将介绍深度信念网络的原理、结构和应用，并探讨其在深度学习领域的潜力。

05

『TensorFlow2.0正式版』极简安装TF2.0正式版（CPU&GPU）教程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

02

使用Python实现深度学习模型：图像风格迁移与生成

图像风格迁移是一种将一幅图像的风格应用到另一幅图像上的技术，使得生成的图像既保留原始图像的内容，又具有目标图像的风格。本文将介绍如何使用Python和TensorFlow实现图像风格迁移，并提供详细的代码示例。

01

Tensorflow 2.0 的这些新设计，你适应好了吗？

如果说两代 Tensorflow 有什么根本不同，那应该就是 Tensorflow 2.0 更注重使用的低门槛，旨在让每个人都能应用机器学习技术。考虑到它可能会成为机器学习框架的又一个重要里程碑，本文会介绍 1.x 和 2.x 版本之间的所有（已知）差异，重点关注它们之间的思维模式变化和利弊关系。

02

TensorFlow 2.0 - Checkpoint 保存变量、TensorBoard 训练可视化

文章目录 1. Checkpoint 保存变量 2. TensorBoard 训练过程可视化学习于：简单粗暴 TensorFlow 2 1. Checkpoint 保存变量 tf.train.Checkpoint 可以保存 tf.keras.optimizer 、 tf.Variable 、 tf.keras.Layer 、 tf.keras.Model path = "./checkp.ckpt" # 建立一个 checkpoint mycheckpoint = tf.train.Checkpoin

02

TensorFlow从1到2（一）续讲从锅炉工到AI专家

原来引用过一个段子，这里还要再引用一次。是关于苹果的。大意是，苹果发布了新的开发语言Swift，有非常多优秀的特征，于是很多时髦的程序员入坑学习。不料，经过一段头脑体操一般的勤学苦练，发现使用Swift做开发，不仅要学习Swift，还要学习Swift2、Swift3、Swift4... 后来我发现，这个段子很有普遍性，并非仅仅苹果如此，今天的TensorFlow 2.0也有点这样的趋势。以至于我不得不专门写一个课程的续集，来面对使用新版本软件开始机器学习的读者。事实上大多具有革命性的公司都是这样，一方面带来令人兴奋的新特征，另一方面则是高企不落的学习成本。

00

TensorFlow高阶API和低阶API

TensorFlow提供了众多的API，简单地可以分类为高阶API和低阶API. API太多太乱也是TensorFlow被诟病的重点之一，可能因为Google的工程师太多了，社区太活跃了~当然后来Google也意识到这个问题，在TensorFlow 2.0中有了很大的改善。本文就简要介绍一下TensorFlow的高阶API和低阶API使用，提供推荐的使用方式。

02

TensorFlow Autodiff自动微分详解

总结：如果对一个listz=[z1,z2,z3]求微分，其结果将自动求和，而不是返回z1、z2和z3各自对[w1,w2]的微分。

03

TensorFlow从1到2（十三）图片风格迁移

《从锅炉工到AI专家(8)》中我们介绍了一个“图片风格迁移”的例子。因为所引用的作品中使用了TensorFlow 1.x的代码，算法也相对复杂，所以文中没有仔细介绍风格迁移的原理。今天在TensorFlow 2.0的帮助，和新算法思想的优化下，实现同样功能的代码量大幅减少，结构也越发清晰。所以今天就来讲讲这个话题。

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭