Tensorflow -相同模型的第一个时期的损失停滞不前，在较早的运行时显示出更好的结果

、、、、

我在Colab上为我的光通信项目训练一个模型，然后发生了一件奇怪的事情。我首先训练的模型显示了接近99%的训练和97%的验证准确率，但运行时在晚上的某个时候到期了。现在，对于相同的模型，我尝试在重新连接到运行时后重新训练。但现在，准确率从第一个时期起保持不变，为25%。令人惊

浏览 31提问于2021-11-03得票数 0

2回答

有两个模型具有相同的最小验证损失值，但在不同的时期具有该值。哪一个更好？

、、

有两个模型具有相同的结构和学习相同的数据集。差别如下所示。正如我在

浏览 5提问于2020-10-20得票数 1

回答已采纳

1回答

Tensorflow给出错误的结果

、、

这是我用来测试tf准确性的最简单的问题。但是，它没有给我带来令人满意的结果。我有自己的模型，对于这样的问题，它们甚至不需要训练，因为误差已经是零了。我的理解/代码等有问题吗？它应该给出准确的答案，即.11, .06 (我的.net模型可以)model.add(tf.layers.dense({units: 1,

浏览 0提问于2018-09-11得票数 0

2回答

发布从keras到tf.keras的移植代码

、、、

我正在将一个基本的MNIST模型训练程序从使用keras2.3.1移植到tf.keras (TensorFlow2.0)，并且看到了一些奇怪的行为。我的初始代码训练得很好，但是在更新我的导入之后，模型训练就陷入了困境。Model在训练的第一个时期之后-旧

浏览 3提问于2019-11-19得票数 0

1回答

在训练用于自动语音识别的模型时降低单词错误率

、、、

我正在训练一个speech to text模型。在第一个时期，WER为0.33，第二个时期的WER仍然相同，但是训练损失增加了，而验证损失减少了。除了降低学习率之外，还能做些什么来使模型学习，至少是过拟合？

浏览 5提问于2020-04-25得票数 1

2回答

时间序列数据的趋势

、、、

我使用带有LSTM层的Keras序列模型和时间序列数据来预测未来的值。为此，我在某个时间点将我的数据划分为训练数据和验证数据。时间序列数据具有积极的趋势，因此我的训练数据中的平均值低于我的验证数据中的平均值，因为我使用较新的数据作为验证。初始模型每次预测0.5次，这是一个糟糕的模型。在下一个时期，模型将通过训

浏览 30提问于2021-04-21得票数 0

回答已采纳

1回答

划时代末端Keras损失的变化

、、

我正在使用imagedatagenerator类对Keras (tensorflow2后端)中的模型进行批量培训。我注意到，当第二个时期开始时，损失值实际上比第一个时期结束时的值要小。我的意思是：有人知道为什么会这样吗？当处理所有批次时，keras是否再次更新权重？

浏览 16提问于2020-05-03得票数 1

回答已采纳

1回答

Keras:根据ModelCheckpoint的最佳模型-回调在训练集上产生的损失不同于训练时显示的最佳时期损失

、、、、

我正在尝试用Python语言训练一个非常简单的TensorFlow后端的Keras模型。我知道在训练时在控制台中显示的时期损失是为了效率而‘即时’计算的，因此不一定是中间模型的真实损失。但据我所知，如果每个时期只有一批就是整个训练集，那么它们实际上应该是。这种期望的原因是，在这种情况下，模型的</em

浏览 0提问于2018-12-28得票数 0

1回答

我使用tensorflow dataset api将数据提供给模型。据我所知，我应该对数据集进行混洗，以从模型中获得最佳性能。然而，由于我训练了一个时期，然后测试了一个时期，以此类推。我不太确定我是否在以不同的方式执行洗牌。为了更好地说明，下面是我的代码： train_dataset = tf.data.TFRecordDataset(filename_train).map(_parse_function).filter(我问是因为<

浏览 31提问于2019-02-22得票数 0

回答已采纳

2回答

无法在tensorflow中多次重复LSTM模型的相同结果

、、

我在tensorflow训练一个LSTM网络。我的模型有以下配置：输入特性的数量x= 512。我的tensorflow版本是1.8。此外，我还通过tf.set_random_seed(mseed)设置了随机种子，并为每个可训练变量的初始化器设置了随机种子，以便在多次运行后能够重现相同的结果。经过多次训练，每次20次，我发现前几个<

浏览 1提问于2019-01-21得票数 0

2回答

使用Tensorflow保存检查点

、、、

我有3个文件夹为我的CNN模型，这是train_data, val_data, test_data. 当我训练我的模型时，我发现准确性可能会有所不同，有时最后一个时期并没有显示出最好的准确性。例如，最后一个时期的准确率是71%，但我在较早的时期发现了更好的准确性。我想保存该纪元的检查点，它具有更高的</

浏览 3提问于2018-05-04得票数 2

3回答

你能解释一下每次迭代时角角的输出吗？

、、、

当我使用fit_generator，方法训练带有keras的顺序模型时，我看到了这个输出。.- ETA xxxx损失: yyyy 为什么会这样呢？我认为每一步的时间和步数都是任意值，例如，使用1000步的10个历元

浏览 0提问于2018-12-13得票数 2

回答已采纳

1回答

在将它们合并用于多任务学习之前，我是否应该消除它们的损失？

、、、、

我有一个多任务网络，需要一个输入，并试图实现两个任务(有几个共享层，然后是单独的层)。一项任务是利用CrossEntropy损失进行多类分类，另一项任务是利用CTC损失进行序列识别。我想使用这两个损失的组合作为标准，类似于损耗=λCE + (1-λ)CTC。事情是，我的CE损失开始在2左右，而CTC损失在400秒。如果用最大( L₁)/L₁因子来重新计算每个时期的<em

浏览 0提问于2018-10-25得票数 4

回答已采纳

1回答

Tensorflow在机器之间损失方面的主要差异

、、、、

我使用Tensorflow作为后端，用Keras编写了一个变分自动编码器。我使用Adam作为优化器，学习率为1e-4，批处理大小为16。当我在Macbook的中央处理器(英特尔核心i7)上训练网络时，一个时期(~5000个迷你批次)后的损失值比运行Ubuntu的不同机器上的第一个时期后的损失值小2倍。对于另一台机器，我在中央处理器和图形处理器(英特尔至强E5-16

浏览 0提问于2017-06-12得票数 2

1回答

两个张量之差的损失函数

、、、

我正在用所谓的“知识蒸馏(KD)”的方法训练一个卷积神经网络(使用Tensorflow)，简而言之，就是训练一个关于你想要完成的任务的大模型(老师)，然后训练一个小模型(学生)，它可以模拟老师的结果，但使用更少的参数，因此在测试时更快。我面临的问题是如何以有效的方式在相同输入下建立学生模型和教师模型</

浏览 6提问于2020-12-16得票数 0

1回答

Colab Pro在使用TPU Runtime训练深度学习模型12小时后自动断开连接

、

我用了几天的CoLab专业版。我试图在CoLab专业版中使用TPU运行时来训练一个深度学习模型。但是Runtime在12小时的训练后会自动断开。我已经配置了70个时期用于训练，它在大约43 - 52个时期停止。我使用Keras/Tensorflow来开发我的模型。在过去的三天里，我正在训练相同的模型，但我无法完成训练过

浏览 0提问于2021-06-17得票数 1

2回答

Tensorflow model.evaluate给出了与训练结果不同的结果

、、、

我正在使用tensorflow进行多类分类train_ds = tf.keras.preprocessing.image_dataset_from_directoryTrue, image_size=(img_height, img_width),然后，当我使用model.fit()训练模型时但是当我加载相同的验证集并使用model.evaluate()

浏览 0提问于2020-09-24得票数 1

1回答

通过ImageDataGenerator将数据导入tensorflow自动编码器

、、、、

当我试图通过导入图像作为numpy数组来训练自动编码器时，训练进行得很快，第一个时期的训练损失<0，结果也不错。但是当我通过ImageDataGenerator导入相同的数据时，开始的损失大约是32000，随着训练的进行，它下降得非常慢，在50个时期之后，它饱和在31000左右。我使用mse作为Adam Optimiser的损失函数。我尝试

浏览 7提问于2020-10-07得票数 0

1回答

TensorFlow PoolAllocator请求数量巨大

、

使用Tensorflow r0.9/r.10我得到以下消息，这让我担心我以错误的方式设置了我的神经网络模型。I tensorflow/core/common_runtime/gpu/pool_allocator.cc:244] PoolAllocator: After 6206792 get requests6206802 evicted_count=5000 eviction_rate=0.000805568 and unsatisfied alloca

浏览 11提问于2016-08-16得票数 0

回答已采纳

1回答

tensorflow.compat.v1.disable_v2_behavior()应该对使用Keras API的训练有什么影响？

、、、、

我有一个CNN，它训练几十万个例子，在一个时期后验证准确率达到95%左右。这是简单的代码，使用Keras定义使用Sequential API的网络。最初，我在TF 1.3上准备并使用了这个模型。当我将它移植到TF2.1，用tensorflow.keras替换keras调用时，它很快就达到了~60%，并停留在那里(似乎有很多时期)，训练损失似乎总是收敛到相同的值。如果我在脚本

浏览 240提问于2020-05-14得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

有两个模型具有相同的最小验证损失值，但在不同的时期具有该值。哪一个更好？

Tensorflow给出错误的结果

发布从keras到tf.keras的移植代码

在训练用于自动语音识别的模型时降低单词错误率

时间序列数据的趋势

划时代末端Keras损失的变化

Keras:根据ModelCheckpoint的最佳模型-回调在训练集上产生的损失不同于训练时显示的最佳时期损失

在tensorflow中重新初始化迭代器后对数据集进行混洗

无法在tensorflow中多次重复LSTM模型的相同结果

使用Tensorflow保存检查点

你能解释一下每次迭代时角角的输出吗？

在将它们合并用于多任务学习之前，我是否应该消除它们的损失？

Tensorflow在机器之间损失方面的主要差异

两个张量之差的损失函数

Colab Pro在使用TPU Runtime训练深度学习模型12小时后自动断开连接

Tensorflow model.evaluate给出了与训练结果不同的结果

通过ImageDataGenerator将数据导入tensorflow自动编码器

TensorFlow PoolAllocator请求数量巨大

tensorflow.compat.v1.disable_v2_behavior()应该对使用Keras API的训练有什么影响？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐