在米尼思教程中,数据集被分成三个不同的集合:(1) data_sets.train、(2) data_sets.validation和(3) data_sets.test。然而,在训练循环中,只使用data_sets.train进行训练。
# Start the training loop.
for step in xrange(FLAGS.max_steps):
start_time = time.time()
# Fill a feed dictionary with the actual set of images and labels
# for this particular training step.
feed_dict = fill_feed_dict(data_sets.train,
images_placeholder,
labels_placeholder)并对模型的每个(step + 1) % 1000 == 0 or (step + 1) == FLAGS.max_steps进行了评价,得到了三个不同的评价结果:(1)训练数据Eval,(2)验证数据Eval和(3)测试数据Eval。
在机器学习中,通常采用验证集对模型参数进行微调,并对学习曲线进行改进。
如何在Tensorflow中使用验证集,从而提高学习曲线?
发布于 2017-01-28 07:08:11
由于深度学习的训练时间太长,所以使用网格搜索或随机搜索等方法进行超参数优化需要很长的时间。
验证集主要用于在训练过程中检查列车数据集上的过度拟合情况。然后根据验证集对模型/超参数进行调整。据我所知,这是手动完成的。
测试集对算法的设计没有影响,在新的未见数据上估计分类器的性能。
编辑:
有一些技术可以使用验证集,如EarlyStopping (https://keras.io/callbacks/#earlystopping)或当验证错误在x历元(https://keras.io/callbacks/#reducelronplateau)没有减少时降低学习速度。
https://stackoverflow.com/questions/41903062
复制相似问题