如何确定Keras ImageDataGenerator中测试数据集的最佳“步数”和“批处理大小”？

确定Keras ImageDataGenerator中测试数据集的最佳"步数"和"批处理大小"是一个关键的任务，它直接影响到模型的性能和训练过程的效率。以下是一些建议：

步数（Steps）是指每个时期（epoch）中迭代器（iterator）从数据集中获取的批次数。对于测试数据集，步数通常应该使得测试集中的所有样本都能被处理到。一种简单的方法是使用测试集中的样本总数除以批处理大小来计算步数。如果测试集中的样本总数不能被批处理大小整除，则可以向上取整或向下取整，根据需要来决定是否处理剩余样本。

批处理大小（Batch Size）是指每次迭代从数据集中读取的样本数量。选择合适的批处理大小需要平衡内存消耗和计算效率。较小的批处理大小可以提高模型的泛化能力，但也会增加迭代次数和训练时间。较大的批处理大小可以加快训练速度，但可能会影响模型的性能和泛化能力。通常建议从较小的值开始尝试，例如32或64，然后根据具体情况进行调整。

在确定步数和批处理大小时，还应考虑计算资源的限制和模型的复杂性。如果计算资源有限，可以根据可用内存和显存的大小来选择较小的批处理大小。如果模型较大或复杂，可能需要较小的批处理大小和较大的步数来确保充分的训练。

在Keras中，可以通过ImageDataGenerator的flow_from_directory方法加载数据集，并通过参数设置步数和批处理大小。例如，设置步数可以使用参数steps_per_epoch，设置批处理大小可以使用参数batch_size。具体用法可以参考腾讯云的Keras文档（https://cloud.tencent.com/document/product/851/19525）。

综上所述，确定Keras ImageDataGenerator中测试数据集的最佳步数和批处理大小是一个基于具体情况的任务，需要综合考虑数据集大小、计算资源限制、模型复杂性等因素。

页面内容是否对你有帮助？

有帮助

没帮助

如何确定Keras ImageDataGenerator中测试数据集的最佳“步数”和“批处理大小”？

、、、

测试数据集包含4个图像目录(camera_positive、sketch_positive、camera_negative、sketch_negative)。在测试数据集上评估网络性能时，我遇到了问题。由于测试数据集太大，无法放入内存中，因此我决定使用Keras ImageDataGenerator。我实现了以下代码。因此，总共有80个图像和40个预测。由于ImageDataGenerator

浏览 18提问于2020-01-24得票数 0

1回答

将数据拆分成批处理

、、、

我想将我的训练数据、测试数据和验证数据分成批处理。我正在处理时尚MNIST数据集，并直接从keras.datasets访问它。我找到了下面提到的代码： trainbatches = ImageDataGenerator().flowfromdirectory(trainpath, targetsize=(224,224), classes= classname, batchsize=10 testbatches = ImageDataGener

浏览 23提问于2020-04-04得票数 1

1回答

Mask图像的训练设计/顺序加载

、、、

我正在使用Mask从以下git存储库中培训一个深度学习模型: matterport/Mask_RCNN。我依赖于数据集的大量扩展(原始数据集: 1988x1355x3的59幅图像，每个批注> 80 )，我将其存储在本地(需要评估类型/增强程度和验证度量)。增强后的数据集统计6000幅图像。该数据集在图像的x维和y维数上有所不同，因为分辨率降低和仿射转换-我假设不同的

浏览 3提问于2020-04-12得票数 0

1回答

具有良好训练精度的低验证精度角图像数据生成器flow_from_directory分类

、、

我试图分类的卡格尔10k狗图像120个品种使用Keras和ResNet50。由于Kaggle (14 in内存)的内存限制，我必须使用ImageDataGenerator实时地为模型提供图像并允许数据增强。-因此在培训过程和编译模型中不会修改ResNet50原始权重：model.compile(optimizer=optimizers.Adam()在这些文件夹中是狗的图像。Keras</

浏览 0提问于2018-09-10得票数 2

1回答

使用ImageDataGenerator时，模型拟合永远不会完成第一个时期

、、

使用与notebook中相同的方法和数据，我使用tf.keras.preprocessing.image.ImageDataGenerator和.flow_from_directory创建了一个批处理大小为很合理，但奇怪的是，a)它在链接的notebook中工作，b)当创建数据集时，它输出Found 5307 images...，所以它似乎知道它的大小，但好吧。一

浏览 11提问于2021-06-11得票数 0

1回答

如何在使用ImageDataGenerator时获得基本事实和相应的分数

、、、

我第一次接触Keras和我的测试数据集使用roc曲线来评估我的模型的质量(模型是使用functional api完成的，在我的代码片段中被标识为"model“)。示例： fpr_keras, tpr_keras, thresholds_keras = roc_curve(y_true,y_scores) 为此，正如文档所述，我需要真正的二进制标签(示例中

浏览 22提问于2019-04-25得票数 0

1回答

在Keras中定义steps_per_epoch

、、

我在读“深度学习在Python中的应用”这本书，我想更多地了解在定义steps_per_epoch和batch size时会发生什么。我搞不懂为什么他们在两种情况下改变了批量大小。我理解的过程是，1个时期就是整个训练数据集的1次遍历。批处理大小决定了每一步显示多少图像。当我们改变批大小时，我们改变了要学习的图像的数量。对于他们在训练中的

浏览 68提问于2021-02-11得票数 0

回答已采纳

1回答

如何查找ImageDataGenerator生成的图像数量

、、、

嗨，我想问你一个关于Keras ImageDataGenerator的问题。我可以确定将创建多少增强图像吗？或者如何找到训练图像集大小后的augmentation.In Keras文档流函数描述是：“获取numpy数据和标签数组，并生成批次的增广/标准化数据。在无限循环中生成批次。”但是生成了多少图像呢？无限的？from keras.preprocess

浏览 21提问于2017-12-28得票数 12

1回答

什么是最优的批大小的特地元上传。

、

我正试图找出它的最佳批处理大小的teradata。然而，我看到人们说，他们的批次包括多达一百万行。列数可能不同，而且可能是很重的100行和10

浏览 1提问于2014-03-06得票数 0

2回答

用于旋转和平移的中心作物Keras ImageDataGenerator

、、、、

相反，每次图像被旋转或翻译时，我都希望它是中心-裁剪(如下图所示)，这样就不会像解释的那样有任何黑、白、反射或恒定的边缘/边框。保留中除增强部分以外的现有部分，并编写自定义增强函数。在进行增强之前，保留原始大小的图像是有效的，因为中心作物在调整大小</em

浏览 0提问于2019-05-22得票数 5

1回答

模型在Keras中工作得很好，但在Tensorflow中却不行。

、、、、

Tensorflow代码：-from keras.preprocessing.image import ImageDataGenerator shear_range = 0.2,batch_size = 10, c

浏览 0提问于2020-07-23得票数 1

回答已采纳

2回答

Keras ImageDataGenerator Slow

、、、

我正在寻找在Keras中训练大于内存的数据的最佳方法，目前注意到普通的ImageDataGenerator往往比我希望的要慢。我在Kaggle猫与狗的数据集(25000张图片)上进行了两个网络训练：2)与(1)相同，但使用ImageDataGenerator而不是将数据加载到内存中注意:在下文中，“预处理”是指调整大小</em

浏览 4提问于2016-12-10得票数 8

1回答

ImageDataGenerator从Keras返回‘`TypeError:数据类型不低于存储’

、、、

我使用Keras ImageDataGenerator.flow_from_directory(.)创建了培训和测试数据集。然后，我想使用这些数据适合model.fit()。在Tensorflow 2.1中，它工作得非常好。但是，在Tensorflow 2.2中运行相同的代码会生成：TypeError: data type not understood。您建议如何克服这一问题并运行TF2.2？代码示例： train_gen = tf.

浏览 4提问于2021-03-01得票数 0

回答已采纳

5回答

凯拉斯fit在第一个时代结束时结冰

、、

我目前正在试验使用Keras对VGG16网络进行微调。然而，使用当前的配置，培训似乎在第一个时代就被阻止了。from keras import applicationsfrom keras importoptimizers from keras.models import

浏览 1提问于2018-02-12得票数 3

2回答

Kaggle:在CNN中处理额外的未标记测试数据

、、、、

我正在做一个kaggle竞赛，我有额外的测试数据，我没有标签。这将继续训练/10259.jpg 然后，我将这些标签分配给我的训练数据，然后是我的测试数据，所以它们变成了。0.jpg -> 5.0.jpg 2.jpg -> 10.2.jpg 10259是我的训练数据集的大小。因此，我拥有训练集的所有标签。然后，我对/test文件夹执行相同的操作。然而

浏览 35提问于2021-04-07得票数 0

回答已采纳

1回答

Keras设置数据集

、

我正在尝试设置我的训练、验证和测试数据，但遇到错误： Traceback (most recent call last):train_data_gen =Use a.any() import numpy as np # Process

浏览 11提问于2021-07-07得票数 0

回答已采纳

5回答

UnimplementedError:融合的conv实现目前不支持分组卷积

、、、

我下载了png压缩文件，将数据导入Google，然后将数据拆分到火车测试文件夹中。以下是模型： tf.keras.layers.Conv2D(filters = 64, kernel_size = (5,5(pool_size=(2,2), strides=(2,2)), tf

浏览 12提问于2020-05-14得票数 13

回答已采纳

1回答

如何设置Keras自动编码器和重塑()，以处理224 x 224 jpg图像使用ImageDataGenerator？

、、、、

我正在尝试将应用于属于40个类的224 x 224图像的自己的数据集，设置如下：我使用ImageDataGenerator创建培训、验证和测试集；培训集大小为13,988；测试和验证大小均为3,000但是，无论我如何设置这些参数，我都会得到以下错误：或者不匹配<em

浏览 4提问于2020-11-29得票数 0

回答已采纳

2回答

Tensorflow / Keras* Python CNN*

、、、

我正在做一个项目，在这个项目中，Python脚本使用卷积神经网络来确定一个植物是否健康，然后在此基础上浇水。在训练CNN的过程中，它似乎很早就达到了100%的准确率，尽管它并不准确。我只有不到2000张照片，我想知道我是不是没有足够的照片，或者是我的模型，就在这里 self.model.add(Conv2D, optimizer = 'adam

浏览 0提问于2020-06-12得票数 0

回答已采纳

2回答

预测产生器角的问题

、、、、

我刚接触过tensorflow后端的keras，我正在尝试用预先训练过的网来进行转移学习。问题是验证集的准确率很高，在90%左右，但在测试集上的精度很差，不到1%。我解决了使用opencv读取和调整图像大小的问题，但我想了解为什么使用keras方法我有这个问题。我将代码粘贴在下面。在培训之后，我为测试数据创建了一个新的Iterator，如下所示： test_dat

浏览 0提问于2019-12-23得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何确定Keras ImageDataGenerator中测试数据集的最佳“步数”和“批处理大小”？

相关·内容

如何确定Keras ImageDataGenerator中测试数据集的最佳“步数”和“批处理大小”？

将数据拆分成批处理

Mask图像的训练设计/顺序加载

具有良好训练精度的低验证精度角图像数据生成器flow_from_directory分类

使用ImageDataGenerator时，模型拟合永远不会完成第一个时期

如何在使用ImageDataGenerator时获得基本事实和相应的分数

在Keras中定义steps_per_epoch

如何查找ImageDataGenerator生成的图像数量

什么是最优的批大小的特地元上传。

用于旋转和平移的中心作物Keras ImageDataGenerator

模型在Keras中工作得很好，但在Tensorflow中却不行。

Keras ImageDataGenerator Slow

ImageDataGenerator从Keras返回‘`TypeError:数据类型不低于存储’

凯拉斯fit在第一个时代结束时结冰

Kaggle:在CNN中处理额外的未标记测试数据

Keras设置数据集

UnimplementedError:融合的conv实现目前不支持分组卷积

如何设置Keras自动编码器和重塑()，以处理224 x 224 jpg图像使用ImageDataGenerator？

Tensorflow / Keras* Python CNN*

预测产生器角的问题

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐