Loading [MathJax]/jax/output/CommonHTML/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >CIFAR-10的Keras V1的预期验证精度(从头开始培训)

问CIFAR-10的Keras V1的预期验证精度(从头开始培训)
EN

Stack Overflow用户

提问于 2018-09-06 10:03:21

回答 2查看 2.9K关注 0票数 1

有没有人用CIFAR-10从头开始训练移动网络V1？你的最大准确度是多少？在经历了110个时代之后，我被困在了70%的地方。下面是我创建模型的方法。然而，我的训练准确率在99%以上。

#create mobilenet layer

MobileNet_model = tf.keras.applications.MobileNet(include_top=False, weights=None)

# Must define the input shape in the first layer of the neural network

x = Input(shape=(32,32,3),name='input')

#Create custom model

model = MobileNet_model(x)

model = Flatten(name='flatten')(model)

model = Dense(1024, activation='relu',name='dense_1')(model)

output = Dense(10, activation=tf.nn.softmax,name='output')(model)

model_regular = Model(x, output,name='model_regular')

我在LR= 0.001中使用了Adam优化器，amsgrad = True和批处理大小= 64。也是标准化像素数据除以255.0。我不使用任何数据增强。

optimizer1 = tf.keras.optimizers.Adam(lr=0.001, amsgrad=True)

model_regular.compile(optimizer=optimizer1, loss='categorical_crossentropy', metrics=['accuracy'])

history = model_regular.fit(x_train, y_train_one_hot,validation_data=(x_test,y_test_one_hot),batch_size=64, epochs=100)  # train the model

我认为我应该得到至少75%，根据https://arxiv.org/abs/1712.04698是，我做了什么错误，或这是预期的准确性后100个历次。这是我的验证准确性图。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-12-07 16:58:09

Mobilenet是为了训练大得多的Imagenet而设计的，因此在Cifar10上进行训练将不可避免地导致过度拟合。我建议你把训练和验证/评估的损失(不是精明的)都画出来，努力训练达到99%的训练准确率，然后观察验证损失。如果这是过度拟合，你会看到，验证损失实际上将增加后，达到最小。

有几件事要尽量减少过度适应：

在完全连接的层之前添加下拉
数据增强-随机移位、作物和轮作应该足够了。
使用较小的宽度乘法器(阅读原始纸张，基本上只是减少每层过滤器的数量)，例如0.75或0.5，以使图层变薄。
使用L2权值正则化和权重衰减

还有一些常见的训练技巧：

使用学习速率衰减，例如，将学习率从1e-2降到1e-4，逐步或按指数递减。

通过超参数搜索，得到了0.85的评价损失。我没有使用Keras，而是使用Tensorflow自己编写的Mobilenet。

票数 3

EN

Stack Overflow用户

发布于 2019-06-28 08:17:35

OP询问了MobileNetv1的情况。自从MobileNetv2出版以来，这里是关于CIFAR-10 -培训MobileNetv2的最新情况。

1) MobileNetv2主要用于工作在ImageNet上，初始图像分辨率为224x224。GlobalAvgPool2D (倒数第二层)得到了Cx7x7的特征图，其中C是滤波器的个数(MobileNetV2为1280)。

2)对于CIFAR10，我将前三层的步幅改为1，这样GlobalAvgPool2D就得到了Cx8x8的特征图。其次，我用0.25训练了宽度参数(影响网络的深度)。我在mxnet (动物园/分类器.)中接受过混搭训练。这使我得到了93.27的验证精度。

3)另一个似乎适用于CIFAR-10的MobileNetV2实现是在这里提供的- PyTorch-CIFAR，报告的准确性为94.43。这个实现改变了最初两层中的步长，将分辨率降到1，并且它使用了用于ImageNet的通道的全部宽度。

4)此外，我在CIFAR-10上训练了一个MobileNetV2，混和，而只将第一个conv层的步长从2改为1，并使用了完全深度(宽度parameter==1.0)。因此，GlobalAvgPool2D (倒数第二层)得到了Cx2x2的特征映射。这使我的准确度达到92.31。

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/52209851

复制

相关文章

计数与组合

image png 原理

加法原理：集合元素可以被划分为集合族F = {S1, S2, S3…}则S的元素个数是这些元素个数之和：|S| = |S1| + |S2| + |S3|+…|Sn|

From Zero

2021/12/07

5900

微服务网关与用户身份识别，服务提供者之间的会话共享关系

ide 云数据库 Redis®spring spring cloud 分布式

一套分布式微服务集群可能会运行几个或者几十个网关（gateway），以及几十个甚至几百个Provider微服务提供者。如果集群的节点规模较小，那么在会话共享关系上，同一个用户在所有的网关和微服务提供者之间共享同一个分布式Session是可行的，如图6-8所示。

愿天堂没有BUG

2022/10/28

7490

微服务网关与用户身份识别，服务提供者之间的会话共享关系

[PHP] PHP7以上版本的引用计数不同的困惑

编程算法 php

按正常理解php的变量是引用计数，第一次创建变量refcount会是0，当把这个变量赋给新的变量时，refcount会加1

唯一Chat

2020/03/19

4420

Web应用的会话、认证与安全

SSL 证书网络安全 http 数据分析

HTTP协议最初是匿名的、无状态的，一次请求和响应一旦结束，客户端和服务端的连接就会关闭，服务器没有信息可以用来判断哪个用户发送的请求，也无法跟踪用户会话。

搬砖俱乐部

2019/06/15

1.5K0

Scope AR将为Holoens提供远程视频会话技术支持

12月13日，Scope AR为微软的Holoens头显推出了一套AR视频解决方案Remote AR。这家旧金山的公司带来的企业级AR解决方案，能够实现跨平台在线视频通话。用于微软 HoloLens

VRPinea

2018/05/17

7530

vissE--提供不同的基因集富集分析方法！

igraph overlap themes

通常，基因集富集分析的结果（例如使用 limma::fry、singscore 或 GSEA）由一长串基因集组成。然后生物学家必须搜索这些列表，以确定新出现的主题来解释改变的生物过程。这项任务可能是劳动密集型的，因此需要解决方案来总结来自此类分析的大量结果

作图丫

2022/03/29

5510

vissE--提供不同的基因集富集分析方法！

Salesforce Connect：为客户成功提供连接的应用程序

Salesforce connect是一个新的应用允许Salesforce用户访问和管理外部应用，无论是传统还是云端的应用，都可直接通过Salesforce来访问。通过Salesforce connect，你的业务能够更高效和灵活，并能提供更高级别的客户成功。

臭豆腐

2019/04/16

1.5K0

Android官方提供的支持不同屏幕大小的全部方法

android xml html 编程算法

为了确保你的布局能够自适应各种不同屏幕大小，你应该在布局的视图中使用"wrap_content"和"match_parent"来确定它的宽和高。如果你使用了"wrap_content"，相应视图的宽和高就会被设定成刚好能够包含视图中内容的最小值。而如果你使用了"match_parent"(在Android API 8之前叫作"fill_parent")，就会让视图的宽和高延伸至充满整个父布局。

黄啊码

2020/05/29

1.7K0

会话控制 COOKIE 与 SESSION

网络安全存储云数据库 Redis®http flask

会话控制用来保持用户的状态具体来说cookie机制采用的是在客户端保持状态的方案，而session机制采用的是在服务器端保持状态的方案

星哥玩云

2022/09/14

3810

LeetCode 1930. 长度为 3 的不同回文子序列（计数）

https 网络安全编程算法

子序列是由原字符串删除其中部分字符（也可以不删除）且不改变剩余字符之间相对顺序形成的一个新字符串。

Michael阿明

2021/09/06

9790

LeetCode 1481. 不同整数的最少数目（计数+排序+贪心）

给你一个整数数组 arr 和一个整数 k 。现需要从数组中恰好移除 k 个元素，请找出移除后数组中不同整数的最少数目。

Michael阿明

2020/07/13

5520

如何在Flutter应用程序中创建不同的渐变[Flutter专题20]

flutter ios android

Flutter 可用于创建漂亮的 UI。因此，在今天的文章中，我们将看到如何在应用程序中创建不同的渐变。

徐建国

2021/12/22

4.9K0

如何在Flutter应用程序中创建不同的渐变[Flutter专题20]

云计算提供商的网络性能有哪些不同

云计算 DevOps 解决方案

每个云计算提供商的网络连接方式各不相同，这会导致网络性能和可预测性方面的地理差异。随着越来越多的企业考虑将业务迁移到云平台，尤其是软件定义广域网(SD-WAN)和多云，了解每个公共云服务提供商提供的服务以及如何进行比较至关重要。

静一

2020/03/15

1.4K0

针对会话机制的攻击与防御

编程算法网站网络安全安全

学习打卡计划是信安之路知识星球开启的 “每天读书一小时，挑战打卡一百天” 主题活动，能够坚持学习打卡 100 天的同学可以获得信安之路提供的百分成就徽章和证书，学习书籍可以自选，主要目的是养成每日读书学习的好习惯，并将自己的学习心得分享出来供大家学习。

信安之路

2020/12/24

6220

15-会话技术与Cookie

tomcat cookie response string web

一次会话中包含多次请求和相应，浏览器第一次给服务器资源发送请求，会话建立，直到有一方断开为止，会话结束

Ywrby

2022/10/27

4280

「小程序JAVA实战」java-sesion的状态会话与无状态会话（38）

网站云数据库 Redis®

我相信大家在参与web开发的时候，肯定会遇到session，其实在平常的开发过程中，用到的session都是有状态的session。有状态的session 正常的web开发，每次来一个用户就会产生一

IT架构圈

2019/07/08

5350

「小程序JAVA实战」java-sesion的状态会话与无状态会话（38）

TCP会话劫持原理与测试

由于 TCP 协议并没有对 TCP 的传输包进行验证，所以在我们知道一个 TCP 连接中的 seq 和 ack 的信息后就可以很容易的伪造传输包，假装任意一方与另一方进行通信，我们将这一过程称为 TCP 会话劫持（TCP Session Hijacking）

信安之路

2018/08/08

4.4K0

什么是域名？如何利用域名解析提供不同的服务？

tcp/ip DNS 解析 DNSPod erp dns 域名注册

在日常的IT服务工作中，还是有相当一部分的客户，不明白域名的概念、域名的重要性以及域名能为企业带来什么样的便利，那么笔者就以本文来解释一下，什么是域名？以及域名在实际工作中的妙用。

IT狂人日志

2022/05/18

4.6K0

什么是域名？如何利用域名解析提供不同的服务？

点击加载更多

相似问题

与分组不同的计数

13

与组不同计数

32

不同用户会话的相似记录计数

10

CountVectorizer给出的计数与手工计数不同

14

粘性会话与基于cookie的会话不同吗？

213

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例