首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >使用 GAN 进行数据增强-AI快速进阶系列

使用 GAN 进行数据增强-AI快速进阶系列

作者头像
jack.yang
发布于 2025-04-05 12:03:14
发布于 2025-04-05 12:03:14
3870
举报

1. 概述

在本教程中,我们将讨论使用生成对抗网络 (GAN) 进行数据增强。首先,我们将介绍数据增强和 GAN,然后我们将介绍一个能够生成非常逼真的样本的 GAN 架构。

2. 数据增强

深度学习彻底改变了许多领域,并已成为许多复杂任务(如文本翻译、图像分割和自动语音识别)的最新方法。大型注释数据集在这一成功中起着至关重要的作用,因为深度学习模型需要大量数据进行训练。但是,注释大量训练数据有时既困难又昂贵。因此,适当的数据增强对于提高模型性能非常有用。

为了更好地通过示例解释这个概念,我们将重点介绍图像的数据增强,但无论域如何,方法都是相同的。通常,数据增强的目标是通过更改现有数据的属性或生成全新的合成数据来增加数据集的大小。

通常,遵循前一种方法,我们翻转、旋转或随机更改图像的色调、饱和度、亮度和对比度。该过程很简单,可以在训练模型时在线完成。使用这些技术的缺点是,我们不会向模型引入新的合成数据,而只是包含处于不同状态的相同样本。因此,模型已经看到了这些样本,并且对泛化性的影响是有限的:

生成新的逼真的合成数据是一项艰巨的任务,包括学习模仿数据集的原始分布。正如我们将看到的,GAN 可以生成真实的样本并提高模型性能。

3. GANs

让我们首先简要介绍一下它们由两部分组成的结构。

学习生成合理数据的生成器。它采用固定长度的随机向量作为输入,并学习生成模拟原始数据集分布的样本。然后,生成的样本成为鉴别器的负示例。

学习将生成器的合成数据与真实数据区分开来的鉴别器。它将样本作为输入,并将其分类为“真实”(来自原始数据集)或“假”(来自生成器)。鉴别器惩罚生成器产生难以置信的样本:

在图像的情况下,生成器和鉴别器都是CNN,生成器的目标是生成非常逼真的图像,以至于鉴别器认为它们是真实的。然后,使用反向传播来随着时间的推移更新这些模型的权重和偏差,生成器将慢慢学习创建模拟原始数据集的物理和数学分布的样本。

这些模型玩一个两人的最小最大值游戏,因此优化鉴别器的目标函数会对生成器的目标函数产生负面影响,反之亦然。具体说来:

1)生成器希望最小化log(1 - D(G(z)))生成器的随机输入位置z。通过最小化此术语,生成器在将假样本分类为真实样本时欺骗了鉴别器。

2)鉴别器希望最大化log(D(x_{d})) + log(1 - D(G(z)))原始数据集中的样本位置。该项对应于为真实样本和来自生成器的样本分配正确标签的概率。

4. 条件性 GAN

在少数样本学习设置中,我们希望根据有限数量的样本训练预测模型。例如,假设我们要创建一个模型,该模型将狗的图像作为输入并预测其品种。我们有庞大的动物数据集,但用狗品种注释的数据量非常有限。在这里,解决方案是使用 GAN 来扩充我们的数据集。

尽管常规 GAN 在大量数据上训练时可以生成非常逼真的样本,但它们无法生成具有特定标签的样本。条件 GAN 通过修改原始生成器网络来控制其输出来处理这个问题。具体来说,网络有两个主要变化。

我们在生成器的输入中添加一个标签Y,并尝试生成相应的数据点。

鉴别器将样本X和相应的标签Y作为输入:

在条件 GAN 中,生成器被教导生成特定类的示例来欺骗鉴别器。这样,条件 GAN 可以从给定类型的域生成样本。在论文中,我们可以看到一些为每行生成数字的示例,条件为一个标签

5. 限制

GAN 的功能在数据增强方面令人印象深刻,因为它们可以有效地学习输入数据的基础分布并生成非常真实的样本。但是,存在一些限制:

  1. 我们没有用于评估生成样本质量的内在指标。已经提出了一些实验指标,但需要朝着这个方向做更多的研究。
  2. GAN的训练通常是不稳定的,需要大量的计算资源。

6. 结论

在本文中,我们讨论了如何使用 GAN 进行数据增强。首先,我们介绍了数据增强和生成模型的主题,然后我们介绍了可用于生成非常现实样本的条件 GAN。最后,我们强调了GAN的一些局限性。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-02-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
生成对抗网络-AI快速进阶系列
首先,我们将介绍术语生成模型及其分类法。然后,将描述GAN的架构和训练管道,并附有详细示例。最后,我们将讨论GAN的挑战和应用。
jack.yang
2025/04/05
830
生成对抗网络-AI快速进阶系列
生成对抗网络:判别器损失和生成器损失-AI快速进阶系列
在本教程中,我们将讨论生成对抗网络(GAN),一种无监督的深度学习方法。主要,我们将介绍构成 GAN 的两个主要模型的架构,即生成器和鉴别器模型。我们还将通过它们的损失函数分析两个模型之间的主导行为。
jack.yang
2025/04/05
3030
生成对抗网络:判别器损失和生成器损失-AI快速进阶系列
用GANs来做数据增强
生成对抗网络(Generative adversarial networks,简称GANs)由Ian Goodfellow于2014年推出,近年来成为机器学习研究中非常活跃的话题。GAN是一种无监督生成模型,它隐含地学习底层分布。在GAN框架中,学习过程是两个网络之间的极大极小博弈,一个生成器,生成给定随机噪声向量的合成数据,一个鉴别器,区分真实数据和生成器的合成数据。
OpenCV学堂
2021/03/12
1.6K0
用GANs来做数据增强
GAN生成对抗网络入门介绍
GAN(Generative Adversarial Network)生成对抗网络,由Ian Goodfellow在2014年提出。
Minerva
2020/06/16
2.7K0
GAN生成对抗网络入门介绍
深度学习进阶篇[9]:对抗生成网络GANs综述、代表变体模型、训练策略、GAN在计算机视觉应用和常见数据集介绍,以及前沿问题解决
生成模型:p(x) 即观测x出现的概率。如果有标签则表示为: p(x|y) 指定标签y生成x的概率。
汀丶人工智能
2023/06/01
3K0
深度学习进阶篇[9]:对抗生成网络GANs综述、代表变体模型、训练策略、GAN在计算机视觉应用和常见数据集介绍,以及前沿问题解决
DeepMind爆出无监督表示学习模型BigBiGAN,GAN之父点赞!
例如,被称为史上最强图像生成器的BigGAN——许多人看到BigGAN生成的图像都要感叹“太逼真了!DeepMind太秀了吧!”
新智元
2019/07/12
5630
DeepMind爆出无监督表示学习模型BigBiGAN,GAN之父点赞!
几乎克服了所有cGAN都存在的使用交叉熵的缺陷
Neural Characteristic Function Learning for Conditional Image Generation
CreateAMind
2024/05/06
4020
几乎克服了所有cGAN都存在的使用交叉熵的缺陷
真·无监督!延世大学提出图像到图像无监督模型,实验结果超SOTA
图像翻译目的是用模型将源域图像转换到目标域图像,通常涉及标签图到场景图的转换、图像风格、人脸的属性变换、标签图到场景图的转换。
AI科技评论
2020/06/17
1.1K0
真·无监督!延世大学提出图像到图像无监督模型,实验结果超SOTA
Text to image论文精读Adma-GAN:用于文本到图像生成的属性驱动内存增强型GAN Attribute-Driven Memory Augment
在现代电子商务中,个性化推荐系统已经成为提升用户体验和增加销售的重要工具。智能食品推荐系统通过分析用户的历史行为和偏好,提供个性化的食品推荐,从而提高用户满意度和转化率,这篇文章介绍了如何使用Python构建一个智能食品推荐系统的深度学习模型。该系统通过分析用户的食品偏好和购买历史,预测用户可能喜欢的食品,实现了食品推荐的智能化,并通过具体代码示例展示实现过程。
中杯可乐多加冰
2024/11/20
1190
【1】GAN在医学图像上的生成,今如何?
最初,GAN在被提出时,是一个无监督(无条件)的生成框架:例如在图像合成中,将随机噪声映射到逼真的目标图像。
公众号机器学习与AI生成创作
2020/04/28
3.4K0
【1】GAN在医学图像上的生成,今如何?
CVPR 2020 | 10篇改进GAN的论文(网络、训练、正则等)
引入新的局部稀疏注意力层,保留二维几何形状和局部性,用这种结构替换SAGAN的密集注意力层即可获得显着的FID、Inception score和视觉效果。https://github.com/giannisdaras/ylg
OpenCV学堂
2020/06/19
1.1K0
CVPR 2020 | 10篇改进GAN的论文(网络、训练、正则等)
生成模型VAE、GAN和基于流的模型详细对比
在Ian Goodfellow和其他研究人员在一篇论文中介绍生成对抗网络两年后,Yann LeCun称对抗训练是“过去十年里ML最有趣的想法”。尽管GANs很有趣,也很有前途,但它只是生成模型家族的一部分,是从完全不同的角度解决传统AI问题,在本文中我们将对比常见的三种生成模型。
deephub
2022/11/11
9980
生成模型VAE、GAN和基于流的模型详细对比
Arxiv2023 | TriA-GAN:任意人物,任何地方,任何姿势的合成
Paper title: Synthesizing Anyone, Anywhere, in Any Pose
BBuf
2023/08/25
4100
Arxiv2023 | TriA-GAN:任意人物,任何地方,任何姿势的合成
GAN的训练技巧:炼丹师养成计划 ——生成式对抗网络训练、调参和改进
生成对抗网络(GAN:Generative adversarial networks)是深度学习领域的一个重要生成模型,即两个网络(生成器和鉴别器)在同一时间训练并且在极小化极大算法(minimax)中进行竞争。这种对抗方式避免了一些传统生成模型在实际应用中的一些困难,巧妙地通过对抗学习来近似一些不可解的损失函数。
中杯可乐多加冰
2024/08/15
6960
CVPR 2020 | 10篇改进GAN的论文(网络、训练、正则等)
引入新的局部稀疏注意力层,保留二维几何形状和局部性,用这种结构替换SAGAN的密集注意力层即可获得显着的FID、Inception score和视觉效果。https://github.com/giannisdaras/ylg
公众号机器学习与AI生成创作
2020/06/19
1.3K0
CVPR 2020 | 10篇改进GAN的论文(网络、训练、正则等)
从概率分布角度理解GAN
生成对抗网络(GANs / Generative Adversarial Networks)是当今 AI 领域的热门话题之一。在这篇文章中,我们将从一个不同的视角来看GANs,即不是将它视为一个漂亮图像的生成器,而是一个概率分布变换函数。我们将探索 GAN 的核心理念,但不纠缠于实现和复杂的数学。我们从分析手头上的问题类型开始。然后,我们会观察到解决方案的要求是如何塑造 GAN 的想法的。
McGL
2020/10/30
1.3K0
从概率分布角度理解GAN
Cycle-object consistency for image-to-image domain adaptation
 生成对抗性网络(GANs)的最新进展已被证明可以通过数据扩充有效地执行目标检测器的域自适应。虽然GANs非常成功,但那些能够在图像到图像的翻译任务中很好地保存目标的方法通常需要辅助任务,例如语义分割,以防止图像内容过于失真。然而,在实践中很难获得像素级注释。或者,实例感知图像转换模型分别处理对象实例和背景。然而,它在测试时需要目标检测器,假设现成的检测器在这两个领域都能很好地工作。在这项工作中,我们介绍了AugGAN Det,它引入了循环目标一致性(CoCo)损失,以生成跨复杂域的实例感知翻译图像。 目标域的目标检测器直接用于生成器训练,并引导翻译图像中保留的目标携带目标域外观。与之前的模型(例如,需要像素级语义分割来强制潜在分布保持对象)相比,这项工作只需要更容易获取的边界框注释。接下来,对于感知实例的GAN模型,我们的模型AugGAN-Det在没有明确对齐实例特征的情况下内化了全局和对象样式转移。最重要的是,在测试时不需要检测器。实验结果表明,我们的模型优于最近的目标保持和实例级模型,并实现了最先进的检测精度和视觉感知质量。
狼啸风云
2023/10/07
3790
Cycle-object consistency for image-to-image domain adaptation
苹果机器学习期刊首文:提升合成图像的真实性
选自Apple 参与:机器之心编辑部 从 CoreML 到自动驾驶汽车,苹果的新技术探索在形成产品之前通常都会处于接近保密的状态,直到去年 12 月底,他们才以公司的名义发表了第一篇机器学习领域里的学术论文,介绍了自己在改善合成图像质量方面的研究。最近,这家以封闭而闻名的科技巨头突然宣布将以在线期刊的形式定期发表自己在机器学习方面的研究,而这份期刊的第一篇文章主要探讨的依然是合成图像的真实性,让我们先睹为快。 苹果机器学习期刊:https://machinelearning.apple.com/ 现在,神经
机器之心
2018/05/09
8600
苹果机器学习期刊首文:提升合成图像的真实性
超100篇!CVPR 2020最全GAN论文梳理汇总!
下述论文已分类打包好!共116篇,事实上仍有一些GAN论文未被包含入内,比如笔者发推文时,又看到一篇《Rotate-and-Render: Unsupervised Photorealistic Face Rotationfrom Single-View Images》……可见GAN在CVPR 2020的火爆程度。
公众号机器学习与AI生成创作
2020/06/28
3.5K0
超100篇!CVPR 2020最全GAN论文梳理汇总!
深入浅出,GAN(生成式对抗网络)在Midjourney中的应用实现
生成对抗网络(GANs)自诞生以来就在机器学习领域掀起了巨大波澜,它为图像生成、数据增强等诸多任务提供了强大的解决方案。在MJ(Midjourney,一款知名的AI绘画工具,以生成高质量图像著称,其背后大概率也运用到了类似GAN的技术理念)相关的应用场景下,GAN技术更是助力创造出令人惊叹的视觉内容。
钮祜禄.爱因斯晨
2025/06/07
1130
深入浅出,GAN(生成式对抗网络)在Midjourney中的应用实现
推荐阅读
相关推荐
生成对抗网络-AI快速进阶系列
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档