前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >综述推荐 | CV视觉中GAN的调研和分类

综述推荐 | CV视觉中GAN的调研和分类

作者头像
公众号机器学习与AI生成创作
发布2020-06-27 22:41:11
1.4K0
发布2020-06-27 22:41:11
举报
文章被收录于专栏:机器学习与生成对抗网络

0 前言

  • 前几天,一位英特尔的小伙伴给公众号发了他们最近更新的GAN综述论文,已经挂在arxiv上,总结得非常不错,今天强推一波!
  • Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy
  • https://arxiv.org/pdf/1906.01529.pdf
  • 作者: Zhengwei Wang is with V-SENSE, School of Computer Science and Statistics, Trinity College Dublin, Dublin, Ireland. e-mail: villa.wang.zhengwei@gmail.com Qi She is with Intel Labs, Beijing, China. e-mail: qi.she@intel.com Tom´as E. Ward is with Insight Centre for Data Analytics, Dublin City University, Dublin, Ireland. e-mail: tomas.ward@dcu.ie
  • 本文不做详细解读,具体内容可参考原文。

1 概要

  • 过去几年,生成对抗网络(GAN)得到了广泛的研究;其最重要而明显的影响是在计算机视觉领域,如合理自然的图像生成,图像到图像的转换,人脸属性编辑等等。
  • 将GAN应用于实际问题,仍存在挑战,在此本文重点关注其中三个:(1)高质量的图像生成;(2)图像生成的多样性;(3)稳定的训练。
  • 本文对GAN相关研究的进展进行了详细回顾,讨论其在计算机视觉中引人注目的应用,并提出一些有关未来研究方向的建议。

2 典型网络结构

  • Fully-connected GAN (FCGAN)
  • Semi-supervised GAN (SGAN)

SGAN是在半监督学习的背景下提出的,与监督学习(其中每个样本都需要一个标签)和非监督学习(其中不提供标签)不同,半监督学习具有一小部分示例的标签。与FCGAN相比,SGAN的鉴别器是multi-headed的,即具有softmax和Sigmoid,以对真实数据进行分类并分别区分真实和生成样本。作者在MNIST数据集上训练SGAN,结果表明与原始GAN相比,SGAN中的鉴别器和生成器均得到了改进。

  • Bidirectional GAN (BiGAN)
  • Conditional GAN (CGAN)
  • InfoGAN
  • Auxiliary Classifier GAN (AC-GAN)
  • Laplacian Pyramid of Adversarial Networks (LAPGAN)
  • Deep Convolutional GAN (DCGAN)
  • Boundary Equilibrium GAN (BEGAN)
  • Progressive GAN (PROGAN)
  • Self-attention GAN (SAGAN)
  • BigGAN
  • Label-noise Robust GANs (rGANs)
  • Your Local GAN (YLG)
  • AutoGAN
  • MSG-GAN
  • 总结

3 代表性损失函数

  • Wasserstein GAN (WGAN)
  • WGAN-GP
  • Least Square GAN (LSGAN)
  • f-GAN
  • Unrolled GAN (UGAN)
  • Loss Sensitive GAN (LS-GAN)
  • Mode Regularized GAN (MRGAN)
  • Geometric GAN
  • Relativistic GAN (RGAN)
  • Spectral normalization GAN (SN-GAN)
  • RealnessGAN
  • Sphere GAN
  • Self-supervised GAN (SS-GAN)
  • 总结

4 常见应用

  • 数据增强
  • 图像合成
  • 视频生成
  • 特征生成

5 评估指标

6 未来&总结

GAN主要还是在图像视觉上有较大进展,NLP等领域相对滞后;一些其他数据模态例如时空序列等也相对探索较少;GAN的不良使用可能会对社会产生消极影响,例如在deepfake、伪造等方面进行恶意应用。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与AI生成创作 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1 概要
  • 2 典型网络结构
  • 3 代表性损失函数
  • 4 常见应用
  • 5 评估指标
  • 6 未来&总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档