Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nvidia「艺术家神器」GauGAN发布第二代!训练超1000万张图片,两个词就能生成风景画

Nvidia「艺术家神器」GauGAN发布第二代!训练超1000万张图片,两个词就能生成风景画

作者头像
磐创AI
发布于 2021-12-01 09:12:20
发布于 2021-12-01 09:12:20
1.5K0
举报

磐创AI分享 来源 | 新智元 编辑 | LRS 【导读】英伟达的艺术家神器GauGAN最近发布了第二代,生成风景画的能力进一步提升,原来还需要自己指定一些材料合成图像,现在只需要一句话即可生成你想要的风景画,甚至季节等常识他也懂!

最近,英伟达发布了实时绘画工具GauGAN的第二代,主要特性是支持输入文本来生成图像。

在新版本中,GauGAN2集成了segmentation mapping, inpainting和text-to-image生成技术,用户可以生成一些在现实生活中并不存在的风景。

GauGAN2的目标是创造一种混合文字和图像的一种摄像技术!

与专门用于文本到图像或图像到图像分割应用的最新模型相比,GauGAN2背后的神经网络模型能够产生了更加多样、质量更高的图像。

用户不必绘制想象场景中的每一个元素,只需要输入一个简短的短语就能够快速生成图像的关键特征和主题,例如输入雪山,就能够生成一个雪山的草图。然后以这个草图为起点,进行下一步的图像修改,例如把山变高,加几棵树,换一个天空等等,可以说是十分方便了!

GauGAN这个名字的灵感来自于印象派画家保罗·高更(Paul Gaugin),他死后作品才开始名声大噪。他是印象派的代表人物,除去绘画之外,在雕塑、陶艺、版画和写作上也有一定的成就。他对色彩的使用导致了综合主义的产生,加上分隔主义的影响,也为原始主义的产生铺平了道路。

从2019年开始,Nvidia就给GauGAN系统喂了超过100万张公共Flickr图片进行模型训练。

2019年3月,在加州圣何塞举行的GPU技术大会(GTC)上,Nvidia揭开了GauGAN的面纱,这是一种生成对抗性AI系统,可以让用户创建实际并不存在的逼真风景图像。GauGAN测试版在Playground平台上发布后的第一个月,就已经生成了50万张图片,包括电影、视频游戏等概念艺术领域均有应用。

Nvidia表示,GauGAN已经被一家医疗保健组织用于探索性治疗工具使用,动画建模师Colie Wertz也在使用GauGAN,他的作品包括《星球大战》、《变形金刚》和《复仇者联盟》等。

GauGAN的首次公开使用是在GANPaint Studio中,这是一个公开的人工智能工具,可让用户上传任何照片并编辑所描绘的建筑物,植物群和固定装置的外观。在其他地方,生成机器学习模型已被用于通过观看YouTube剪辑,从自然语言标题创建图像和故事板,以及使用包含人类语音的音频剪辑来动画和同步面部运动来生成逼真的视频。

与GauGAN的第一代一样,GauGAN2知道雪、树、水、花、灌木、山和山等物体之间的关系,例如降水类型随季节变化这种常识在图像生成中也能够保持。

GauGAN和GauGAN2同样还是基于对抗生成网络(GAN),模型中包含一个生成器和判别器。生成器用来接收输入样本(一个文本和一个图像)然后预测出这个文本描述是否和风景图像内容能对应上。

生成器的训练过程是通过试图欺骗判别器,使其无法分辨生成图片和现实场景的图片。虽然GAN在初期生成的质量很差,一眼假,但它的生成器会随着判别器的反馈而不断变强。

在第一代基础上,GauGAN2接收了超过1000万张图片的训练,已经能够很好地将自然语言转换为风景图像。

例如输入「海滩上的日落」就会产生一对应的风景图,在这基础上添加诸「落基山海滩上的日落」或将「日落」替换为「下午」或「雨天」等形容词也会立即生成修改后的图片。

使用GauGAN2,用户可以生成一个分割图(segmentation map),能够显示场景中物体位置。用户可以将生成的图像切换到绘图模式,用天空、树、岩石和河流等标签将场景绘制成粗糙的草图,并能够使用画笔将涂鸦嵌入图像中。

GauGAN2和OpenAI的DALL-E差不多,DALL-E也是根据文本提示来生成图像。这类系统本质上是视觉创意的创造器,在电影、软件、视频游戏、产品、时尚和室内设计方面有潜在的应用场景。

Nvidia声称,GauGAN的第一个版本已经被用来创造电影和视频游戏的概念艺术。并且与第一版相同,Nvidia计划在GitHub上开源GauGAN2 的代码,并在Playground上进行交互式演示,Playground是Nvidia AI和深入学习研究的网络中心。

但,像GauGAN2这样的生成模型的一个缺点是可能存在模型偏见。

在Dall-E的生成样例中,OpenAI使用了一个特殊的模型CLIP来提高图像质量,用到的方法是在DALL-E生成的每条样本中把顶层样本给覆盖掉,换成其他的提示图。

但是一项研究发现,CLIP错误分类的黑人个人照片的比例更高,并且它会认为从事诸如保姆、和家政工人等职业是和妇女相关的。

在相关新闻材料中,Nvidia并没有说明他们的研发团队如何审核GauGAN2中的社会偏见。

但Nvidia发言人在邮件中说过,该模型有超过1亿参数,并使用风景数据集中训练了一个月。这个专用的模型完全专注于风景景观,研究人员审计以确保在训练图像中没有人物的出现。目前来说,GauGAN2只是一个研究演示。

另一个GauGAN的应用是Nvidia Canvas,能够让创作者通过材料而不是颜色来绘画。这个程序能够实时现实绘画结果,而不需要等待完整的绘画。

用户首先用现实世界的材料,如草地或云彩,画出简单的形状和线条。人工智能模型然后立即填充屏幕显示停止的结果。四个快速的形状和一个惊人的山脉出现。再多几条线就会形成一片美丽的田野。

NVIDIA canvas也提供了多种材料可供使用。NVIDIA画布有九种风格,修改的外观和感觉的绘画和15种不同的材料,从天空和山脉,河流和石头。在不同的图层上绘制,使元素保持分离。从头开始,或启动和修改应用程序的预制场景之一,以获得更完美的灵感提示。

在池塘里画画,附近的元素如树木和岩石就会出现在水中的倒影。换一种材料,把雪变成草,整个形象就从一个冬天的仙境变成了一个热带的天堂。

该工具允许艺术家使用样式过滤器,改变生成的图像,以采用特定的画家的风格。不仅仅是把其他图片拼接起来,或者剪切和粘贴纹理,而是创造全新的图像,就像艺术家一样。

有了英伟达的GauGAN,人人都能成为艺术家了!

参考资料:

https://venturebeat.com/2021/11/22/nvidias-latest-ai-tech-translates-text-into-landscape-images/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-11-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 磐创AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
艺术家批发!随手涂鸦秒变逼真风景,Nvidia Canvas「只」要求一张RTX显卡
英伟达最近发布了一个应用程序Nvidia Canvas,目前处于免费公开测试版,包含了基于 NVIDIA RTX 图形处理器的实时绘画工具 GauGAN 。
新智元
2021/07/06
1.1K0
太赞了!英伟达又一突破,输入关键词就可以生成直逼摄影师的大片
近日,英伟达官方推出 GauGAN2 的人工智能系统,它是其 GauGAN 模型的继承者,它不仅能根据字词生成逼真的风景图像,还能实时用文字P图!
AI科技大本营
2021/11/25
5140
太赞了!英伟达又一突破,输入关键词就可以生成直逼摄影师的大片
给几个关键词就能出摄影大片,英伟达GauGAN上新2.0:将文本转成逼真图像
机器之心报道 编辑:小舟、陈萍 这么美的照片竟然不是出自摄影师之手?! 在 2019 年举办的 GTC 大会上,英伟达展示了一款新的交互应用 GauGAN:利用生成对抗网络(GAN)将分割图转换为栩栩如生的图像。 时隔 2 年,英伟达官方推出了 GauGAN 的继任者 GauGAN2,允许用户创建不存在的逼真风景图像。GauGAN2 将分割映射、修复和文本到图像生成等技术结合在一个工具中,旨在输入文字和简单的绘图就能创建逼真的图像。 ‍ 英伟达表示:「与类似的图像生成模型相比,GauGAN2 的神经网络
机器之心
2023/03/29
4240
给几个关键词就能出摄影大片,英伟达GauGAN上新2.0:将文本转成逼真图像
英伟达GauGAN2 AI:用户输入文本字符,AI就会实时生成图景
英伟达的GauGAN2 AI现在可以使用简单的书写短语来生成相应的逼真图像。该深度学习模型仅用三四个单词就能够生成不同的场景。 GauGAN是英伟达开发的AI软件,用于在2019年将简单的涂鸦变成逼真的杰作,这项技术最终在今年早些时候变成了英伟达Canvas应用程序。现在英伟达进一步完善了这项AI技术,只需要简短的描述就可以生成“照片”。 英伟达表示,GauGAH背后的深度学习模型让任何人都可以生成漂亮的场景,而且现在比以往任何时候更容易实现。用户只需要输入“海滩日落”之类的短语,该AI就会在添加每个单词
云头条
2022/03/18
6830
英伟达又一次突破想象力!一句话实时P图在线Demo可玩,「神笔马良」升级「创世纪」
他们最新的AI模型GauGAN2,不仅能根据字词生成逼真风景照,还能实时用文字P图!
量子位
2021/12/02
7010
英伟达又一次突破想象力!一句话实时P图在线Demo可玩,「神笔马良」升级「创世纪」
英伟达“AI神笔马良”GauGAN开放测试了!无需注册人人可玩
在今年3月的GTC 2019上,英伟达推出了一个令人惊叹的图像生成器。它使用生成对抗性网络(GAN),用户只需点击几下即可绘制出近乎真实的图像。该软件能够立即将几行草草勾勒的轮廓图,变成华丽的山顶日落图景。
新智元
2019/06/19
4.7K0
英伟达“AI神笔马良”GauGAN开放测试了!无需注册人人可玩
英伟达GauGAN上线测试一个月,生成图像超50万张!
今年3月,在加州圣何塞举行的GPU技术大会(GTC)上,Nvidia揭开了GauGAN的面纱,这是一种生成对抗性AI系统,可以让用户创建实际并不存在的逼真风景图像。GauGAN测试版在Playground平台上发布后的第一个月,就已经生成了50万张图片,包括电影、视频游戏等概念艺术领域均有应用。
新智元
2019/08/06
6900
英伟达“神笔马良”GauGAN发布Windows应用程序,可导出PSD文件
操作系统:Windows 10 GPU:GeForce RTX, NVIDIA RTX, Quadro RTX, TITAN RTX 显卡驱动:460.89或更高版本
量子位
2021/07/19
5850
AI绘画工具大对决:谁才是你的创意缪斯?(2/10)
在当今数字化时代,AI 绘画工具如雨后春笋般涌现,彻底改变了艺术创作的格局。从专业艺术家到普通爱好者,越来越多的人投身于 AI 绘画的奇妙世界。Stable Diffusion、Midjourney 与 DALL・E 等工具,它们在功能、特点和适用场景上各有千秋,满足了不同用户的多样化需求。
正在走向自律
2025/01/24
2070
AI绘画工具大对决:谁才是你的创意缪斯?(2/10)
涂鸦涂出摄影大片:英伟达「高更」GAN让简笔画秒变逼真图像
英伟达新方法在 Flickr Landscapes 数据集上的语义图像合成结果,并不是真人拍摄的哦~
机器之心
2019/04/09
1.1K0
涂鸦涂出摄影大片:英伟达「高更」GAN让简笔画秒变逼真图像
盘点那些超好用的创作AI艺术图片的工具
曾经我们都曾幻想某一天我们的大部分工作都会被人工智能取代,而这一天正在到来。但我们很难想象人工智能可以像人类一样具有创造力和艺术设计的能力。然而最新的人工智能技术已经向我们证明我们错了。
程序那些事儿
2023/03/07
1.1K0
盘点那些超好用的创作AI艺术图片的工具
AIGC 生图应用场景与实操技巧
AIGC 生图技术在众多领域都展现出了强大的实用价值,以下为大家展示其在部分领域的实际应用案例:
倔强的石头_
2025/01/02
3340
AIGC 生图应用场景与实操技巧
分享15个全球顶尖的AIGC图片生成平台
人工智能正在改变许多行业的格局,而其中改变最直观和影响最大的就是AIGC领域的图像创作。
非喵鱼
2022/12/31
33.1K0
分享15个全球顶尖的AIGC图片生成平台
创意有瓶颈吗?百度文心·一格:不存在,动动手指片刻生成艺术大作
机器之心原创 作者:杜伟 这次,百度文心跨模态大模型让你的创意「飞起来」! 在近年来的 AI 领域,随着 NLP 和 CV 的日益融合,多模态学习越来越受到学界和业界的重视,其中文本生成图像更是成为现象级研究方向。输入一段语言描述,AI 即能输出对应的图像,兼具速度与质量。 在这股以文生图风潮中,AI 底蕴深厚的国外大厂纷纷推出多模态文生图模型,比如 DALL-E 2、 GauGAN2 和 Disco Diffusion 等。这些 AI 模型生成的图像都给人留下了深刻的印象,在逼真度、趣味性、风格等方面各有
机器之心
2022/08/25
8410
创意有瓶颈吗?百度文心·一格:不存在,动动手指片刻生成艺术大作
当设计遇上AI
一、背景 最近AI创作内容火爆网络,让我们看到AI在设计上充满想象力的未来。关于AI在设计上应用的探索由来已久,从早几年的智能广告素材,智能Logo再到如今的AIGC,AI的成长突飞猛进。本文尝试梳理AI目前在设计领域应用的最新进展,展望设计行业在AI技术影响下可能发生的变革。 二、AI与设计相关的最新技术 1、自动化内容生成(AIGC) 从文本-图像、文本-视频、文本-3D模型到智能字体、智能文本,AI在各类内容的创造上已经突飞猛进,强大到让人惊叹地步。 1.1 文本-图像技术 近一两年以来,各大平台推出
腾讯ISUX
2023/04/14
9830
当设计遇上AI
英伟达GTC十周年游乐场!黄老板演示马良神笔草图变实景,发布99美元迷你AI插件
今天,英伟达2019GPU 技术大会(GTC19)在美国加利福尼亚州圣何塞举行。在这一严重拖堂、长达2小时40分钟的Keynote演讲中,英伟达创始人兼首席执行官黄仁勋火力全开,宣布了该公司在软件、机器学习平台,以及自动驾驶上的一系列新动作。
大数据文摘
2019/04/09
6770
英伟达GTC十周年游乐场!黄老板演示马良神笔草图变实景,发布99美元迷你AI插件
AI 创作离我们还远吗?
导语|近些年AI蓬勃发展,在各行各业都有着不同方式的应用。而AI创作艺术和生产内容无疑是今年以来最热门的话题,MidJourney生成的画作拿到艺术比赛第一名以及Stable Diffusion的开源,无疑将文本生成图片的热点在近期推向了高潮。那么AI创作到底发生过什么,原理又是如何,是噱头还是会有对我们有用的潜在应用场景呢?我们尝试深入浅出地来回答这些问题。 本文作者:ryanlyin,腾讯IEG数据科学 一、 AI创作怎么火了? 今年开始,文本描述自动生成图片(Text-to-Image)的AI绘画黑科
腾讯大讲堂
2022/11/03
1.4K0
AI 创作离我们还远吗?
从头训练一个神经网络!教它学会莫奈风格作画!⛵
图片本文使用 GAN(生成对抗网络)进行AI绘画。torchgan是基于PyTorch的一个GAN工具库,本文讲解搭建DCGAN神经网络,并应用于『莫奈』风格绘画的全过程。---💡 作者:韩信子@ShowMeAI📘 深度学习实战系列:https://www.showmeai.tech/tutorials/42📘 PyTorch 实战系列:https://www.showmeai.tech/tutorials/44📘 本文地址:https://www.showmeai.tech/article-detail/
ShowMeAI
2022/11/09
9430
从头训练一个神经网络!教它学会莫奈风格作画!⛵
2023年最新AIGC绘画水平发展
作者:yiqiuzheng,腾讯 IEG 前端工程师 一、现状 这两年 AI 关键词频频热搜,从 2022 年 4 月初代码自动补全神器Copilot点燃程序员圈,到 10 月中旬的 AI 绘画Stable Diffcusion 1.0震惊绘画圈,最后到如今的ChatGPT引爆全网各领域。AI 人工智能时代已然到来。在 2023 年,AI 绘画技术和应用的发展已经非常迅速。目前,AI 绘画技术已经能够生成逼真的图像、视频和音频,同时还能够模仿艺术家的风格,创造出令人惊叹的艺术作品。 但是这些早期的 AI 绘
腾讯技术工程官方号
2023/04/01
1.4K0
2023年最新AIGC绘画水平发展
谷歌发布“怪兽生成器”!你画草图,GAN帮你生成幻想生物
不知道你是否听说过这样一个游戏——《山海GO》,名字是不是有点眼熟?没错,和口袋妖怪GO类似,只不过,在这款游戏中收集的都是《山海经》中的鬼怪~ 就像这样:
大数据文摘
2020/11/24
1.3K0
推荐阅读
相关推荐
艺术家批发!随手涂鸦秒变逼真风景,Nvidia Canvas「只」要求一张RTX显卡
更多 >
LV.0
深圳魔图互联科技有限公司算法工程师
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档