Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >100万人排队在等!DALL·E公开测试版,还收上费了

100万人排队在等!DALL·E公开测试版,还收上费了

作者头像
新智元
发布于 2022-07-21 11:14:20
发布于 2022-07-21 11:14:20
5120
举报
文章被收录于专栏:新智元新智元


新智元报道  

编辑:拉燕 桃子

【新智元导读】现在,OpenAI宣布将正式推出DALL-E测试版,直接向用户收费了。|还在纠结会不会错过元宇宙和web3浪潮?清华大学科学史系副教授胡翌霖,这次给你讲个透!

今天,OpenAI正式宣布DALL-E准备向100万个用户开放测试版。

问题还不是免费的。

第一个月,用户有50个免费积分,以后每个月有15个免费积分。

一个积分可以提交一个文本描述,仅能生成4张图片。

如果不够的话,15美元兑换115个积分,相当15美元(约100元)能生成460张图片。

具体看下图:

有趣的是,用户还能获得自己生成图像的使用权,包括商业用途。

也就是说,你可以把生成的图像印在T恤或者儿童读物上,拿出去卖钱。

但是,目前OpenAI仍不允许DALL-E上传真实面孔图片,以及试图制作公众人物(包括名人和著名政治人物)的肖像。

为此,OpenAI今天还给DALL-E 2新开了一个推特账号。

我不允许还有人没听说过DALL·E。

毕竟,现在都出到2代——DALL·E 2了。

这是一款由OpenAI开发的转化器模型,全部的功能就是把「话」变成「画」。

具体来说,DALL·E是一个有120亿参数版本的GPT-3,被训练成了使用文本生成图像的模型。背后的数据集是文本-图像的对应集。

DALL·E神通广大,什么样的画都做得出来。不论是拟人的物体还是动物,只要你敢想,DALL·E就敢做。它会用合理的方式整合不相关的概念,创造出合理的图像。

看看上面这几张图,有戴帽子的狗,做实验的熊猫,还有长得像星云的狗狗(bushi)。有没有觉得,哪怕不合常理,但是并不违和?这就是DALL·E能做到的。

说起DALL-E的源头,其实是研究人员从GPT-3那里得到了启发。GPT-3是个用语言生成语言的工具,而图像GPT则可以用来生成高保真度的图片。

接着,研究人员就把这个结论拓展了一下。他们发现,用文本来操控视觉,是可以做到的。

也就是这样,DALL·E成为了一个和GPT-3一样的转化器。

DALL·E将图像和文本作为单一的数据流接受,其中有多达1280个标记,然后进行训练。随后,一个接一个的生成所有标记。

这种训练程序使DALL·E不仅能从头开始生成图像,而且还能延展原图(也就是在原图的基础上继续生成),且和文本内容是一致的。

研究人员发现,DALL·E经过上述的训练,能为各种语言组成的各种句子创造对应的合理的图像。

上面的六宫格只是浅浅展示一下,这种效果的图片其实多的是。

而且有一点需要提醒朋友们注意,研究人员没有介入人工,剔出某些图片。这意味着什么,不用多说了吧。GPT-3生成的东西还有乱八七糟,得人工删掉呢。

在此基础上,研究人员又开始琢磨同时用文本描述多个物体,生成一张图。这些物体各自的特征、之间的空间位置关系全都交给文字来描述。

无疑,这是一项全新的挑战。

比方说,输入文本:一只戴着红帽子、黄手套,穿着蓝衬衫和绿裤子的刺猬。

为了正确生成对应的图片,DALL·E不仅要正确理解不同衣服和刺猬之间的关系,还不能混淆不同衣服和颜色的对应关系。

这种任务被称作变量绑定,在文献中有大量的相关研究。

可以说,DALL·E从1代到2代,就是这么一个个小任务走过来的。最终能够呈现的就是一个不错的文本-图像转化器。

也正因如此,DALL·E推出测试版也属实让网友激动了一阵。

可看看网友评论,好像有不少产品之外的问题啊。

网友怎么说

这也太贵了,创建一张好的图像需要多次试错。产品很不错,但是收费太让人扫兴。

有网友担心起了版权问题。

还有网友直接表示,我在5月17号就排上了,到目前还没用上。

对此,你怎么看?

参考资料:

https://openai.com/blog/dall-e-now-available-in-beta/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-07-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
多模态图像版「GPT-3」来了!OpenAI推出DALL-E模型,一句话即可生成对应图像
最近,OpenAI官宣了一个基于Transformer的语言模型--DALL-E,使用了GPT-3的120亿参数版本。取名DALL-E,是为了向艺术家萨尔瓦多-达利(Salvador Dali )和皮克斯的机器人WALL-E致敬。
新智元
2021/01/11
1.4K0
多模态图像版「GPT-3」来了!OpenAI推出DALL-E模型,一句话即可生成对应图像
亲戚逼相亲?美国小哥生成了一个AI女友躲避催婚
Dinda是YouTube的一名照片编辑,本着近水楼台先得月的原则,他每天就是和图片生成软件打交道。
新智元
2023/01/06
5420
亲戚逼相亲?美国小哥生成了一个AI女友躲避催婚
OpenAI 对 DALL-E 新增 100 万访问权限,你会申请吗?
今天,OpenAI 正式宣布 DALL-E 准备向 100 万个用户开放测试版。但却不是免费的。第一个月,用户有50个免费积分,以后每个月有15个免费积分。一个积分可以提交一个文本描述,仅能生成4张图片。
AI科技大本营
2022/12/09
9600
OpenAI 对 DALL-E 新增 100 万访问权限,你会申请吗?
带标签图像数据无限生成!GPT-3+DALL-E 2联合,或彻底解决CV界的「粮食危机」
---- 新智元报道   编辑:LRS 【新智元导读】没有优质数据,再强大的模型也无法发挥作用。最近有研究人员发现,GPT-3+DALL-E 2模型如果结合在一起,就能自动生成海量的带标签数据,可以用来扩增和平衡数据集、抵御对抗攻击等。 巧妇难为无米之炊,没有数据何以训模型? 根据2022年Datagen对300个计算机视觉研发团队的调研结果,99%的CV团队因为训练数据不足而取消了该机器学习项目。 与此同时,收集数据带来的模型训练延迟也无处不在,100%的团队报告说由于训练数据不足而导致过严重的项目
新智元
2022/04/22
7800
带标签图像数据无限生成!GPT-3+DALL-E 2联合,或彻底解决CV界的「粮食危机」
OpenAI引入了DALL·E:一种通过文本描述创建图像的神经网络
OpenAI最近训练了一个名为DALL·E的神经网络,该神经网络通过文本描述为自然语言可表达的各种概念创建图像。
代码医生工作室
2021/01/14
1.1K0
OpenAI引入了DALL·E:一种通过文本描述创建图像的神经网络
哈佛大学砸场子:DALL-E 2只是「粘合怪」,生成正确率只有22%
---- 新智元报道   编辑:LRS 【新智元导读】DALL-E 2生成的图像确实令人惊叹,但它也有弊端,哈佛大学最新研究表明,文本提示内的关系它根本都不懂,生成图像的正确率仅有22%! DALL-E 2刚发布的时候,生成的画作几乎能完美复现输入的文本,高清的分辨率、强大的绘图脑洞也是让各路网友直呼「太炫酷」。 但最近哈佛大学的一份新研究论文表明,尽管DALL-E 2生成的图像很精致,但它可能只是把文本中的几个实体粘合在一起,甚至都没有理解文本中表述的空间关系! 论文链接:https://arx
新智元
2022/08/26
2590
哈佛大学砸场子:DALL-E 2只是「粘合怪」,生成正确率只有22%
多模态新王登基!OpenAI发布DALL·E 2,生成图像「指哪打哪」
---- 新智元报道   编辑:LRS 【新智元导读】大艺术家重磅升级!最近OpenAI发布升级版DALL·E 2,不仅分辨率提升了4倍,准确率更高,业务也更广了:除了生成图像,还能二次创作! 2021年1月,OpenAI放了一个大招:DALL-E模型,让自然语言和图像成功牵手,输入一段不管多离谱的文本,都能生成图片! 比如经典的「牛油果形状的扶手椅」,还有新奇生物「一个长颈鹿乌龟」。 当时看着已经够神奇了吧? 时隔一年,OpenAI结合另一个多模态模型CLIP,发布了第二个版本DALL·E 2!
新智元
2022/04/11
5240
多模态新王登基!OpenAI发布DALL·E 2,生成图像「指哪打哪」
OpenAI祭出120亿参数魔法模型!从文本合成图像栩栩如生,仿佛拥有人类的语言想象力
前几个月GPT-3刚刚问世的时候,能够根据一段话就写出一个小说、一段哲学语录,就足以令AI圈为之感到兴奋。
AI科技评论
2021/01/08
9450
OpenAI祭出120亿参数魔法模型!从文本合成图像栩栩如生,仿佛拥有人类的语言想象力
岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想
---- 新智元报道   编辑:David 【新智元导读】特斯拉前AI总监点赞!这个开源AI艺术创作模型,想要开启「人机合作」艺术创作新时代。 近日,由Emad Mostaque创立和资助的Stability.ai公司宣布公开发布AI创造的艺术作品。 你可能认为这只是AI在艺术领域的另一次尝试,但实际上远不止如此。 有两个原因。 首先,与DALL-E 2不同的是,Stable Diffusion是开源的。这意味着任何人都可以利用它的骨干,免费建立针对特定文本到图像创作任务的应用程序。 另外,Midj
新智元
2022/09/13
5350
岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想
AI可以绘制情感吗?看DALL-E如何表抽象
---- 新智元报道   编辑:桃子 【新智元导读】DALL-E能绘制出怎样的抽象情感? 要说2022年人工智能领域发展有怎样的趋势? 一定要提到「多模态AI」的崛起,尤其是文本到图像生成工具。 从DALL-E到Imagen、Parti、女娲等,都可以生成高质量的图像,让人惊艳。 这当中最典型的例子便是OpenAI的Dall-E2了。 自Dall-E面世后,或许你见过它生成很多绘画风格的图片,比如宇航员在太空骑马。 然而,很少有通过Dall-E表现抽象概念的图片。 这不,一名机器学习科学家Gabr
新智元
2022/08/26
4720
AI可以绘制情感吗?看DALL-E如何表抽象
OpenAI DALL·E 3来了,集成ChatGPT,生图效果太炸了
终于,OpenAI 的文生图 AI 工具 DALL-E 系列迎来了最新版本 DALL・E 3,而上个版本 DALL・E 2 还是在去年 4 月推出的。
机器之心
2023/09/21
9900
OpenAI DALL·E 3来了,集成ChatGPT,生图效果太炸了
OpenAI的新模型DALL·E:可以从文字说明生成图像
DALL-E是OpenAI基于GPT-3开发的一种新型神经网络。它是GPT-3的一个小版本,使用了120亿个参数,而不是1750亿个参数。但它已经经过专门训练,可以从文本描述生成图像,使用的是文本-图像对的数据集,而不是像GPT-3这样非常广泛的数据集。它可以使用自然语言从文字说明中创建图像,就像GPT-3创建网站和故事一样。
deephub
2021/01/12
1.5K0
OpenAI的新模型DALL·E:可以从文字说明生成图像
打破GANs“垄断”|OpenAI新研究:Diffusion Models 图文转换效果超越DALL-E
以前,当我们想拥有一副图像时,首先会做的就是找专业画师,将我们对图画的要求逐一描述,画师再根据需求醉墨淋漓一番。但这种方式需要耗费一定的时间和人力成本,且成果不一定尽如人意。
AI算法与图像处理
2021/12/27
1.4K0
打破GANs“垄断”|OpenAI新研究:Diffusion Models 图文转换效果超越DALL-E
从OpenAI发布DALL-E说起,5年来图像生成领域都有哪些大事
这家由微软支持的研究机构现在由Y Combinator创始人Sam Altman领导。它最著名的是强大的文本生成器GPT-3,但在过去的几年里,它还建立了一个教自己解魔方的机械手,一个像超人一样的电子竞技算法团队,一个能创作出令人感到舒适的音乐算法,以及能玩游戏和使用工具学习复杂策略的算法。
大数据文摘
2021/01/25
4580
自带魔法棒的 DALL·E | 一文图解热词
目前的模型对于选词比较敏感,官方释出的例子是类似完形填空的形式,给句子中的名词位置挖了空,并提供了候选的词汇。
mixlab
2021/01/12
7190
自带魔法棒的 DALL·E | 一文图解热词
OpenAI 发布 DALL·E 进化版,这只蒸汽朋克时代的小熊有点酷!
整理 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 2021年1月6日 OpenAI 发布了新模型 DALL·E ,AI 根据一段话就可直接生成图像。一年后进化 2.0 版本的“它”来了 —— DALL·E 2。 DALL·E 2 在生成用户描述的图像时具有更高的分辨率和更低的延迟。新版本还增添了一些新的功能,比如对原始图像进行编辑。 与之前的OpenAI工作一样,新工具没有直接向公众发布。但研究人员可以在线注册预览该系统,OpenAI希望以后能将其用于第三方应用。 试玩 Waitli
用户1737318
2022/04/12
1.2K0
OpenAI 发布 DALL·E 进化版,这只蒸汽朋克时代的小熊有点酷!
一文读懂 OpenAI
OpenAI 是一家美国人工智能(AI)研究实验室,由非营利性 OpenAI Incorporated(OpenAI Inc.)及其营利性子公司 OpenAI Limited Partnership(OpenAI LP)组成。OpenAI 进行 AI 研究的目的是促进和开发友好的 AI。OpenAI 系统运行在世界上第五强大的超级计算机上。该组织于 2015 年由 Sam Altman、Reid Hoffman 在旧金山成立,杰西卡·利文斯顿(Jessica Livingston)、埃隆·马斯克(Elon Musk)、伊利亚·萨茨克维尔(Ilya Sutskever)、彼得·泰尔(Peter Thiel)等人共同认捐了 10 亿美元。马斯克于 2018 年辞去董事会职务,但仍是捐助者。微软在 2019 年向 OpenAI LP 提供了 10 亿美元的投资,并于 2023 年 1 月向其提供了第二笔多年期投资,据报道为 100 亿美元。
李维亮
2023/05/16
1.2K0
OpenAI的DALL·E迎来升级,不止文本生成图像,还可二次创作
机器之心报道 机器之心编辑部 在令人叹为观止方面,OpenAI 从不令人失望。 去年 1 月 6 日,OpenAI 发布了新模型 DALL·E,不用跨界也能从文本生成图像,打破了自然语言与视觉次元壁,引起了 AI 圈的一阵欢呼。 时隔一年多后,DALL·E 迎来了升级版本——DALL·E 2。 与 DALL·E 相比,DALL·E 2 在生成用户描述的图像时具有更高的分辨率和更低的延迟。并且,新版本还增添了一些新的功能,比如对原始图像进行编辑。 不过,OpenAI 没有直接向公众开放 DALL·E 2。
机器之心
2022/04/08
1K0
OpenAI的DALL·E迎来升级,不止文本生成图像,还可二次创作
AI写小说、绘画、剪视频,生成式AI更火了!
近日,生成式AI又火了!一个叫做「盗梦师」的微信小程序,上线一鸣惊人,达成了日增5万新用户的纪录。
科技云报道
2022/12/08
1.7K0
AI写小说、绘画、剪视频,生成式AI更火了!
剖析 AIGC 关键模型 —— DALL-E
该模型说白了就是可以根据用户提供的文本描述自动生成对应的图像,由 OPEN-AI 发布;
掘金安东尼
2023/05/23
6000
剖析 AIGC 关键模型 —— DALL-E
推荐阅读
多模态图像版「GPT-3」来了!OpenAI推出DALL-E模型,一句话即可生成对应图像
1.4K0
亲戚逼相亲?美国小哥生成了一个AI女友躲避催婚
5420
OpenAI 对 DALL-E 新增 100 万访问权限,你会申请吗?
9600
带标签图像数据无限生成!GPT-3+DALL-E 2联合,或彻底解决CV界的「粮食危机」
7800
OpenAI引入了DALL·E:一种通过文本描述创建图像的神经网络
1.1K0
哈佛大学砸场子:DALL-E 2只是「粘合怪」,生成正确率只有22%
2590
多模态新王登基!OpenAI发布DALL·E 2,生成图像「指哪打哪」
5240
OpenAI祭出120亿参数魔法模型!从文本合成图像栩栩如生,仿佛拥有人类的语言想象力
9450
岂止DALL·E!现在AI画家都会建模、做视频了,以后会什么简直不敢想
5350
AI可以绘制情感吗?看DALL-E如何表抽象
4720
OpenAI DALL·E 3来了,集成ChatGPT,生图效果太炸了
9900
OpenAI的新模型DALL·E:可以从文字说明生成图像
1.5K0
打破GANs“垄断”|OpenAI新研究:Diffusion Models 图文转换效果超越DALL-E
1.4K0
从OpenAI发布DALL-E说起,5年来图像生成领域都有哪些大事
4580
自带魔法棒的 DALL·E | 一文图解热词
7190
OpenAI 发布 DALL·E 进化版,这只蒸汽朋克时代的小熊有点酷!
1.2K0
一文读懂 OpenAI
1.2K0
OpenAI的DALL·E迎来升级,不止文本生成图像,还可二次创作
1K0
AI写小说、绘画、剪视频,生成式AI更火了!
1.7K0
剖析 AIGC 关键模型 —— DALL-E
6000
相关推荐
多模态图像版「GPT-3」来了!OpenAI推出DALL-E模型,一句话即可生成对应图像
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档