DALL-E 掀起了图像合成发展的狂潮,但直到现在都只是受邀测试。
上图:使用OpenAI的DALL-E图像生成器创建的艺术品。
如果你一直渴望尝试 OpenAI 的图像合成工具,但因为缺少邀请而受阻,现在你的机会来了。今天,OpenAI 宣布取消了其 DALL-E AI 图像生成器服务的等待名单。这意味着任何人都可以注册并使用它。
DALL-E 是一种深度学习图像合成模型,它经过了从互联网上提取的数亿张图像的训练。它使用一种叫做“潜扩散”的技术来学习单词和图像之间的联系。因此,DALL-E 用户可以输入一个文本描述(称为提示符),然后,就可以以几乎任何艺术风格直观地呈现为1024×1024像素的图像。
除了图像到文本的生成,DALL-E 还包括一个名为“Outpainting”的功能,它允许您上传图像并使用图像合成扩展其边界。还可以通过在它们之间生成视觉桥梁,以混搭风格来将多张照片合并为一张照片。
上图:“宇航员骑马”的 DALL-E 生成示例。
OpenAI 在2021年1月宣布了一个早期版本的DALL-E,其功能令人惊讶,但有明显的局限性。今年4月,DALE-2 首次亮相,它能够生成接近照片级的图像,并模仿艺术家的风格,这让200名研究人员的有限测试观众惊叹不已。根据 OpenAI 的数据,在逐步向更多用户开放并在7月份建立定价模式后,全球超过150万用户现在正在使用 Dall-E(从Dall-E 2更名)每天创建超过200万张图像。
DALL-E 是一种商业服务,它有一些显著的限制。新用户可以获得50个免费积分,你可以以15美元的价格购买115个积分。使用 DALL-E 生成的图像归 OpenAI 所有,但只要用户遵守内容策略,该公司就授予用户“复制和显示”其后代的专有权。违反内容将取消你合法使用生成图像的权利。
之前,媒体也已经广泛报道过“Stable Diffusion”,这也是一个开源的图像模型(和竞争对手),类似于 Stability AI 创建的 DALL-E。在过去的一个月里,稳定扩散通过开源渠道和自己的商业网站几乎没有限制。现在,DALL-E对所有人开放,图像合成模型之间的竞争可能会加剧。
如果朋友们喜欢,敬请关注“知新了了”!
领取专属 10元无门槛券
私享最新 技术干货