9月21日,OpenAI正式推出AI绘画DALL-E系列最新版本——DALL-E3,集成了最新的ChatGPT,能够大幅度提升Prompt的准确度,方面用户更轻松地将自己的想法,转化为AI绘画图像!
21日凌晨,OpenAI官宣推出DALL E3图像生成模型,早在今年上半年,在ChatGPT爆火之后,就有消息传出OpenAI准备推出DALL E的新版本。
DALL-E最早于21年初发布,利用120亿参数版本的GPT-3 Transformer模型,来理解自然语言输入,由于其名字,以及大规模的参数,也就有了“大力”的外号。
实际上,OpenAI团队是为了纪念08年的动画电影《机器人总动员》(WALL-E瓦力),以及20世纪西班牙加泰罗尼亚画家萨尔瓦多·达利(Salvador Dalí)!这一次的DALL-E3在集成了ChatGPT后,堪称“大力出奇迹”,再次迎来巨大的飞跃!
与之前的版本相比,DALL-E 3在图像生成能力和理解语言指令能力等方面,有很大的提升,这主要源于最新的GPT语言模型基础,OpenAI在本地进行构建,拥有比其他AI绘画模型更强的优势!
根据目前流出的消息,研发出阿尔法狗的Deepmind的Gemini,可能比ChatGPT更加强大,Midjourney和Stable Diffusion也在不久前推出了最新的升级,于是OpenAI希望通过DALL-E 3来与谷歌等进行对抗!
实际上DALL-E 3的推理能力远远强于市面上其他竞争模型,像MidJourney极度依赖大量的Prompt提示词,而DALL-E 3无需详细的Prompt,就能准确进行AI绘画。
无论是图片的清晰度,还是对细节的还原方面,DALL-E 3都比前代DALL-E 2强很多,集成ChatGPT后,使得用户在描述任务时更加轻松,同时ChatGPT还可以帮助用户拓展和优化原始想法,生成更丰满的prompt描述画面细节。
DALL·E 2(左)和DALL·E 3(右)
在实际操作中,DALL-E 3可以进行连续性的多张图片生成,效果就像一个完整的小视频或故事,ChatGPT与DALL-E 3的深度链接,实现了语言与图像无缝转换,这也是OpenAI更加长远的目标,即将文本生成和图像生成融合起来。
总体来看,DALL-E 3基本可以说达到了人与机直接对话,生成多媒体内容的初步阶段,开创了AIGC创作新纪元的大门!OpenAI计划在10跃迁优先面向ChatGPT Plus和企业版用户,开放DALL-E 3,随后再向实验室推出API服务。
领取专属 10元无门槛券
私享最新 技术干货