机器之心报道
编辑:陈萍
和 DALL-E 3 等图像生成模型相比,谁的效果会更好呢?
你真的会被 Midjourney V6 alpha 版本测试的生成效果震撼到。
输入提示:「电影镜头,一个 50 岁留着灰胡子、穿着棕色夹克、戴着红色围巾的黑人男子站在一个 20 岁左右的白人女子旁边,她穿着深蓝和乳白色千鸟格外套,戴着黑色针织帽。午夜,他们走在街道中央,被路灯柔和的橙色光芒照亮。」
图源:https://twitter.com/nickfloats/status/1737957980736258280
相比于新版本,v 5.2 的生成效果肉眼可见的差距,人物脸部细节刻画的不是很细致,衣服纹理、褶皱表现的很少:
Midjourney V6 生成雨中的马斯克:
图源:https://twitter.com/jack24dd30/status/1737851676168683796
大笑的马斯克:
图源:https://twitter.com/dogeofficialceo/status/1737945243495108775
和你对视的女孩:
Midjourney V6 生成的美食,看起来和真的没什么两样,就连薯条有点焦糊的边边都很逼真:
图源:https://twitter.com/Pinsky/status/1737860310310981765
好莱坞影片级别的汽车追逐场景,尘土飞扬、光影效果非常逼真(不过汽车前轮看起来有点缺陷):
图源:https://twitter.com/HBCoop_/status/1738004701235528180
复古的未来主义字母呈现:
图源:https://twitter.com/AIandDesign/status/1737930031970812325
雨后的街道:
图源:https://twitter.com/Malzahran2/status/1737833533132128382
生成的狗狗的每一根毛发都真实再现:
图源:https://twitter.com/EZE3D/status/1737957038016123333
一脸无辜的看着你的小猫咪:
图源:https://twitter.com/dnaijatechguy/status/1737613040479297771
疯狂动物城的朱迪?
猫头鹰穿衣服:
图源:https://twitter.com/ciguleva/status/1737573077633085584
两只在绳子上的小蜗牛:
图源:https://twitter.com/OneMeatball/status/1738023630402154535
很多人都被 Midjourney V6 的生成效果震撼到了。
新版本允许输入更长的提示,生成更丰富的细节,甚至可以向照片添加文本。与先前版本一样,新版可通过 Discord 获得。用户需要在 Midjourney Discord 服务器或 Midjourney bot 中键入「/settings」,然后使用顶部的下拉菜单选择 V6。用户也可以使用传统的方法,在提示之后手动输入「-v 6」。
「这个模型可以生成比我们之前发布的任何模型都更加真实的图像,」Midjourney 创始人 David Holz 在 Midjourney Discord 服务器上发布的一条消息中写道,该服务器拥有超过 1700 万会员。Holz 表示,V6 实际上是「在我们的人工智能超级集群上从头开始训练的第三个模型」,花了九个月的时间开发。
设计师 Tatiana Tsiguleva 表示,Midjourney v6 对提示的理解将更加精准,这也意味着不再需要那些奇怪的短语或单词。比如,你想要生成的结果更加真实,你可以以「—style raw」结束提示,而不是输入一些描述性的单词。
不过,目前 V6 缺少 V5.2 上的一些功能,包括左右平移和缩小,但 Holz 表示这些功能将在 V6 的后续更新中提供。
参考链接:https://venturebeat.com/ai/midjourney-v6-is-here-with-in-image-text-and-completely-overhauled-prompting/
领取专属 10元无门槛券
私享最新 技术干货