前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >给张图就能反推Prompt,AI绘画神器Midjourney能够「看图说话」了

给张图就能反推Prompt,AI绘画神器Midjourney能够「看图说话」了

作者头像
机器之心
发布于 2023-04-06 10:45:22
发布于 2023-04-06 10:45:22
1.8K0
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

编辑:蛋酱

AI 反推出来的 prompt,会比人类手写的更好吗?

在各种 AIGC 产品层出不穷的今天,让 AI 画一张图已经不是什么难事。

尽管有着「无需动笔」、「零门槛作画」等一系列优点,但很多人并不能借助 AI 之手轻松获得一幅理想中的作品 —— 难点在于「prompt」。

Prompt 方法是一门极深的管理学问:如果不输入精准的命令描述,生成结果就可能十分随机,甚至与预期相去甚远。但归根结底,如何给出完美的 prompt,如何让模型按照人类用户预设的方式输出结果,甚至如何降低花在 prompt 上的成本,很少有人清楚。

正因此,AIGC 产业衍生出了一种专门的职业 ——prompt 工程师。前段时间,初创公司 Anthropic 在旧金山招聘「prompt 工程师和图书馆员」,给出的薪水高达 33.5 万美元。

或许,这一过程也能让 AI 代劳呢?AI 会做的比人类更好吗?

最近,AI 绘画神器 Midjourney 就上新了一个功能:/describe。

「今天,我们发布了一个 /describe 命令,可让您将图像转换为文字。」

具体来说,Midjourney 学会了从图像中反推 prompt。如果你在 Midjourney 上传一张图片,它会提供给四个版本的描述,你可以直接拿来并进行调整,然后去生成自己想要的图片变体。

Midjourney 是一款 2022 年 3 月发布的 AI 绘画工具,此前刚刚推出第五代版本,由于生成效果十分「炸裂,大量用户迅速涌入,以至于该公司不得不关闭了免费注册通道。

这一次功能的更新意义重大:

  • 改进可访问性:通过用于 Web 显示的 ALT 文本元素,图像描述让有视觉障碍或阅读困难的人更容易访问数字内容;
  • 增强的可搜索性:描述可以通过搜索引擎启用更好的搜索功能和索引;
  • 用于标题:可以包含描述,使图像更加清晰;
  • 详细 prompt:描述可用于创建更详细的 prompt 以制作新变体,可以为快速工程提供灵感。

怎么使用?

用户只需从写一个「 /describe」开始,Midjourney 提供了上传图像的位置:

上传图片后,点击进入:

然后,Midjourney 根据图像返回四个描述:

底部的四个数字是混合按钮,每个数字都与相应的描述相匹配。单击数字,Midjourney 会根据新的描述重新混合图像。

你也可以混合修改 prompt:

这是创建示例图像的原始 prompt:

an illustration of a brain with tree roots, psychedelic art, vibrant, by Alex Grey, by Amanda Sage, by Robert Venosa, neon colors(一幅有树根的大脑图像,迷幻艺术,充满活力,作者 Alex Grey,作者 Amanda Sage,作者 Robert Venosa,霓虹颜色)

这是 Midjourney 描述的 prompt 之一,被用于混合:

An image of an abstract brain tree with roots, in the style of mark henson, luminous colors, dark symbolism, detailed anatomy, bold lines, vibrant color, psychological phenomena illustrations, chiaroscuro woodcuts(一幅有树根的抽象大脑树图像,马克・亨森的风格,明亮的色彩,黑暗的象征主义,详细的解剖学,大胆的线条,鲜艳的色彩,心理现象的插图,千鸟格的木刻)

新的生成结果如下:

试用体验

该功能一经发布,就吸引了各位 AI 绘画爱好者的注意,很多人立马就上手开始创作了。

以下是通过一张 NASA 登月任务宇航员照片生成的新图片(右),的确以假乱真:

下图(左)为原图,(右)为 /describe 之后生成的新结果:

还有人想到,可以用 /describe 来进行品牌 logo 的升级。如此一来,既可以延续此前的品牌辨识度,又带来了全新的形象。

星巴克的「新 logo」毫无违和感。

苹果公司的经典标志,也可以是五彩缤纷的:

这是阿迪达斯:

百事公司可以考虑以下这款新设计:

不管是「文生图」还是「图生文」,随着用户交互的增加,MidJourney 的效果必然会有所提升。有研究者猜测,MidJourney 一直在进行大规模的人类反馈强化学习(RLHF),而这可能是有史以来规模最大的文字转图像。拥有的用户越多,MidJourney 能做的 RLHF 就越好,然后获得的用户会变得更多。

参考链接:https://medium.com/the-generator/midjourneys-crazy-new-describe-feature-a96cc09203cc

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-04-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
苹果WWDC2018:暗黑界面的新版macOS发布,唯一“新产品”是只表带
大数据文摘作品 作者:魏子敏、龙牧雪 当地时间6月4日上午10点,万众瞩目的苹果全球开发者大会WWDC2018在加州圣何塞召开,宣告着为期一周的iOS开发者狂欢的开幕。 以“技术与创造力的结合,催生不可思议的想法(When technology connects with creativity, incredible ideas come to life)”为主题,今年的大会依然在McEnery会议中心开启。 大会第一天,主旨演讲按照惯例,依然由苹果CEO蒂姆·库克带来。本次Keynote演讲持续近两小时
大数据文摘
2018/06/29
7170
【一文看尽苹果发布会】库克揭幕iOS 12,机器学习CoreML推出2.0
新智元报道 编辑:闻菲、肖琴、克雷格 【新智元导读】苹果年度开发者大会WWDC 2018揭幕,iOS、macOS等多项软件功能升级:Siri与App打通在使用上更加智能;人脸识别打造用户自己的动态
新智元
2018/06/22
8160
2018苹果开发者大会:推出机器学习应用套件Core ML 2,揭开iOS12的面纱
在苹果年度开发者大会WWDC的主题演讲中,苹果可能根本就没有讨论什么硬件,但是这个演示依然持续了两个多小时。苹果所有四个平台(iOS,watchOS,tvOS和macOS)都将在今年秋季重大更新,公司花费大量时间详细说明各种功能,这将改变你使用苹果设备的方式。
AiTechYun
2018/07/27
8490
2018苹果开发者大会:推出机器学习应用套件Core ML 2,揭开iOS12的面纱
WWDC20中iOS的改变
WWDC20中,绝大部份同学都会把注意力放在了iOS的布局改变和自研芯片上,这方面的文章也比较多,但作为一名开发者,更多的聚焦在iOS官方语言和官方库上来,这里仅找出几个更新比较大的点给大家分享。
粲然忧生
2022/08/02
1.9K0
WWDC20中iOS的改变
Swift 周报 第十期
前几期周报内容是同步翻译的英文版周报,目前英文版停更,周报停滞半年多。经过多次讨论,我们决定重启周报,分模块整理内容同步给大家。
Swift社区
2022/12/12
2.2K0
Swift 周报 第十期
在Mac上训练机器学习模型,苹果WWDC发布全新Create ML、Core ML 2
机器之心报道 作者:李亚洲、思源 北京时间 6 月 5 日凌晨,苹果 2018 年全球开发者大会 (WWDC) 在圣何塞的 McEnery 会议中心开幕。在去年的开发者大会上,围绕软、硬件,苹果介绍了
机器之心
2018/06/08
1K0
WWDC 2017前瞻:硬件细节已遭曝光,但苹果在软件方面的布局却始终慎重
北京时间6月6日凌晨1时,一年一度的2017苹果全球开发者大会(WWDC 2017)在美国加州圣何塞市的McEnery会议中心举行。按照惯例,每年6月举行的WWDC侧重于iOS及macOS等系统方面的
VRPinea
2018/05/15
1.3K0
Xcode 10
Xcode 10包含为所有Apple平台创建出色应用所需的一切。现在Xcode和Instruments在macOS Mojave上的新Dark Mode中看起来很棒。源代码编辑器允许您更轻松地转换或重构代码,查看源代码控制更改以及相关行,并快速获取有关上游代码差异的详细信息。您可以使用自定义可视化和数据分析构建自己的仪器。Swift可以更快地编译软件,帮助您提供更快的应用程序,并生成更小的二进制文件。测试套件的完成速度提高了很多倍,与团队合作更简单,更安全,等等。
iOSDevLog
2018/08/22
3.2K0
Xcode 10
肘子的 Swift 周报 #034 | WWDC 2024,AI 并非全部
苹果一直是 AI 领域的务实参与者,提供了卓越的设备端 AI 功能。然而,自从去年生成式 AI 的兴起,投资者、消费者、开发者都渴望苹果能够提供更加直观和感知丰富的 AI 技术。鉴于当前市场的需求,可以预见,在今年的 WWDC 2024 上,与 AI 相关的内容将占据极其重要的地位。
东坡肘子
2024/06/13
1500
肘子的 Swift 周报 #034 | WWDC 2024,AI 并非全部
5分钟带你看完 WWDC 2018
一年一度的 WWDC(苹果全球开发者大会)于北京时间 6月5日 凌晨1点开幕。废话不多说,来看看这次WWDC 都有哪些亮点吧!
零式的天空
2022/03/27
4230
5分钟带你看完 WWDC 2018
十分钟接入iOS 12新特性——Siri Shortcuts
Xcode 10已经正式发布,开发者可以接入Siri Shortcuts的iOS 12新特性。 WWDC2018的Introduction to Siri Shortcuts Session介绍了Siri Shortcuts的使用和Swift接入,但没有Objective-C版本的demo。 于是新开此文,介绍如何快速用OC接入iOS 12新特性Siri Shortcuts。
落影
2018/10/08
2.2K0
十分钟接入iOS 12新特性——Siri Shortcuts
苹果进入下一个十年!抛弃英特尔,WWDC官宣将Mac迁移至自研芯片,首批年底上市
就在刚刚,面对空无一人的Apple Park观众席,苹果CEO库克和以Memoji的形象出现在屏幕上开发者们一起,见证了他口中的这个“历史性的时刻”。
大数据文摘
2020/06/29
2.9K0
苹果进入下一个十年!抛弃英特尔,WWDC官宣将Mac迁移至自研芯片,首批年底上市
WWDC2022-iOS 篇完全解析
Apple 于北京时间 2022 年 6 月 7 日举办了 WWDC2022,作为一名 Apple 开发者,不仅仅是为了保持技术敏感度,同时也希望在第一时间将新的内容呈现在大家眼前。本文对发布会内容做了整理归纳,并着重对 iOS 的新内容进行分析。希望这篇文章对大家有所帮助的同时也给我们的产品带来更多的可能性。
molier
2022/11/03
6900
WWDC2022-iOS 篇完全解析
5分钟带你看完 WWDC 2018
WWDC 2018 Keynote 全记录 image 前言 一年一度的 WWDC(苹果全球开发者大会)于北京时间 6月5日 凌晨1点开幕。废话不多说,来看看这次WWDC 都有哪些亮点吧! iOS
BY
2018/06/06
9640
一文看尽苹果WWDC大会:今年有亮点,但都不“硬”
李根 安妮 假装发自 圣何塞 量子位 出品 | 公众号 QbitAI 又一年苹果全球开发者大会,又到了一年该秀技术实力的时候。 然而今年的WWDC 2018,软得彻底,丝毫“不硬”。 iOS、watc
量子位
2018/07/20
6360
WWDC的Keynote,开发者们需要关注什么?
北京时间6月14日凌晨1点,2016年苹果WWDC(开发者大会)在美国旧金山的比尔·格雷厄姆市政礼堂举办,此次大会以“四大OS”为主题,虽然没有期待的硬件发布,但“四大OS”的更新对于开发者而言,似乎
CSDN技术头条
2018/02/12
1.6K0
WWDC的Keynote,开发者们需要关注什么?
WWDC2017小结
MelonTeam
2018/01/04
1.4K0
WWDC2017小结
聊聊科技界发生的大事 WWDC
最近科技界发生的大事莫非就是上周的 WWDC 了,很抱歉因为很多事情直到现在才来总结和谈谈看法。今年的 WWDC 也不同于往年,而是在线直播。虽然说是直播,但是当我等到晚上 1 点的时候才知道原来是录播,还是有点小失望的。虽然是录播不得不说剪辑是非常完美的,任何过场都是无缝衔接。伴随着过场甚至带着我们参观了一遍 Apple Park。
Innei
2021/12/28
6570
Apple的Core ML3简介——为iPhone构建深度学习模型(附代码)
作者 | MOHD SANAD ZAKI RIZVI 编译 | VK 来源 | Analytics Vidhya 概述 Apple的Core ML 3是一个为开发人员和程序员设计的工具,帮助程序员进入
磐创AI
2019/11/22
2.2K0
Apple的Core ML3简介——为iPhone构建深度学习模型(附代码)
没熬夜看苹果开发者大会 2015 WWDC直播?来这看吧!
转自|百度百家 微信|baidu_baijia 和百家一起熬夜看WWDC,在会议开场前,现场已人头攒动。 开场的是BillBoard 上大热的单曲《Uptown Funk》 发布会将公布全新的操作
大数据文摘
2018/05/23
6140
推荐阅读
相关推荐
苹果WWDC2018:暗黑界面的新版macOS发布,唯一“新产品”是只表带
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档