首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >实测全球第一个专业设计agent:对设计师来说是福不是祸(附10+case)

实测全球第一个专业设计agent:对设计师来说是福不是祸(附10+case)

作者头像
AIGC新知
发布于 2025-05-14 04:20:09
发布于 2025-05-14 04:20:09
58000
代码可运行
举报
文章被收录于专栏:AIGC新知AIGC新知
运行总次数:0
代码可运行

起猛了,家人们。

本来今天凌晨还在外面和朋友们一起嗨,玩的很开心。

然后@数字生命卡兹克 卡神在群里发了一个新玩意的申请截图,想着点进去看看,这是什么好玩的东西。

我擦,全球第一个专业设计Agent:Lovart就在刚刚在推特发布内测了!

顺着这条路,然后也在官方评论区进行留言,立马就收到了内测的激活码。

开测,玩的就是真实!

先来说说Agent吧,前段时间火得一塌糊涂。

年初,mansu火爆全球,一夜之间manus这种通用智能体被传的家喻户晓,身边的人都在求一个manus邀请码。

然后Manus的势头慢慢的过去了,顺便带火了MCP协议,其实Manus并没有采用MCP这种协议的,只不过他们自己做了一些工程上的优化。

海外的Genspark、国内字节的扣子空间陆陆续续跟进,越来越被人们熟知,原来智能体怎么强大,可以自动化完成任务,可以口喷需求,一键生成内容。

但是,到真正具体到某个行业,很少见到这种专业级别的大师agent,因为这个是非常考验对行业knowhow的掌握程度,如果不是非专业领域的从业者,是无法搞出这种极具挑战力的产品。

然而,有一款海外的产品,却让我眼前一亮,这是偶然在刷帖子时看到的。

Lovart 是全球首个 Design Agent,就像Agent这个名字一样,可以完成从创意拆解到专业交付的整条视觉流程,妥妥的设计师打工搭子。

Lovart 让我觉得惊艳的,不仅仅是它非常宏大的Agent愿景,更加在于它是一个非常实用的Agent。

一、Lovart 是一个通用的Design Agent

Agent正在成为新一轮AI技术革命必争夺的高地,像爆火的Manus、Genspark就获得了非常多的流量和关注

Lovart 作为一款具备“规划 + 执行 + 交付”一体化流程的专业设计智能体,会成为设计、创意工作者们专用的多模态Agent。

二、Overseas Buzz

Lovart在海外吸引了不少创作者的青睐,都被这种新的设计agent所惊呆了

三、这种Agent是进行了全链路自动设计

过去需要花费很多时间精力搞定的设计需求,现在一句话就可以全搞定,他是怎么办到的?

原理就是从用户意图拆解→构建任务链→生产成品,整个流程是完全自动的,可以一次产出几十张张设计成品图

四、多模型ALL-in-Canvas调度

Lovart 使用了主流的GPT image-1 \ Flux pro \ OpenAI-o3 \ Gemini Imagen 3 \Kling AI \Tripo AI \Suno AI等非常知名的绘画/视频/3D生成工具,而且可以在canvas里面进行自主调用操作。

Please help me create a storyboard with the theme of medieval knight adventures, and generate audio and video.

看这里:https://www.lovart.ai/r/sho0j88

五、支持图层+文字修改

Talk:使用自然语言与Agent进行对话,给他下任务,真正的言出法随;

Tab:在canvas里面人与AI进行协作。在画板里面输入指令,AI与设计师协作轻松完成修改任务;

Tune:支持图层内修改,配合多款内置组件,大小形态、字体颜色一站调优

深度体验下来,Lovart 在多个场景表现出非常棒的效果,我自己也测试了很多case,接下来一一给大家说。

第一个场景是如何把一个商品卖出去,比如怎么做设计,怎么做营销海报。

前两天参加了卡神的杭州场活动,现场听刘世奇老师分享关于《我,97年,靠AI设计丑拖鞋,一年卖了3000万。》,靠丑拖鞋能够有这么大的营收吗!

这是几张现场照片,图片里面是这种丑拖鞋的样貌。

如果让Lovart 这种专业级别的Agent去设计制造丑拖鞋,它会是怎么样的?

我给Lovart 设计了一个提示词,然后输入到了对话框入口。

prompt:

Content:"Design a promotional poster for unique, handcrafted slippers."

Style:minimal, quirky, artisanal, modern aesthetic

Color Palette:natural beige, soft blue, earthy tones

Mood/Material:cozy, with a rustic touch, textured fabric

Aspect Ratio:3:4

Usage Scenario:"For online marketplaces and social media."

然后Lovart 帮我设计一个专业的营销海报,主要还是推到海外市场。

任务链接:https://www.lovart.ai/r/55ynvev

最终为我生成了一个海报:

随后,我优化了一版,提示词如下:

Content:"Design a promotional poster for quirky, unique slippers that embrace a bold aesthetic."

Style:minimal, modern, playful, eye-catching

Color Palette:natural beige, vibrant blue, contrasting earthy tones

Mood/Material:cozy, with a touch of whimsy, textured fabric that suggests comfort and personality

Aspect Ratio:3:4

Usage Scenario:"For online marketplaces and social media platforms targeting North American consumers."

Additional Notes:Emphasize the slippers' unique design as a statement piece that stands out in the crowded market of footwear. Highlight their comfort features and the fun, expressive nature of the design

任务链接:https://www.lovart.ai/r/lphcgs1

最终生成这样的海报:

其实就可以发现,Lovart 会自动根据你上传的图片去设计海报,而且文字也没有失真,既有鲜明的背景风格和非常适合的暖色调。

第二个场景,是用它做制作AI视频,生成导演级分镜+视频,具体效果咋样,试试才知道。

做过AI视频的朋友们肯定知道,一个完整的AI视频,需要经历非常复杂的流程,包括前期的创意脑暴、脚本制作以及分镜制作,中期的图片生成和图生视频,还有后期的配音、背景音乐、放大与降噪、剪辑等,需要一个专业化的小团队来做。

测试之前,我是对它真没有把握,不知道能不能根据我输入的简简单单一句话就可以生成分镜+视频。

真正去测试完,我脑子里蹦出来的第一句就是“卧槽,牛逼”。

我的提示词是这样的:

Please help me create a storyboard with the theme of medieval knight adventures, and generate audio and video.

任务链接:https://www.lovart.ai/r/sho0j88

首先是一个故事脚本的创作,特意截了图,可以上下滑动,大家看的清楚一点。

包含了故事里面的人物介绍、多个场景介绍以及多个分镜。

上下滑动阅读更多内容

然后是选择风格模型,选择中世纪风格,然后为以此为基础进行人物角色设计、故事版图像以及音视频创作。

整个故事的人物角色设计,是严格遵循故事脚本的角色设计,其实里面设计了四个角色:

Sir Alaric (Protagonist, 30, Knight) 、Cedric (Ally, 18, Squire) 、Lady Elara (Mentor, 40, Healer) 、Malakar (Antagonist, 45, Sorcerer) 。

lovart使用Flux模型帮我生成了这四个角色的样图。

接下来它为我们创作每一个分镜的图片,当然还是使用最先进的Flux模型,生成的图片质量、一致性非常高。

接下来是一张巨长的故事板,就是我们前面介绍的那个故事脚本,它在此基础之上配了图。

反正就挺离谱的,不过,更加离谱的还在后面。

上下滑动阅读更多内容

HTML storyboard

接下来会继续生成悠扬的BGM。。。我真去听了。

有乐器独奏的声音,节奏非常不错。

上下滑动阅读更多内容

BGM

接下来会调用kling模型进行图生视频,根据每一帧图片进行生成视频。

上下滑动阅读更多内容

Kling图生视频

其实前面提到,图生视频之后,还需要对每一个视频里面的人物对白进行配音。

lovart帮你一起肝了。。。

最终生成的视频长这样,海外版打怪升级

这个案例确实让我惊讶到了。

第三个场景,是给某护肤霜品牌做logo/VI。

吭哧吭哧写了一长串的提示词。

PS:如果不知道怎么写提示词的,可以参考我这套提示词模板:

需求 + 风格(Style)+ 色彩(Color Palette)+ 情绪(Mood)+材质(Material)+ 比例尺寸(如3:4) + 使用场景

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Product Description for FERAVÉ Skincare Cream
Brand Name: FERAVÉ
Category:
High-end skincare cream
Brand Concept:
FERAVÉ brings feral elegance and soft ritual to your daily routine, combining modern minimalism with nature-inspired luxury. It’s a brand that makes your skincare experience feel like a serene escape.
Visual Identity:
Color Palette: Soft bark brown, sage green, warm taupe, dusty mauve, black ink accents
Packaging: Amber glass jars with textured paper labels and blind embossing
Tone & Copy Examples:
“Nourish the quiet.”
“Skincare that lingers like a gentle touch.”
“A sanctuary for your skin.”
Product Description:
FERAVÉ Skincare Cream is a luxurious blend of natural ingredients designed to nourish and soothe your skin. Lightweight and easily absorbed, it leaves your skin feeling soft and radiant. Infused with botanical extracts and essential oils, it transforms your daily routine into a moment of pure indulgence.

任务链接:https://www.lovart.ai/r/l54bonm

其实在设计品牌logo/VI时,lovart会帮我进行灵感的总结(会不会是我要求的太多了

),反正把我提的要求进行了核心整理。

然后就给我生成了不同的品牌logo。

第四个场景,其实是想制作一个网页,lovart测试下来,它的更多能力边界在于复杂图像设计的交互。

比如,让它为我设计一个牙膏的网页。

Design a website homepage for an electric toothbrush, with a sleek, tech-inspired aesthetic in purple tones, mirroring the clean and minimalist style of the official Apple website to emphasize the product's advanced features.

任务链接:https://www.lovart.ai/r/ttqin0i

最终生成的网页如下:

第五个场景,是连环画设计。

并且lovart可以一次性生成多张图。

Why do some people on the Internet hate those who constantly brag about their achievements?Make a set of graphic comic strips to explain。

任务链:https://www.lovart.ai/r/4u5daa9

下面这些图,全是lovart自动生成的,看不出AI的痕迹啊

第六个场景,就是为女明星设计一个时尚海报。

Design four dazzling main visual posters with different layout styles for me. They adopt the simple and high-end fashion magazine design style, featuring advanced layout and font designs.

任务链:https://www.lovart.ai/r/atw635d

Poster 1: Minimalist Design with Luxurious Typography

Poster 2: Bold Asymmetrical Layout with Dramatic Typography

Poster 3: Elegant Grid-Based Layout with Serif Typography

Poster 4: Dynamic Layered Design with Modern Typography

其实整体体验下来,lovart的完成度很高,我影响中比较深刻的一点就是做AI视频这种,已经非常牛逼了,这就意味着前两年的AI视频制作流程又要进行革新,AI工作流或许成为一个过去式。

作为第一个设计专业agent,非常适合设计师,但是对于小白来说,如何写好提示词是蛮重要的。

现在想要使用的话,现在去官网申请waitlist,审核时间几小时到1天。

然后打开 👉 www.lovart.ai ,点击“开始使用”

填写您的邮箱,点击“使用邮箱登录”

最后登陆界面,就可以愉快的玩耍了。

AI的进步日新月异,伴随着新技术的到来,对所有人的生活都会有影响。

lovart的出现,让更多的人,认识到Agent的魔力,原来manus不是神话。

并且通用垂类agent将会在各个行业陆续出现。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-05-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AIGC新知 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【OCR技术系列一】光学字符识别技术介绍
注:此篇内容主要是综合整理了光学字符识别 和OCR技术系列之一】字符识别技术总览,详情见文末参考文献
闪电gogogo
2018/08/10
6.3K0
【玩转OCR有奖征文】文字识别技术原理
在日常生活工作中,我们难免会遇到一些问题,比如图片上不合规的文字信息,却要一个一个地审核,很麻烦;快递公司的业务越来越好,但每天需要花费很多时间登记录入运单,效率非常的低。
程序员法医
2023/08/30
8710
基于机器视觉的手机产品条码检测方案
本方案将搭建一个基于机器视觉的流水线检测手机条码平台,把产品放置于流水线上,高速工业相机对其逐一采集后传送到计算机进行一系列的处理,最终检测出条码是否合格并把不合格的条码分拣出来, 完成自动检测手机条码质量的功能。
AI算法与图像处理
2020/09/08
9540
基于MATLAB模板匹配的车牌识别系统设计与实现(附字符模板库)
本系统基于模板匹配法实现车牌识别,核心流程包括:图像预处理→车牌定位→字符分割→字符识别。通过构建标准字符模板库,利用归一化互相关(NCC)算法进行模板匹配,最终输出车牌号码。
用户4006703
2025/08/08
960
【光学字符识别】OCR 浅述
文字是信息的重要载体之一。通过书写、印刷、电子设备等方式,文字可以被记录下来并传递给他人。文字也是语言的重要组成部分,人们可以通过文字来表达自己的思想、感情和意图。在信息化时代,文字仍然是最基本、最重要的信息传递方式之一,也有着其不可替代的优势,如:简短明了、方便快捷、易于编辑、可归纳整理等。
青橙.
2023/08/25
1K0
图像处理算法工程师——1必备技能总结——2面试题大全[通俗易懂]
相关术语: (1) OCR:OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程 (2) Matlab:商业数学软件; (3) CUDA: (Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台(由ISA和GPU构成)。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题 (4) OpenCL: OpenCL是一个为异构平台编写程序的框架,此异构平台可由CPU,GPU或其他类型的处理器组成。 (5) OpenCV:开源计算机视觉库;OpenGL:开源图形库;Caffe:是一个清晰,可读性高,快速的深度学习框架。 (6) CNN:(深度学习)卷积神经网络(Convolutional Neural Network)CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。 (7) 开源库:指的是计算机行业中对所有人开发的代码库,所有人均可以使用并改进代码算法。
全栈程序员站长
2022/08/29
1.9K0
OCR笔记① | 环境配置与简单操作
各位朋友大家好,我是CPP课题组的视觉工程师。这个系列的文章主要介绍计算机视觉尤其是OCR在经济类课题数据采集中的应用以及其实现方法。既是小教程又是学习笔记。
量潮科技
2022/10/31
5860
利用MATLAB进行图像处理-基础技术与实例
图像处理是计算机科学和工程中一个重要的领域,广泛应用于医疗、工业、安防等多个行业。MATLAB作为一种强大的数学软件,提供了丰富的工具箱和函数,方便进行图像处理。本篇文章将介绍MATLAB图像处理的基础技术,并结合代码实例进行详细解析。
一键难忘
2025/01/13
5640
【独家】一文读懂文字识别(OCR)
前言 文字识别是计算机视觉研究领域的分支之一,归属于模式识别和人工智能,是计算机科学的重要组成部分 本文将以上图为主要线索,简要阐述在文字识别领域中的各个组成部分。 一 ,文字识别简介 计算机文字识别,俗称光学字符识别,英文全称是Optical Character Recognition(简称OCR),它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。OCR技术是实现文字高速录入的一项关键技术。 在OCR技术中,印刷体文字识别是开展最早,技术
数据派THU
2018/01/29
24.5K1
OCR技术综述
最近入坑研究OCR,看了比较多关于OCR的资料,对OCR的前世今生也有了一个比较清晰的了解。所以想写一篇关于OCR技术的综述,对OCR相关的知识点都好好总结一遍,以加深个人理解。 什么是OCR? OCR英文全称是Optical Character Recognition,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。文字识别是计算机视觉研究领域的分支之一,而且这个课题已经是比较成熟了,并且在商业中已经有很多落地项目了。比如汉
朱晓霞
2018/04/18
15.2K0
OCR技术综述
科普时间:OCR是人工智能的基础之一
在人机交互方面,大多人想到的都是语音交互,毕竟这是人类之间运用率最高的交流方式,且语音识别、自然语言理解等技术目前也发展的相当不错。 但是,我们也不得不忽视这样一个事实:我们每天都被文字所包围,像每天
镁客网
2018/05/29
2.8K0
【数字图像】数字图像锐化处理的奇妙之旅
数字图像处理是一门涉及获取、处理、分析和解释数字图像的科学与工程领域。这一领域的发展源于数字计算机技术的进步,使得对图像进行复杂的数学和计算处理变得可能。以下是数字图像处理技术的主要特征和关键概念:
SarPro
2024/02/20
4460
【数字图像】数字图像锐化处理的奇妙之旅
OCR技术的昨天今天和明天!2023年最全OCR技术指南!
OCR是一项科技革新,通过自动化大幅减少人工录入的过程,帮助用户从图像或扫描文档中提取文字,并将这些文字转换为计算机可读格式。这一功能在许多需要进一步处理数据的场景中,如身份验证、费用管理、自动报销、业务办理等都显得尤为实用。现如今,OCR解决方案会结合AI(人工智能)和ML(机器学习)技术,以自动化处理过程并提升数据提取的准确性。本文将介绍该技术的前世今生,一览该技术的阶段性发展:传统OCR技术统治的过去,深度学习OCR技术闪光的现在,预训练OCR大模型呼之欲出的未来!
合合技术团队
2023/07/13
3.2K0
OCR技术的昨天今天和明天!2023年最全OCR技术指南!
【数字图像】数字图像平滑处理的奇妙之旅
数字图像处理是一门涉及获取、处理、分析和解释数字图像的科学与工程领域。这一领域的发展源于数字计算机技术的进步,使得对图像进行复杂的数学和计算处理变得可能。以下是数字图像处理技术的主要特征和关键概念:
SarPro
2024/02/20
4160
【数字图像】数字图像平滑处理的奇妙之旅
OCR光学字符识别方法汇总
文本是人类最重要的信息来源之一,自然场景中充满了形形色色的文字符号。光学字符识别(OCR)相信大家都不陌生,就是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
小白学视觉
2022/04/06
2.1K0
OCR光学字符识别方法汇总
Windows 10 IoT Serials 10 – 如何使用OCR引擎进行文字识别
1. 引言        OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。     在Windows 10通用应用程序UWP示例中,包含了OCR应用程序,具体请参考(https:/
ShiJiong
2018/03/27
2.8K0
Windows 10 IoT Serials 10 – 如何使用OCR引擎进行文字识别
手背静脉识别的图像处理算法
手背静脉识别技术作为一种全新的特征识别技术,相比于传统的生物识别技术(如指纹识别)具有许多明显的优势,然而对于该技术的研究尚处于刚刚起步阶段,使用计算机来直接进行静脉识别与身份匹配仍然较为困难,为了方便后续特征识别,提高静脉识别的准确度和优越性,有必要对获取的静脉图像进行一系列处理,得到静脉的骨架结构。 题目主要要求为: 1.对采集图像进行背景去除,取得手背部分; 2.计算采集手背的质心并提取手背有效区域; 3.提取手背静脉走势; 4.对提取的静脉进行细化处理,去除毛刺; 5.改进算法,提高程序的通用性和适普性; 6.在图像分割上尝试不同的方法,并比较结果的好坏。
全栈程序员站长
2022/08/29
1K1
手背静脉识别的图像处理算法
老人跌倒检测识别算法 基于图像识别
随着人口老龄化日益增加,老年人跌倒的比例逐年增高,本论文研究通过采集身体姿态数据来判断是否发生跌倒。选用背景差分法和形态学算法提取目标骨架,骨架提取经历九步:图像灰度化,背景差分法提取目标轮廓,使用CLAHE算法增强对比度,高斯滤波,Solel算子进行边缘检测,小波去噪,最大类间误差法二值化,形态学运算和中值滤波。然后用基于人体比例的方法初步判断跌倒情况,再用基于运动趋势的精准判断跌倒情况。算法总体效果可以,误检较少。
燧机科技
2023/09/02
4800
老人跌倒检测识别算法 基于图像识别
[OCR服务] 最强PDF转Word
OCR(Optical Character Recognition,光学字符识别)是一种将印刷体或手写文字转换为可编辑文本的技术。它通过将图像中的字符转换为计算机可以理解的文本形式,实现了从纸质文档到数字化数据的转换。
iResearch666
2023/09/13
7200
[OCR服务] 最强PDF转Word
OCR提取图片中的文字
OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
生信交流平台
2020/08/06
19.7K0
OCR提取图片中的文字
推荐阅读
相关推荐
【OCR技术系列一】光学字符识别技术介绍
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验