Hello大家好,好久不见,我是KK,欢迎来到本期深度解析,本期将带领大家全方位的体验AI在电商领域的助力效果,期间会体验到一键部署,DeepSeek R1满血版助力助力AIGC生图提示词,StableDiffusion在电商领域的实战样例,详细到知识点,工作流,部署,以及扩展,尽管腾讯混元Video等文生/图生视频模型展现了惊人的创造力,但本地部署的硬件门槛如20/30系显卡算力局限、AMD架构兼容性问题仍将大量开发者拒之门外。值得关注的是,在电商领域,Stable Diffusion正通过云端协同、轻量化一键部署、可视化界面、Comfyui工作流等方案突破桎梏,在各行各业生根开花。
本来这期的文章要更新我们腾讯混元的文生视频,图生视频的实际部署样例的,奈何很多小伙伴硬件实在有限,有人是AMD,有人是N卡的20系,要不是显存不够,要不是硬件不支持,4090显卡与5090显卡虽然显存能够支持,但是那价格简直贵的要命,网传的4090的48G方案虽然能使用99%的AI应用,但是昂贵的显卡没了质保,这......得不偿失,导致很多想要本地部署体验AI应用的小伙伴都被劝退了,上半年节假日以及假期这么多,电商的,能否结合AIGC对我们的设计中的电商产品进赋能呢?如何借助前沿技术为电商业务赋能,成为了众多从业者关注的焦点。AIGC技术作为当下炙手可热的领域,其在电商设计中的应用潜力巨大,能够为电商产品设计带来全新的思路与解决方案,基于以上考量,我决定将本期内容聚焦于AIGC的实际应用,深入剖析StableDiffusion的前世今生,并结合电商领域的实际案例,为大家带来全面且深入的解读与应用指导。希望通过本期内容,能够帮助大家更好地理解AIGC技术在电商领域的价值与应用场景,为电商业务的发展提供有力支持。
显卡型号不支持cuda?不想购买昂贵的4090、5090?24G显存都爆红?本地部署一片飘红不知如何解决?腾讯云高性能应用服务 HAI服务器通通搞定,顶配32G显存,开箱即用,16G,24G,32G,最高64G通通可用,64G这下妈妈再也不用担心我爆显存了~~
点击立即使用,然后新建服务
这里建议大家如果是小白的话,优先选择Stablediffusion webui,使用简单,支持大模型,Vae,Lora,以及高级插件ControlNet,等慢慢熟悉了整体使用后再挪到Comfyui中使用,国内小伙伴选择上海地域,要不不会有这么多的配置~~,如果长期使用建议包年包月,如果短期体验选择按量计费更划算,硬盘部分,建议大家尽量选大一点,至于每个模型的硬盘占用,会在知识点部分给出,80G是够用的,如果长期使用,还是尽可能越大越好,我本地2T的固态都是已经剩余30个G不到了。
点击确定,就可以HAI起来啦~~~,基础环境,配置,通通搞定,选择Gradio webUI启动,基本页面上都是一键式的
启动成功
那么环境有了,应用部署好了,该怎么玩?上面这种图又是怎么生成的?别急,我们从小白到生图,还需要亿点点基础知识点~~
Stable Diffusion 是一个2022年发布的深度学习文本到图像的潜在扩散模型(LDM / Latent Diffusion Model),由 CompVis、Stability AI 和 LAION 的研究人员和工程师创建。它使用来自 LAION-5B 开源数据库子集的512x512图像进行训练,通过引入隐向量空间来解决 Diffusion 速度瓶颈,除了可用于文生图任务,还可以用于图生图、特定角色刻画,甚至是超分或者上色任务
通俗的讲,可以就是一个神笔马良,你告诉他你想要什么画面,不想要什么,就可以啦~~就像魔法一样,言出法随,想要什么就出现什么~~
形象的来说就是:
当向平静的湖面扔了一个小石子,水波纹向周边扩散最终恢复平静的过程,我们称之为稳定扩散,在图像生图原理中扩散过程是指,将一个图像经过多次迭代,逐渐变得模糊、扩散的过程。在这个过程中,图像的细节信息会逐渐消失,只保留下整体的结构信息。稳定扩散这个名字来源于这个过程的稳定性
举个例子:
如果你输入“蓝色激光的机械质感嘻哈哥斯拉毛绒玩具”,神笔马良会先画哥斯拉和火焰的乱涂乱画,再一点点擦出哥斯拉的角、嘻哈元素,最后让整个画面变得超级炫酷
在截图当中我们会有一些问题,整个UI腾讯云已经帮我们汉化了,但是额,有点丑丑的,一种老是小孩的丑,原始的UI就这样子,有没有办法变得炫酷一点呢?多炫酷?这么炫酷可以么
模型和UI资料包
https://pan.quark.cn/s/e9c054887904#/list/share
将UI压缩包解压到\extensions下即可,颜色可以自定义,且UI可以自由拖放,适配不同页面
什么是大模型?大模型的特点就是大,利用海量数据数百万张图片,几十亿的参数量训练而成的一个模型,具有泛化的图片特点
什么是Lora?Lora可以是一个快速定制的画师,比如动漫啊,玩具啊,摄影啊等等
大模型都是几个G的 1.5G-2G SDXL 6-7G
Lora只有几百兆
大模型:\models\Stable-diffusion
Lora:\models\Lora
插件:\extensions
controlnet:\extensions\sd-webui-controlnet
放大算法:\models\ESRGAN
vae:\models\VAE
那我们想要出一些电商的场景,或者其他场景的图片,需要一些写实,真实自然的模型,随着需求越来越多,模型太多了,名字那么多,我怎么记得住呢?
提示词:你想要在画面中出现的元素或者内容
例如:哪吒的冰淇淋效果
天空是清澈的蓝色,特写镜头,绿色,天空是明亮的蓝色,大的富有表现力眼睛,
毛绒像一个有着黑色头发的卡通女孩,融入龙尾巴的是一个详细的冰淇淋蛋筒,
为展示增添了俏皮的元素,蛋筒本身是一个传统的浅棕色华夫饼蛋筒
反向词:不想要出现在画面中出现的元素或者内容
例如:崩坏的,多手,多脚,灰度图,素描等等
可以自定义名字,新建一个与大模型或者Lora同名的以png结尾的图片即可举例:niji_v1 图片就应该叫做niji_v1.png,这样就可以在模型和Lora页面看到自己的模型预览图了~~
belike
好,那我们基础的知识点都了解差不多了,接下来进行实际的电商应用
既然刚刚提到了使用StableDiffusion WebUI那么为什么还要说工作流呢?工作流不是Comfyui才有的吗?嗯哼?你就这么确定吗?实际上在StableDiffusion WebUI也可以使用工作流的。我们先从电商场景开始,一步步做出自己的工作流。
既然提到了电商设计,那么电商海报,产品宣传图,AI模特,个性化图片,我们都可以一一实现,我们从简到繁,一步步开始,
现在我有一个需求,想要实现一个儿童兴趣班的宣传海报,要求符合儿童的审美,可爱,且有兴趣班的元素,那么我们该怎么实现呢?
刚才我们不是提到了提示词吗?那我们就可以完全使用提示词来实现~~~
1.我们自己写提示词
一位老师正在辅导一名小学生坐在书桌前用3D卡通元素做作业,图片顶部写着“学生”,明亮的蓝黄色渐变背景,欢快的小学生吉祥物拿着书,黄色、粉色、蓝色和黄色,背景中有白色、绿色、橙色,背景是光滑的,还有红色
The teacher is tutoring a primary school student sitting at a desk
doing homework with 3D cartoon elements,At the top of the picture,
it says' Student ', bright blue-yellow gradient background,
cheerful A primary school student mascots holding books,yellow,
pink, blue, and yellow,in the background, white, green, orange,
the background is a smooth, and red
其中采样方法一定要用Euler,分辨率给到了1024*1024,然后引导系数CFG为3.5,点击生成即可
如果放在Comfyui会相对简单很多,但是用到了Lora,需要搭建对应的工作流
提示词就可以很简单的实现这个海报,那么我们不是提到了DeepSeek R1助力吗?我们就使用腾讯混元的元宝,接入了满血版的DeepSeek R1,打开智能体就可以实现提示词书写自由
智能体网址:https://yuanbao.tencent.com/chat/ui3R741hQctM
小程序体验
简单的文生图我们学会了,掌握了出图的元素要点,我们开始进行图片的控制,接入Controlnet,以电商图标制作为例
先找i到一个Logo,黑底白色,分辨率同比缩小两倍
为了更好的展示图片,可以选择高清放大,底模选择为真实质感大模型
上传图片作为控制的底图到controlnet,为了AI更加发挥想象力,我们的介入时机给到80%
生图看下效果
更换质感的提示词,或者更换Lora
同理复杂的文字也可以参考这个方法
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。