Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >DAMODEL丹摩|部署FLUX.1+ComfyUI实战教程

DAMODEL丹摩|部署FLUX.1+ComfyUI实战教程

作者头像
fhvyxyci
发布于 2024-12-24 01:22:47
发布于 2024-12-24 01:22:47
59002
代码可运行
举报
文章被收录于专栏:学习学习
运行总次数:2
代码可运行

1. FLUX.1简介

FLUX.1是由黑森林实验室(Black Forest Labs)开发的开源AI图像生成模型。它拥有12B(120亿)参数,是迄今为止最大的文生图模型之一。FLUX.1以其卓越的图像质量、高度逼真的人体解剖学表现和先进的提示词遵循能力而脱颖而出,为AI图像生成设定了新的行业标准。

FLUX.1包含三种变体,以满足不同用户的需求:

  1. FLUX.1 Pro:顶级性能版本,适合需要最高图像质量和详细输出的商业应用。
  2. FLUX.1 Dev:开源非商业用途版本,是从FLUX.1 Pro提炼而来,具有类似的质量和提示词能力,同时比相同大小的标准模型更高效。
  3. FLUX.1 Schnell:快速高效的版本,专为本地开发和个人使用量身定制,在Apache2.0许可下公开可用。它在生成速度上具有明显优势,同时对内存的占用也是最小的。

FLUX.1的竞争力:

  • 大规模参数:拥有12B参数,是最大的开源文本到图像模型之一。
  • 多模态架构:基于多模态和并行扩散Transformer块的混合架构,提供强大的图像生成能力。
  • 高性能变体:提供三种不同性能和用途的模型变体。
  • 图像质量:在视觉质量、提示词遵循、大小/纵横比可变性、字体和输出多样性等方面超越了其他流行的模型。
  • 开源和可访问性:部分模型变体如FLUX.1 Dev和FLUX.1 Schnell是开源的,易于研究和非商业应用。
  • 技术创新:引入了流匹配训练方法、旋转位置嵌入和并行注意力层,提高了模型性能和硬件效率。

FLUX.1的应用场景广泛,包括媒体和娱乐、艺术创作与设计、广告和营销、教育和研究以及内容创作等多个领域。它能够帮助用户轻松将创意愿景转化为具体视觉效果,是一个强大的AI图像生成工具。

1
1

2. 实战

丹摩平台链接

2. 1 创建资源

2
2
  1. 在创建页面可以看到丹摩提供了三种付费方式,本教程使用按量付费,如果有长期的需求,可以自行选择包月或包日。
  2. 丹摩还提供了非常多种不同层次的配置供选择,这里选用第一种NVIDIA-GeForce-RTX-4090,你可以根据个人需求选择更高的配置。
  3. 接着是数据硬盘,默认是100G数据盘和50G数据盘,对于FLUX.1模型,建议将数据盘至少增加至150GB。
  4. 安装镜像,选择镜像市场点加号就可以看到许多类型与版本的基础镜像,这些镜像中已经包含了系统与对应的框架环境,开箱即用。这里选用PyTorch2.4.0。
  5. 创建密钥对(增加安全性,可跳过)
3
3

自定义一个名字后妥善保管下载下来的秘钥文件。

4
4

然后选择刚刚创建的密钥对。

6
6

最后点击右下角的立即创建就好了。 配置总览:

6
6

创建后自动跳转到如下界面,耐心等待创建完成。

7
7

创建完成后点击黄字就可以跳转到云实例进行操作了。

9
9

进入云实例后选择Terminal

10
10

就可以进入到 Linux 的命令行界面,然后就可以进行下一步操作了。

注:进入后先输入

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
clear

就可以清除系统的红色提示。

11
11

2. 1 ComfyUI的部署操作

在命令行中输入以下两个代码中的一个,推荐使用第二个与CSDN合作的 gitcode 的域名,下载比 github 快很多。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# github官方代码仓库
git clone https://github.com/comfyanonymous/ComfyUI.git
# gitCode-github加速计划代码仓库
git clone https://gitcode.com/gh_mirrors/co/ComfyUI.git

输入后回车,等待几秒,出现下图的目录就说明克隆项目成功了。

11
11

双击左边的ComfyUI就可以进入目录。

12
12

这里便是ComfyUI的项目文件。

接下来的操作需要Linux基础,如果你没学过,照做就好。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd ComfyUI/
pip install -r requirements.txt --root-user-action=ignore

第一行是切换到 ComfyUI这个目录下。

第二行代码用来下载ComfyUI所需要的依赖,丹摩会自动使用国内的镜像源去下载,所以还是很快的。

下载完成后,执行:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
python main.py --listen

如果出现的是类似这样的信息:

14
14

就说明ComfyUI部署完成。

2. 3 部署FLUX.1

在下面的三行代码选取一个:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wget http://file.s3/damodel-openfile/FLUX.1/FLUX.1-dev.tar
wget http://file.s3/damodel-openfile/FLUX.1/FLUX.1-dev.tar
wget http://file.s3/damodel-openfile/FLUX.1/flux_text_encoders.tar

作用依次为:

  1. 下载完整FLUX.1-dev模型
  2. 下载完整FLUX.1-schnell模型
  3. 下载完整Clip模型

安装之前先按 ctrl+c 退出刚才进入的 python 程序。

这里采用第一个进行安装。

安装包非常大,所以需要耐心等待,不过放心,下载操作发生在云端,不会占用你的带宽。

16
16

下载完成后进行解压:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
tar -xf FLUX.1-dev.tar

这么大的文件解压也需要挺长时间,出现如下界面时耐心等待,不要进行任何操作。

17
17

解压完成后:

18
18

接下来移动一些文件到指定的地方:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd /root/workspace/ComfyUI/FLUX.1-dev
mv flux1-dev.safetensors /root/workspace/ComfyUI/models/unet/
mv ae.safetensors /root/workspace/ComfyUI/models/vae/
  1. 进入解压后的文件夹。(如果没有解压到这个位置,请自行修改路径)
  2. 后面两行都是移动文件的位置,不多解释。
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd ../

切换到上级目录(/root/workspace/ComfyUI/)。

执行:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wget http://file.s3/damodel-openfile/FLUX.1/flux_text_encoders.tar

等待下载完成后进行解压:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
tar -xf flux_text_encoders.tar

解压完成后再次进行文件移动:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd /root/workspace/ComfyUI/flux_text_encoders
mv clip_l.safetensors /root/workspace/ComfyUI/models/clip/
mv t5xxl_fp16.safetensors /root/workspace/ComfyUI/models/clip/

这样部署就完成了。

3. 测试

执行:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd /root/workspace/ComfyUI
python main.py --listen
  1. 切换到项目路径。
  2. 执行项目。

如果你出现如下报错:

19
19

依次执行:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
apt-get update
apt-get install lsof

安装lsof,安装完成后执行:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
sudo kill -9 $(sudo lsof -t -i:8188)

这样就能正常运行了:

20
20

回到丹摩平台:

21
21
22
22

输入8188并创建。

23
23

将链接复制下来访问就能进入页面:

24
24

点击右侧大大的Load,加载你的工作流就可以运行了。

5. 释放资源

如果你不打算长期使用创建的实例,一定要释放资源,不然会持续扣费。

释放
释放

4. 结语

在本教程中,我们不仅探索了FLUX.1和ComfyUI的强大功能,还体验了丹摩平台的便捷性和高效性。 丹摩平台以其用户友好的界面、灵活的资源配置和即开即用的便捷性,为用户提供了一个理想的AI开发和部署环境。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-12-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
丹摩征文活动|FLUX.1+ComfyUI高效部署策略与实践
前言:从最初的命令行界面,到图形用户界面(GUI),再到如今的智能化、个性化交互体验,每一次技术的革新都为我们带来了前所未有的便捷与惊喜。而在这个充满无限可能的舞台上,丹摩平台凭借其卓越的创新能力和深厚的技术积累,为我们呈现了一个全新的交互体验——FLUX.1+ComfyUI。
Eternity._
2024/11/12
2060
丹摩征文活动|FLUX.1+ComfyUI高效部署策略与实践
丹摩平台 | 轻松上手图像生成:FLUX.1遇上ComfyUI,让复杂变简单!
FLUX.1是由黑森林实验室推出的一款前沿图像生成模型,针对不同用户需求,提供了三种不同版本。
用户11316056
2024/11/21
3090
丹摩平台 | 轻松上手图像生成:FLUX.1遇上ComfyUI,让复杂变简单!
图像生成 FLUX.1+ComfyUI模型部署,一起来生成独有的视觉盛宴
FLUX.1是由黑森林实验室(Black Forest Labs)研发的一款前沿图像生成模型,提供了三个不同版本,以满足多样化的用户需求。
忆愿
2024/10/29
5960
图像生成 FLUX.1+ComfyUI模型部署,一起来生成独有的视觉盛宴
丹摩|FLUX.1+ComfyUI部署与使用
随着人工智能(AI)技术的飞速发展,全球范围内的技术创新和产业变革正在加速。丹摩智算平台(DAMODEL)凭借其卓越的AI算力服务,迅速成为AI开发者的重要工具平台。该平台通过提供高效的GPU资源租赁服务,使得机器学习(ML)和深度学习(DL)项目的开发不再受限于本地硬件资源的瓶颈。开发者可以更加专注于算法创新与应用开发,而无需担忧计算资源的配备与维护问题。本文将详细介绍如何在丹摩智算平台上部署和使用FLUX.1及ComfyUI,帮助开发者快速搭建AI项目环境,提升开发效率。
用户11397231
2024/12/10
5531
丹摩|FLUX.1+ComfyUI部署与使用
丹摩智算:FLUX.1+ComfyUI的部署与使用指南
在人工智能领域,图像生成技术一直是研究的热点之一。随着深度学习技术的发展,图像生成技术已经取得了显著的进步。最近,黑森林实验室(Black Forest Labs)开发的FLUX.1模型在图像合成技术方面取得了新的突破,成为了市场上的新宠。本文将介绍如何在丹摩智算平台上部署和使用FLUX.1模型,以及如何结合ComfyUI为用户提供更直观的交互体验。
屿小夏
2024/09/26
1.1K0
丹摩智算:FLUX.1+ComfyUI的部署与使用指南
DAMODEL丹摩|CogVideoX-2b:从安装到上线,轻松搞定全过程!
CogVideoX的推出标志着视频生成技术的一次重大突破。过去,如何在保持高效的同时提升视频质量一直是一个难题,但CogVideoX 通过其先进的3D变分自编码器,成功将视频数据压缩至原来的2%,大幅降低了资源消耗,并确保视频帧之间的流畅连贯。
用户11292525
2024/11/21
2220
DAMODEL丹摩|CogVideoX-2b:从安装到上线,轻松搞定全过程!
丹摩智算:探索CogVideoX-6B模型的部署与使用
智谱 AI 在 8 月 6 日宣布了一个令人兴奋的消息:他们将开源视频生成模型 CogVideoX,目前,其提示词上限为 226 个 token,视频长度为 6 秒,帧率为 8 帧 / 秒,视频分辨率为 720*480,而这仅仅是初代,性能更强参数量更大的模型正在路上。
屿小夏
2024/09/26
1490
丹摩智算:探索CogVideoX-6B模型的部署与使用
丹摩平台 | 智谱清影 -CogVideoX-2b-部署与使用,带你揭秘生成6s视频的极致体验!
CogVideoX 的问世可以说是视频生成领域的一次革命性变革。传统技术在追求高效与高质的过程中常常面临两难,而如今,通过其先进的3D变分自编码器,视频数据压缩到了原本的2%,显著减少了资源使用,同时确保了视频帧之间的连贯流畅。
用户11316056
2024/11/21
2320
丹摩平台 | 智谱清影 -CogVideoX-2b-部署与使用,带你揭秘生成6s视频的极致体验!
🔥 智谱清影 🔥-CogVideoX-2b-部署与使用,带你揭秘生成6s视频的极致体验!
过去的技术常常在效率和质量之间挣扎,而现在,它的 3D 变分自编码器能将视频数据压缩至原来的 2%,大幅降低资源消耗,并保持视频帧的连贯性。
忆愿
2024/10/23
2780
🔥 智谱清影 🔥-CogVideoX-2b-部署与使用,带你揭秘生成6s视频的极致体验!
CloudStudio之Flux LoRA训练速通手册
运行中观察Volatile GPU-Util的值,需要大于0,一般是99%或100%。 如果是0,说明停止训练了。
CloudStudio
2025/03/13
1910
丹摩征文活动|CogVideoX-2b部署与AI视频生成的新篇章
CogVideoX-2b展示效果:https://live.csdn.net/v/embed/433472
Eternity._
2024/11/12
1370
丹摩征文活动|CogVideoX-2b部署与AI视频生成的新篇章
【AI落地应用实战】HivisionIDPhotos AI证件照制作实践指南
这里我要推荐的【好事】文章是《深度学习入门指南:一篇文章全解》,在科技日新月异的今天,深度学习的应用越加广泛,引领着智能技术的新一轮革命。本文将从以下四个方面:深度学习的背景历史、主要研究内容、重要分以及其在现实生活中的广泛应用,让读者简单认识一直广受关注的深度学习究竟是什么。
中杯可乐多加冰
2024/11/13
4450
【零绘画基础程序员必学】AI绘画入门笔记03—初识ComfyUI+FlUX
前面介绍的SD的操作界面其实叫做 WebUI,这是SD的入门操作界面,它非常适合初学者快速上手。它的界面简洁,功能展示清晰,很适合用户理解SD的生图方式。
CS逍遥剑仙
2025/04/18
2310
DAMODEL平台实战:CogVideoX-2b模型部署与使用指南
该文章主要记录DAMODEL丹摩智算平台实践过程与心得体会,本次实践的内容为CogVideoX-2b-部署与使用;DAMODEL平台地址为:丹摩DAMODEL|让AI开发更简单!算力租赁上丹摩!
易辰君
2024/11/07
1950
DAMODEL平台实战:CogVideoX-2b模型部署与使用指南
丹摩征文活动|Llama3.1的部署与使用指南
前言:人工智能(AI)技术正以前所未有的速度改变着我们的生活和工作方式。大型语言模型(LLM)作为AI领域的重要分支,以其卓越的自然语言处理能力、强大的知识推理能力和广泛的应用场景,成为了众多企业和开发者关注的焦点。而Llama3.1,作为这一领域的佼佼者,更是以其高效、智能和可扩展的特性,赢得了广泛的赞誉。
Eternity._
2024/11/12
1570
丹摩征文活动|Llama3.1的部署与使用指南
智谱AI:CogVideoX-2b——视频生成模型的得力工具
智谱AI公布了一项激动人心的技术创新:他们决定将他们开发的视频生成模型CogVideoX的源代码对外公开。
Skrrapper
2024/09/24
1990
智谱AI:CogVideoX-2b——视频生成模型的得力工具
实操手册 | 手把手教你搭建 CogVideoX-2b,解锁 6 秒创意短片魔力
https://cloud.tencent.com/developer/article/2465647?shareByChannel=link
FI萤火RE
2024/12/07
2590
实操手册 | 手把手教你搭建 CogVideoX-2b,解锁 6 秒创意短片魔力
DAMODEL丹摩|Llama3.1:从设置到操作,轻松上手全攻略!
开源的大语言模型(LLM)生态系统依然生机勃勃,各种引人注目的模型不断涌现,包括像LLaMA和Alpaca这样的国际项目,以及国内开发的ChatGLM、BaiChuan和InternLM(书生·浦语)等模型。这些创新为开发者提供了在本地进行部署和个性化定制的绝佳机会,使其能够创建具有独特价值的应用程序。
用户11292525
2024/11/21
3100
DAMODEL丹摩|Llama3.1:从设置到操作,轻松上手全攻略!
Llama3.1:从安装到熟练使用的全方位教程
https://cloud.tencent.com/developer/article/2466159?shareByChannel=link
池央
2024/12/04
3920
LLaMA 3.1 模型在DAMODEL平台的部署与实战:打造智能聊天机器人
LLama3.1 是 Meta(Facebook 母公司)发布的系列大语言模型之一,属于 LLaMA(Large Language Model Meta AI)模型系列。LLaMA 模型的目标是通过更高效的设计在保持模型性能的前提下,显著降低其计算和资源需求。LLaMA 3.1 是该系列的最新版本,继承了前面版本,如 LLaMA 1 和 LLaMA 2的许多技术优势,并对模型架构、训练数据和推理能力进行了改进。
易辰君
2024/11/07
1770
LLaMA 3.1 模型在DAMODEL平台的部署与实战:打造智能聊天机器人
推荐阅读
相关推荐
丹摩征文活动|FLUX.1+ComfyUI高效部署策略与实践
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验