首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >集团内部lora模型微调-纯CPU训练-数据集准备-分享篇

集团内部lora模型微调-纯CPU训练-数据集准备-分享篇

原创
作者头像
高老师
发布2025-07-11 18:46:30
发布2025-07-11 18:46:30
21700
代码可运行
举报
运行总次数:0
代码可运行

第一步:图片收集与筛选 (教学材料的核心)

1. 我需要准备哪些类型的图片?

您需要的是能够充分、纯粹地代表您品牌核心风格的图片。

  • 来源
    • 产品画册 (Lookbook):这是最佳来源!图片质量高,风格统一,背景干净。
    • 电商网站产品图:也非常棒,特别是白底或纯色背景的模特图和商品平铺图。
    • 品牌广告大片:可以使用,但要小心。如果背景过于花哨或艺术化,可能会干扰模型学习服装本身。
    • 线下秀场图:可用,但要筛选掉背景复杂、灯光怪异、抓拍模糊的图片。
  • 筛选标准 (非常重要!)
    • 高清晰度:图片必须清晰,能看清服装的轮廓、颜色、材质和细节。最低分辨率建议 1024x1024 像素以上。
    • 主体突出:服装应该是图片的主角。避免多人合照、服装被严重遮挡、或者人物太小看不清的图片。
    • 风格统一:所有图片都应该能体现您品牌一以贯之的设计语言。不要混入其他品牌的图片,这会导致“风格污染”,让AI学串味了。
    • 背景简洁:优先选择纯色背景(白、灰、黑)或简洁的室内外场景。复杂的背景会成为“噪音”,让AI分心。
    • 多样性与平衡:在保持风格统一的前提下,尽量让您的“教学材料”丰富多样。
      • 产品类别:如果您的品牌有连衣裙、衬衫、裤子,都应该包含一些。但如果您只想先训练一个“连衣裙模型”,那就只用连衣裙的图片。
      • 设计元素:包含不同颜色、不同袖长、不同领型、不同裙摆的款式。
      • 拍摄角度:最好有正面、侧面、背面的视图,但以正面全身或半身照为主。
  • 数量:对于LoRA训练,20到50张高质量的图片是一个非常好的起点。少于15张可能效果不佳,多于100张对于CPU训练来说可能过于漫长。质量远比数量重要

第二步:图片处理 (统一教学材料的格式)

  1. 裁剪与尺寸调整
    • 将所有图片统一处理成正方形,推荐尺寸为 1024x1024 像素
    • 裁剪时,确保服装主体位于画面中央。如果原始图片不是正方形,可以先裁剪再用白色或黑色填充两侧,使其变成正方形。
  2. 文件命名
    • 使用简单、连续的英文名。例如:
      • mybrand_dress_001
      • mybrand_dress_002
      • ...
      • mybrand_dress_030
  3. 文件格式
    • 将所有图片保存为 .png.jpg 格式。.png 更常用。

第三步:精细化标注 (为每份材料写“注释”)

这是整个过程中最耗时但价值最高的部分。您需要为每一张图片创建一个与之同名.txt 文本文件。

黄金法则: 图片 mybrand_dress_001.png 必须对应一个 mybrand_dress_001.txt 文件。

文本文件 (.txt) 的内部格式:

文件内容是一系列用英文逗号隔开的标签 (tags)。这些标签就是您给AI助理看的“注释”。我们将注释分为两大部分:

A部分:触发词 (Trigger Word) - “这是我们的风格暗号”

  • 这是最重要的标签,必须出现在每一个 .txt 文件的开头
  • 它应该是一个独特的、现实世界中不存在的词。这是为了防止和模型已有的知识冲突。
  • 格式建议:品牌名_产品类别_style。例如:ellassay_dress_style
  • 这个触发词在所有标签文件中必须完全一致!

B部分:描述性标签 (Descriptive Tags) - “这件衣服具体长什么样”

这部分是向AI描述图片中的具体内容,让它学会把“风格”和“具体设计元素”分离开。这样,以后你就可以通过改变这些描述性标签来自由组合设计了。

建议的标签类别:

  1. 主体内容: 1girl (一个女孩), solo (单人), full body (全身照), upper body (半身照)
  2. 基础属性:
    • 季节: spring, summer, autumn, winter
    • 场合: business occasion, casual wear, evening party, daily wear
  3. 服装核心设计元素:
    • 廓形 (Silhouette): a-line silhouette, h-line silhouette, x-line silhouette (收腰款), cocoon silhouette (茧型)
    • 颜色 (Color): white color, beige color, black, light blue, plaid pattern (格纹), floral print (印花)
    • 材质 (Material): silk material, cotton fabric, chiffon, wool, denim
    • 领型 (Collar): stand-up collar (立领), v-neck, round neck (圆领), lapel collar (翻领)
    • 袖型 (Sleeve): sleeveless (无袖), short sleeves (短袖), long sleeves (长袖), puff sleeves (泡泡袖)
    • 裙长 (Length): mini length (超短), knee length (及膝), maxi length (及踝长裙)
    • 其他细节: with belt (有腰带), ruffle details (荷叶边), pleated (褶皱)
示例演示

假设我们有两张图片:

图片1: ellassay_dress_001.png

  • 是一条米色的、真丝材质的、立领无袖A字连衣裙,适合商务场合。

对应的 ellassay_dress_001.txt 内容应该是:

代码语言:javascript
代码运行次数:0
运行
复制
<TEXT>ellassay_dress_style, 1girl, solo, full body, business occasion, a-line silhouette, beige color, silk material, stand-up collar, sleeveless, knee length

图片2: ellassay_dress_002.png

  • 是一条黑色的、棉质的、有泡泡袖的、V领H型连衣裙,适合日常穿着。

对应的 ellassay_dress_002.txt 内容应该是:

代码语言:javascript
代码运行次数:0
运行
复制
<TEXT>ellassay_dress_style, 1girl, solo, upper body, daily wear, h-line silhouette, black color, cotton fabric, v-neck, puff sleeves

关键点回顾

  • ellassay_dress_style 这个触发词在两个文件中都一样,且在最前面。
  • 后面的描述性标签根据每张图片的内容而变化
  • 所有标签都用小写英文,单词之间用下划线 _ 或直接连写,标签与标签之间用逗号 , 隔开。

第四步:整理最终的训练文件夹

完成以上所有步骤后,您需要创建一个最终的文件夹结构,以便训练脚本能够读取它。

创建一个主数据集文件夹,例如 my_dataset。

在里面再创建一个子文件夹,这个子文件夹的命名有特殊格式要求,但为了简单,我们直接用触发词命名,例如 ellassay_dress。

将你处理好的所有 .png 图片和 .txt 标签文件,全部放进这个子文件夹里。

最终的文件夹结构应该是这样的:

<TEXT>

/home/your_user/my_dataset/

└── ellassay_dress/

├── ellassay_dress_001.png

├── ellassay_dress_001.txt

├── ellassay_dress_002.png

├── ellassay_dress_002.txt

├── ellassay_dress_003.png

├── ellassay_dress_003.txt

│ ...

├── ellassay_dress_030.png

└── ellassay_dress_030.txt

这个 ellassay_dress 文件夹,就是你在第四阶段训练命令中 --train_data_dir 参数需要指向的路径。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 第一步:图片收集与筛选 (教学材料的核心)
    • 1. 我需要准备哪些类型的图片?
  • 第二步:图片处理 (统一教学材料的格式)
  • 第三步:精细化标注 (为每份材料写“注释”)
    • 文本文件 (.txt) 的内部格式:
    • 示例演示
  • 第四步:整理最终的训练文件夹
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档