Stable Diffusion怎么训练LoRA SD模型LoRA炼丹详细全流程【教程】

admin 百科 15
LoRA模型训练需七步:一、确认NVIDIA显卡≥6GB显存、CUDA可用、Python 3.10;二、下载部署kohya_ss;三、准备15–30张高质量正方形图像;四、用BLIP/DeepBooru打标并优化;五、配置SD1.5基模、LoRA参数(Dim=128, Alpha=64);六、启动训练并监控显存与日志;七、在SD WebUI中加载测试,权重设0.8–1.2并含触发词。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Stable Diffusion怎么训练LoRA SD模型LoRA炼丹详细全流程【教程】-第1张图片-佛山资讯网

如果您已安装 Stable Diffusion WebUI 并希望训练专属 LoRA 模型,但对数据准备、参数配置与训练流程不熟悉,则可能是由于缺乏标准化操作路径导致训练失败或效果不佳。以下是完成 LoRA 模型训练的全流程步骤:

一、确认硬件与基础环境

LoRA 训练对 GPU 显存和 CUDA 兼容性有明确要求,本地训练需确保显卡驱动与 Python 环境满足最低依赖。未达标的设备将无法启动训练进程或中途崩溃。

1、检查显卡型号是否为 NVIDIA 系列,且显存 ≥ 6GB;

2、运行 nvidia-smi 命令验证驱动状态与 CUDA 可见性;

3、确认 Python 版本为 3.10.x,避免使用 3.11 或更高版本引发 kohya_ss 兼容异常;

4、若使用 Windows 系统,需提前安装 Microsoft Visual C++ 2019 Redistributable;

5、在命令行中执行 python -c "import torch; print(torch.cuda.is_available())",返回 True 表示 CUDA 正常启用。

二、下载并部署训练工具包

kohya_ss 是当前最主流的 LoRA 训练 WebUI,它封装了全部训练脚本与前端界面,无需手动编写训练命令,大幅降低入门门槛。

1、访问 GitHub 官方仓库:https://github.com/kohya-ss/sd-scripts

2、点击绿色 Code 按钮 → Download ZIP,保存至非系统盘(如 D:\kohya);

3、解压后进入目录,双击运行 setup_windows.bat(Windows)或 setup_linux.sh(Linux);

4、等待自动安装依赖库,过程中出现多次 yes/no 提示时,全部按回车接受默认选项;

5、安装完成后,双击 gui.bat 启动 WebUI,浏览器自动打开 http://127.0.0.1:7860。

三、准备高质量训练图像集

图像质量与多样性直接决定 LoRA 复刻精度。低分辨率、模糊、背景杂乱或角度单一的图片将导致模型泛化能力差,无法稳定生成指定特征。

1、收集 15–30 张目标主体图像,涵盖正面、侧面、半身、全身、不同光照与表情;

2、统一裁剪为正方形,推荐尺寸为 512×512 像素,使用在线工具或 Python PIL 批量处理;

3、对真人图像建议使用 AI 抠图工具(如 rembg 或阿里云 API)去除背景,仅保留主体;

4、将所有图像保存至新建文件夹,例如 D:\lora_train\input\,禁止中文路径与空格;

5、命名采用纯英文+数字,如 chara_01.pngchara_02.png,避免特殊符号。

四、图像自动打标与标签优化

标签是模型理解图像语义的关键输入,错误或冗余标签会干扰特征学习。BLIP 适用于写实类图像,DeepBooru 更适合二次元风格,需按需选择。

1、在 WebUI 左侧导航栏点击 Image Captioning

2、设置输入目录为刚才创建的 input 文件夹,输出目录设为同级 captioned 文件夹;

3、模型选择 BLIP(真人)或 DeepBooru(二次元),勾选 Overwrite existing captions

4、点击 Run 开始批量生成 .txt 标签文件;

标签: linux python redis 前端 git windows github 显卡 浏览器 工具 阿里云 nvidi

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~