logo
1
0
WeChat Login
wochenlong<oulongchen273@outlook.com>
docs: refresh train monitor screenshots

lora-scripts-next · Anima Trainer

lora-scripts-next

SD-Trainer — LoRA 一键训练 GUI,支持 SD / SDXL / Flux / Anima
基于 kohya-ss/sd-scripts 后端,秋叶系界面体验。

stars forks license release

下载整合包  ·  English  ·  致谢 & 许可


快速开始

Windows 整合包(推荐小白用户)

Releases 下载 SD-Trainer-v2.3.0.7z(~55 MB,含嵌入式 Python),解压后双击 run_gui.bat 即可启动。

首次启动会自动安装 PyTorch + CUDA + 所有依赖(~3 GB 下载),国内用户自动走阿里云/清华镜像加速。

文件用途
run_gui.bat启动训练 GUI(http://127.0.0.1:28000
Update-SD-Trainer.bat从 GitHub 拉取最新代码
Download-Anima-Model.bat从 ModelScope 下载 Anima 基础模型

系统要求: Windows 10/11 64 位,NVIDIA 显卡(RTX 20 系列以上),~7 GB 硬盘空间。

整合包暂不支持 Flash Attention 2(说明)

当前 Windows 整合包(SD-Trainer-v*.7z)不会安装 Flash Attention 2,训练使用 xformers 或 PyTorch SDPA。 这与「装不上」无关,而是便携包运行方式下的刻意取舍

说明
flash-attn 依赖 triton预编译的 flash-attn wheel 能装进环境,但运行时大量算子仍通过 flash_attn.ops.triton 调用 Triton 生成的 CUDA kernel。
嵌入式 Python 跑不好 triton整合包使用 Python Embeddable(python_embeded\),缺少完整编译链;triton / triton-windows 常在首次 JIT 时失败,导致启动或训练崩溃。
不能只卸 triton、保留 flash-attn若只安装 flash-attn 而不装 triton,import 时会报 No module named 'triton'transformers 等库探测到已安装的 flash_attn 也可能仍尝试走 flash 路径。
整合包实际策略首次安装跳过 flash-attn;若用户手动 pip install 了不完整的组合,启动时会自动卸载 flash-attn / triton,并设置 TRANSFORMERS_ATTN_IMPLEMENTATION=sdpa

需要 Flash Attention 2 时: 请使用下方「从源码安装」并按 Flash Attention 2(源码 / venv 用户) 配置;整合包在 embed Python 支持成熟前暂不承诺 flash-attn 加速。

从源码安装

git clone https://github.com/wochenlong/lora-scripts-next.git
cd lora-scripts-next
系统操作
Windows双击 run_gui.bat(首次自动安装依赖,之后直接启动)
Linuxbash install.bash && bash run_gui.sh

启动后浏览器自动打开 **http://127.0.0.1:28000**

Python 版本: 推荐 3.10(所有依赖完美兼容)。3.11–3.12 基本可用,3.13+ 不支持。

常见问题:无法运行 run_gui.ps1 / 未数字签名

这是 Windows PowerShell 执行策略 限制,不是程序坏了。默认策略会拒绝运行未签名的 .ps1 脚本。

做法说明
推荐双击 run_gui.bat(整合包与源码均适用),不要直接运行 run_gui.ps1
临时绕过在 PowerShell 中:powershell -ExecutionPolicy Bypass -File .\run_gui.ps1
长期放宽(可选)Set-ExecutionPolicy -Scope CurrentUser RemoteSigned(仅影响当前用户)

解压后若路径出现 ...\lora-scripts-next-2.3.0\lora-scripts-next-2.3.0\,说明多解压了一层,请进入内层run_gui.bat 的目录再启动。

指定浏览器

默认使用系统浏览器。可通过 --browser 参数指定:

python gui.py --browser chrome
python gui.py --browser edge

Flash Attention 2(源码 / venv 用户)

整合包用户请看上节,不要对 python_embeded 手动安装 flash-attn。

本节适用于:git clone 后使用 venv(或 python\ 目录下的完整 Python),且已安装 PyTorch 2.7.0 + CUDA 12.8 的源码用户。

作用范围
训练类型Flash Attention 2
Anima / SD3 LoRA安装成功且自检通过后,GUI 会自动将 attn_mode 设为 flash(日志:Anima attn_mode auto-detected: flash
SD 1.5 / SDXL / Flux 等主要使用 xformersrequirements.txt 已包含);不依赖 flash-attn wheel

后端优先级(Anima):flashxformerstorch(PyTorch SDPA)。

环境要求
  • Python 3.10(推荐;3.11–3.12 若存在对应预编译 wheel 也可尝试)
  • 64 位 自建 venv不要使用整合包内的 python_embeded
  • PyTorch / CUDA 须与 wheel 匹配:torch==2.7.0+cu128torchvision==0.22.0+cu128
  • Windows 须同时安装 triton-windowsflash-attn(flash-attn 运行时依赖 Triton kernel)
方式一:自动安装(推荐)
  1. 克隆仓库并进入目录,首次运行 run_gui.bat(会执行 install-cn.ps1install.ps1 创建 venv、安装依赖,并尝试安装 flash-attn wheel)。
  2. 之后每次启动时,run_gui.ps1 会检测 triton + flash_attn 是否可用;若缺失,会先装 triton-windows,再装预编译 wheel(失败则回退到 xformers / SDPA,不影响训练)。

国内用户首次安装依赖可用:

powershell -ExecutionPolicy Bypass -File .\install-cn.ps1

国际用户:

powershell -ExecutionPolicy Bypass -File .\install.ps1
方式二:手动安装(Windows)

已激活的 venv 中执行(版本须与项目一致):

.\venv\Scripts\activate

# 1. PyTorch(若尚未安装)
pip install torch==2.7.0+cu128 torchvision==0.22.0+cu128 --index-url https://download.pytorch.org/whl/cu128

# 2. Triton(Windows 必装,且须先于 flash-attn)
pip install "triton-windows<3.4"

# 3. Flash Attention 2 预编译 wheel(Python 3.10 示例)
pip install https://huggingface.co/lldacing/flash-attention-windows-wheel/resolve/main/flash_attn-2.7.4.post1%2Bcu128torch2.7.0cxx11abiFALSE-cp310-cp310-win_amd64.whl
# 国内镜像(将 cp310 改为 cp311 / cp312 若你使用对应 Python 版本)
pip install https://hf-mirror.com/lldacing/flash-attention-windows-wheel/resolve/main/flash_attn-2.7.4.post1%2Bcu128torch2.7.0cxx11abiFALSE-cp310-cp310-win_amd64.whl
方式三:Linux / WSL / AutoDL
bash install.bash    # 创建 venv、安装 torch/xformers/requirements,并尝试 pip install flash-attn --no-build-isolation
bash run_gui.sh

从源码编译 flash-attn 需要 CUDA 工具链与 C++ 编译器;失败时仍会使用 xformers / SDPA。

验证是否安装成功

同一 venv 中运行:

python -c "import triton; import flash_attn; from flash_attn.ops.triton.rotary import apply_rotary; print('Flash Attention 2 OK')"

无报错即表示栈完整。然后启动 python gui.py,训练 Anima LoRA 时在控制台或日志中应看到 attn_modeflash

常见问题
现象处理
No module named 'triton'pip install "triton-windows<3.4"(Windows),再装 flash-attn wheel
wheel 安装成功但训练仍用 xformers运行上方验证命令;若失败说明 triton 与 flash-attn 未配对,勿只保留 flash-attn
pip install flash-attn 编译很久或失败Windows 请改用 预编译 wheel(上表 URL),不要在本机编译
PyTorch 版本不是 2.7+cu128wheel 与 CUDA 标签不匹配,请对齐 install.ps1 中的 torch 版本后再装 flash-attn
在整合包 python_embeded 里安装不支持,请改用源码 + venv

功能亮点

  • 多模型支持 — SD 1.5 / SDXL / Flux / Anima 全部开箱即用
  • Anima LoRA 训练 — 侧边栏一键进入,支持 LoRA / LoKr(LyCORIS)/ T-LoRA
  • Attention 加速 — 自动选择后端:源码/venv 环境优先 Flash Attention 2(Windows 预编译 wheel);整合包使用 xformers / PyTorch SDPA(暂不支持 flash-attn
  • T-LoRA — 基于扩散时间步的动态 Rank LoRA,正交初始化,防止过拟合(论文
  • 训练监控页 — 随 GUI 自动启动,展示 TensorBoard 同源 Loss / LR 曲线、关键训练参数速查、实时进度、终端日志同步和预览图
  • TensorBoard 内置 — 侧边栏直接查看,无需额外操作
  • 显卡检测 — 首次安装自动检测 NVIDIA / AMD 显卡,AMD 用户会收到友好提示及 ROCm 方案指引
  • AutoDL 适配 — 提供专用启动脚本 start_autodl.sh

界面预览

训练监控 Loss 曲线

6008 训练监控页中的 TensorBoard 同源 Loss / LR 四宫格曲线

训练监控预览图

训练预览图会直接同步到监控页

训练日志查看

训练日志同时显示在 CMD 终端与监控页


详细文档

主题链接
Anima LoRA 训练指南docs/anima-training.md
训练监控 & SSE 接口docs/train-monitor.md
前端定制docs/frontend-customization.md
Docker 部署docs/docker.md
程序参数一览docs/cli-args.md

更新日志
日期内容
2026-05-20v2.3.0 — 训练监控体验升级:TensorBoard 同源 Loss/LR 四宫格、关键参数速查、端口冲突自动回退、终端日志同步、后台轮询日志静默
2026-05-19v2.2.0 — 整合包 flash-attn/triton 治本、run_gui.bat 执行策略与闪退日志、跨盘训练监控、品牌/logo、CONTRIBUTORS.md
2026-05-19v2.1.0 — Flash Attention 2 Windows 预编译 wheel(无需 C++ 编译器)、按步数保存模型、修复 LoKr conv_dim/conv_alpha 传入 undefined 的 bug
2026-05-18v2.0.0 — 整合包发布、Flash Attention 2 自动加速、AMD 显卡检测、自动修复 bf16/fp16 精度问题、--browser chrome/edge 指定浏览器、移除子模块改为直接包含 sd-scripts、启动时自动检查更新
2026-05-18T-LoRA 训练支持、交互式 Loss 图表、LoKr 标准化、Windows 便携包、AutoDL 脚本
2026-05-17Anima 训练后端完全迁移至 kohya-ss/sd-scripts
2026-05-06训练监控页重构:实时 Loss 卡片 + 粘性滚动
致谢 & 上游
项目角色
Akegarasu/lora-scriptsGUI 框架与一键训练体验("秋叶式")
kohya-ss/sd-scripts核心训练后端
KohakuBlueleaf/LyCORISLoKr / LoHa 网络模块(Apache-2.0)
ControlGenAI/T-LoRA时间步动态 LoRA(MIT, AIRI)
bluvoll/Akegarasu-lora-scripts-RFSDXL Rectified Flow 参考

完整归属见 NOTICE.md


贡献者

详见 CONTRIBUTORS.md


维护者:@wochenlong