lierwa-2026/ArcReel

Public

WeChat Login

Code Issues Pull requests Events Packages Insights

main

ArcReel/README.md

Pollo<chenrunnan00@gmail.com>

docs: 更新 README 和入门指南，反映多供应商与自定义供应商架构

c1893766

PreviewCode viewBlame

ArcReel

开源 AI 视频生成工作台 — 从小说到短视频，全程 AI Agent 驱动

Open-source AI Video Generation Workspace — Novel to Short Video, Powered by AI Agents

ArcReel 工作台

核心能力

🤖 AI Agent 工作流

基于 Claude Agent SDK，编排 Skill + 聚焦 Subagent 多智能体协作，自动完成从剧本创作到视频合成的完整流水线

🎨 多供应商图像生成

Gemini、火山方舟、Grok、OpenAI 及自定义供应商，角色设计图确保角色一致性，线索追踪保证道具/场景跨镜连贯

🎬 多供应商视频生成

Veo 3.1、Seedance、Grok、Sora 2 及自定义供应商，全局/项目级可切换

⚡ 异步任务队列

RPM 速率限制 + Image/Video 独立并发通道，lease-based 调度，支持断点续传

🖥️ 可视化工作台

Web UI 管理项目、预览素材、版本回滚、实时 SSE 任务追踪，内置 AI 助手

工作流程

快速开始

默认部署（SQLite）


git clone https://github.com/ArcReel/ArcReel.git
cd ArcReel/deploy
cp .env.example .env
docker compose up -d
# 访问 http://localhost:1241

生产部署（PostgreSQL）


cd ArcReel/deploy/production
cp .env.example .env    # 需设置 POSTGRES_PASSWORD
docker compose up -d

首次启动后，使用默认账号登录（用户名 admin，密码在 .env 中通过 AUTH_PASSWORD 设置；未设置则首次启动时自动生成并回写到 .env），前往 设置页（/settings）完成配置：

ArcReel 智能体 — 配置 Anthropic API Key（驱动 AI 助手），支持自定义 Base URL 和模型
AI 生图/生视频 — 配置至少一个供应商的 API Key（Gemini / 火山方舟 / Grok / OpenAI），或添加自定义供应商

📖 详细步骤请参考完整入门教程

功能特性

完整生产流水线 — 小说 → 剧本 → 角色设计 → 分镜图片 → 视频片段 → 成片，一键编排
多智能体架构 — 编排 Skill 检测项目状态并自动调度聚焦 Subagent，每个 Subagent 独立完成一项任务后返回摘要
多供应商支持 — 图片/视频/文本生成均支持 Gemini、火山方舟、Grok、OpenAI 四大预置供应商，全局/项目级可切换
自定义供应商 — 接入任何 OpenAI 兼容 / Google 兼容 API（如 Ollama、vLLM、第三方中转），自动发现可用模型并分配媒体类型，与预置供应商享有同等功能
两种内容模式 — 说书模式（narration）按朗读节奏拆分片段，剧集动画模式（drama）按场景/对话结构组织
渐进式分集规划 — 人机协作切分长篇小说：peek 探测 → Agent 建议断点 → 用户确认 → 物理切分，按需制作
风格参考图 — 上传风格图，AI 自动分析并统一应用到所有图片生成，确保全项目视觉一致
角色一致性 — AI 先生成角色设计图，后续所有分镜和视频均参考该设计
线索追踪 — 关键道具、场景元素标记为"线索"，跨镜头保持视觉连贯
版本历史 — 每次重新生成自动保存历史版本，支持一键回滚
多供应商费用追踪 — 图片/视频/文本全部纳入费用计算，按供应商分策略计费，不同币种分别统计
剪映草稿导出 — 按集导出剪映草稿 ZIP，支持剪映 5.x / 6+（操作指南）
项目导入/导出 — 整个项目打包归档，方便备份和迁移

供应商支持

ArcReel 通过统一的 ImageBackend / VideoBackend / TextBackend 协议，支持多个预置供应商和自定义供应商，可在全局或项目级别切换：

图片供应商

供应商	可用模型	能力	计费方式
Gemini (Google)	Nano Banana 2, Nano Banana Pro	文生图、图生图（多参考图）	按分辨率查表 (USD)
火山方舟	Seedream 5.0, Seedream 5.0 Lite, Seedream 4.5, Seedream 4.0	文生图、图生图	按张计费 (CNY)
Grok (xAI)	Grok Imagine Image, Grok Imagine Image Pro	文生图、图生图	按张计费 (USD)
OpenAI	GPT Image 1.5, GPT Image 1 Mini	文生图、图生图（多参考图）	按张计费 (USD)

视频供应商

供应商	可用模型	能力	计费方式
Gemini (Google)	Veo 3.1, Veo 3.1 Fast, Veo 3.1 Lite	文生视频、图生视频、视频延展、负面提示词	按分辨率 × 时长查表 (USD)
火山方舟	Seedance 1.5 Pro	文生视频、图生视频、音频生成、种子控制、离线推理	按 token 用量 (CNY)
Grok (xAI)	Grok Imagine Video	文生视频、图生视频	按秒计费 (USD)
OpenAI	Sora 2, Sora 2 Pro	文生视频、图生视频	按秒计费 (USD)

文本供应商

供应商	可用模型	能力	计费方式
Gemini (Google)	Gemini 3.1 Flash, Gemini 3.1 Flash Lite, Gemini 3 Pro	文本生成、结构化输出、视觉理解	按 token 用量 (USD)
火山方舟	Doubao Seed 系列	文本生成、结构化输出、视觉理解	按 token 用量 (CNY)
Grok (xAI)	Grok 4.20, Grok 4.1 Fast 系列	文本生成、结构化输出、视觉理解	按 token 用量 (USD)
OpenAI	GPT-5.4, GPT-5.4 Mini, GPT-5.4 Nano	文本生成、结构化输出、视觉理解	按 token 用量 (USD)

自定义供应商

除预置供应商外，可接入任何 OpenAI 兼容 或 Google 兼容 API：

在设置页添加自定义供应商，填入 Base URL 和 API Key
自动调用 /v1/models 发现可用模型，按名称推断媒体类型（图片/视频/文本）
与预置供应商享有同等功能：全局/项目级切换、费用追踪、版本管理

供应商选择优先级：项目级设置 > 全局默认。切换供应商时通用设置（分辨率、宽高比、音频等）直接沿用，供应商特有参数保留。

交流群

扫码加入飞书交流群，获取帮助和最新动态：

飞书交流群二维码

AI 助手架构

ArcReel 的 AI 助手基于 Claude Agent SDK 构建，采用编排 Skill + 聚焦 Subagent 的多智能体架构：

核心设计原则：

编排 Skill（manga-workflow） — 具备状态检测能力，自动判断项目当前阶段（角色设计 / 分集规划 / 预处理 / 剧本生成 / 资产生成），dispatch 对应的 Subagent，支持从任意阶段进入和中断恢复
聚焦 Subagent — 每个 Subagent 只完成一项任务后返回，小说原文等大量上下文留在 Subagent 内部，主 Agent 只收到精炼摘要，保护上下文空间
Skill vs Subagent 边界 — Skill 负责确定性脚本执行（API 调用、文件生成），Subagent 负责需要推理分析的任务（角色提取、剧本规范化）
阶段间确认 — 每个 Subagent 返回后，主 Agent 向用户展示结果摘要并等待确认，确认后才进入下一阶段

OpenClaw 集成

ArcReel 支持通过 OpenClaw 等外部 AI Agent 平台调用，实现自然语言驱动的视频创作：

在 ArcReel 设置页生成 API Key（arc- 前缀）
在 OpenClaw 中加载 ArcReel 的 Skill 定义（访问 http://your-domain/skill.md 自动获取）
通过 OpenClaw 对话即可创建项目、生成剧本、制作视频

技术实现：API Key 认证（Bearer Token）+ 同步 Agent 对话端点（POST /api/v1/agent/chat），内部对接 SSE 流式助手并收集完整响应返回。

技术架构

技术栈

层级	技术
前端	React 19, TypeScript, Tailwind CSS 4, wouter, zustand, Framer Motion, Vite
后端	FastAPI, Python 3.12+, uvicorn, Pydantic 2
AI 智能体	Claude Agent SDK (Skill + Subagent 多智能体架构)
图像生成	Gemini (`google-genai`), 火山方舟 (`volcengine-python-sdk[ark]`), Grok (`xai-sdk`), OpenAI (`openai`)
视频生成	Gemini Veo 3.1 (`google-genai`), 火山方舟 Seedance (`volcengine-python-sdk[ark]`), Grok (`xai-sdk`), OpenAI Sora 2 (`openai`)
文本生成	Gemini (`google-genai`), 火山方舟 (`volcengine-python-sdk[ark]`), Grok (`xai-sdk`), OpenAI (`openai`), Instructor (结构化输出降级)
媒体处理	FFmpeg, Pillow
ORM & 数据库	SQLAlchemy 2.0 (async), Alembic, aiosqlite, asyncpg — SQLite (默认) / PostgreSQL (生产)
认证	JWT (`pyjwt`), API Key (SHA-256 哈希), Argon2 密码哈希 (`pwdlib`)
部署	Docker, Docker Compose（`deploy/` 默认, `deploy/production/` 含 PostgreSQL）

文档

📖 完整入门教程 — 从零开始的手把手指南
📦 剪映草稿导出指南 — 将视频片段导入剪映桌面版进行二次编辑
💰 Google GenAI 费用说明 — Gemini 图像 / Veo 视频生成费用参考
💰 火山方舟费用说明 — 火山方舟图片 / 视频生成费用参考

贡献

欢迎贡献代码、报告 Bug 或提出功能建议！

本地开发环境


# 前置要求：Python 3.12+, Node.js 20+, uv, pnpm, ffmpeg

# 安装依赖
uv sync
cd frontend && pnpm install && cd ..

# 初始化数据库
uv run alembic upgrade head

# 启动后端 (终端 1)
uv run uvicorn server.app:app --reload --port 1241

# 启动前端 (终端 2)
cd frontend && pnpm dev

# 访问 http://localhost:5173

运行测试


# 后端测试
python -m pytest

# 前端类型检查 + 测试
cd frontend && pnpm check

许可证

AGPL-3.0

如果觉得项目有用，请给个 ⭐ Star 支持一下！

35/F,Tencent Building,Kejizhongyi Avenue,Nanshan District,Shenzhen

京ICP备11018762号-111