logo
0
0
WeChat Login
Pollo<chenrunnan00@gmail.com>
docs: 更新 README 和入门指南,反映多供应商与自定义供应商架构


ArcReel Logo
ArcReel

开源 AI 视频生成工作台 — 从小说到短视频,全程 AI Agent 驱动

Open-source AI Video Generation Workspace — Novel to Short Video, Powered by AI Agents

Quick Start License Stars Docker Tests

Python React FastAPI Claude Agent SDK Gemini 火山方舟 Grok OpenAI

ArcReel 工作台


核心能力

🤖 AI Agent 工作流

基于 Claude Agent SDK,编排 Skill + 聚焦 Subagent 多智能体协作,自动完成从剧本创作到视频合成的完整流水线

🎨 多供应商图像生成

Gemini火山方舟GrokOpenAI 及自定义供应商,角色设计图确保角色一致性,线索追踪保证道具/场景跨镜连贯

🎬 多供应商视频生成

Veo 3.1SeedanceGrokSora 2 及自定义供应商,全局/项目级可切换

⚡ 异步任务队列

RPM 速率限制 + Image/Video 独立并发通道,lease-based 调度,支持断点续传

🖥️ 可视化工作台

Web UI 管理项目、预览素材、版本回滚、实时 SSE 任务追踪,内置 AI 助手

工作流程

快速开始

默认部署(SQLite)

git clone https://github.com/ArcReel/ArcReel.git cd ArcReel/deploy cp .env.example .env docker compose up -d # 访问 http://localhost:1241

生产部署(PostgreSQL)

cd ArcReel/deploy/production cp .env.example .env # 需设置 POSTGRES_PASSWORD docker compose up -d

首次启动后,使用默认账号登录(用户名 admin,密码在 .env 中通过 AUTH_PASSWORD 设置;未设置则首次启动时自动生成并回写到 .env),前往 设置页/settings)完成配置:

  1. ArcReel 智能体 — 配置 Anthropic API Key(驱动 AI 助手),支持自定义 Base URL 和模型
  2. AI 生图/生视频 — 配置至少一个供应商的 API Key(Gemini / 火山方舟 / Grok / OpenAI),或添加自定义供应商

📖 详细步骤请参考 完整入门教程

功能特性

  • 完整生产流水线 — 小说 → 剧本 → 角色设计 → 分镜图片 → 视频片段 → 成片,一键编排
  • 多智能体架构 — 编排 Skill 检测项目状态并自动调度聚焦 Subagent,每个 Subagent 独立完成一项任务后返回摘要
  • 多供应商支持 — 图片/视频/文本生成均支持 Gemini、火山方舟、Grok、OpenAI 四大预置供应商,全局/项目级可切换
  • 自定义供应商 — 接入任何 OpenAI 兼容 / Google 兼容 API(如 Ollama、vLLM、第三方中转),自动发现可用模型并分配媒体类型,与预置供应商享有同等功能
  • 两种内容模式 — 说书模式(narration)按朗读节奏拆分片段,剧集动画模式(drama)按场景/对话结构组织
  • 渐进式分集规划 — 人机协作切分长篇小说:peek 探测 → Agent 建议断点 → 用户确认 → 物理切分,按需制作
  • 风格参考图 — 上传风格图,AI 自动分析并统一应用到所有图片生成,确保全项目视觉一致
  • 角色一致性 — AI 先生成角色设计图,后续所有分镜和视频均参考该设计
  • 线索追踪 — 关键道具、场景元素标记为"线索",跨镜头保持视觉连贯
  • 版本历史 — 每次重新生成自动保存历史版本,支持一键回滚
  • 多供应商费用追踪 — 图片/视频/文本全部纳入费用计算,按供应商分策略计费,不同币种分别统计
  • 剪映草稿导出 — 按集导出剪映草稿 ZIP,支持剪映 5.x / 6+(操作指南
  • 项目导入/导出 — 整个项目打包归档,方便备份和迁移

供应商支持

ArcReel 通过统一的 ImageBackend / VideoBackend / TextBackend 协议,支持多个预置供应商和自定义供应商,可在全局或项目级别切换:

图片供应商

供应商可用模型能力计费方式
Gemini (Google)Nano Banana 2, Nano Banana Pro文生图、图生图(多参考图)按分辨率查表 (USD)
火山方舟Seedream 5.0, Seedream 5.0 Lite, Seedream 4.5, Seedream 4.0文生图、图生图按张计费 (CNY)
Grok (xAI)Grok Imagine Image, Grok Imagine Image Pro文生图、图生图按张计费 (USD)
OpenAIGPT Image 1.5, GPT Image 1 Mini文生图、图生图(多参考图)按张计费 (USD)

视频供应商

供应商可用模型能力计费方式
Gemini (Google)Veo 3.1, Veo 3.1 Fast, Veo 3.1 Lite文生视频、图生视频、视频延展、负面提示词按分辨率 × 时长查表 (USD)
火山方舟Seedance 1.5 Pro文生视频、图生视频、音频生成、种子控制、离线推理按 token 用量 (CNY)
Grok (xAI)Grok Imagine Video文生视频、图生视频按秒计费 (USD)
OpenAISora 2, Sora 2 Pro文生视频、图生视频按秒计费 (USD)

文本供应商

供应商可用模型能力计费方式
Gemini (Google)Gemini 3.1 Flash, Gemini 3.1 Flash Lite, Gemini 3 Pro文本生成、结构化输出、视觉理解按 token 用量 (USD)
火山方舟Doubao Seed 系列文本生成、结构化输出、视觉理解按 token 用量 (CNY)
Grok (xAI)Grok 4.20, Grok 4.1 Fast 系列文本生成、结构化输出、视觉理解按 token 用量 (USD)
OpenAIGPT-5.4, GPT-5.4 Mini, GPT-5.4 Nano文本生成、结构化输出、视觉理解按 token 用量 (USD)

自定义供应商

除预置供应商外,可接入任何 OpenAI 兼容Google 兼容 API:

  • 在设置页添加自定义供应商,填入 Base URL 和 API Key
  • 自动调用 /v1/models 发现可用模型,按名称推断媒体类型(图片/视频/文本)
  • 与预置供应商享有同等功能:全局/项目级切换、费用追踪、版本管理

供应商选择优先级:项目级设置 > 全局默认。切换供应商时通用设置(分辨率、宽高比、音频等)直接沿用,供应商特有参数保留。

交流群

扫码加入飞书交流群,获取帮助和最新动态:

飞书交流群二维码

AI 助手架构

ArcReel 的 AI 助手基于 Claude Agent SDK 构建,采用编排 Skill + 聚焦 Subagent 的多智能体架构:

核心设计原则

  • 编排 Skill(manga-workflow) — 具备状态检测能力,自动判断项目当前阶段(角色设计 / 分集规划 / 预处理 / 剧本生成 / 资产生成),dispatch 对应的 Subagent,支持从任意阶段进入和中断恢复
  • 聚焦 Subagent — 每个 Subagent 只完成一项任务后返回,小说原文等大量上下文留在 Subagent 内部,主 Agent 只收到精炼摘要,保护上下文空间
  • Skill vs Subagent 边界 — Skill 负责确定性脚本执行(API 调用、文件生成),Subagent 负责需要推理分析的任务(角色提取、剧本规范化)
  • 阶段间确认 — 每个 Subagent 返回后,主 Agent 向用户展示结果摘要并等待确认,确认后才进入下一阶段

OpenClaw 集成

ArcReel 支持通过 OpenClaw 等外部 AI Agent 平台调用,实现自然语言驱动的视频创作:

  1. 在 ArcReel 设置页生成 API Key(arc- 前缀)
  2. 在 OpenClaw 中加载 ArcReel 的 Skill 定义(访问 http://your-domain/skill.md 自动获取)
  3. 通过 OpenClaw 对话即可创建项目、生成剧本、制作视频

技术实现:API Key 认证(Bearer Token)+ 同步 Agent 对话端点(POST /api/v1/agent/chat),内部对接 SSE 流式助手并收集完整响应返回。

技术架构

技术栈

层级技术
前端React 19, TypeScript, Tailwind CSS 4, wouter, zustand, Framer Motion, Vite
后端FastAPI, Python 3.12+, uvicorn, Pydantic 2
AI 智能体Claude Agent SDK (Skill + Subagent 多智能体架构)
图像生成Gemini (google-genai), 火山方舟 (volcengine-python-sdk[ark]), Grok (xai-sdk), OpenAI (openai)
视频生成Gemini Veo 3.1 (google-genai), 火山方舟 Seedance (volcengine-python-sdk[ark]), Grok (xai-sdk), OpenAI Sora 2 (openai)
文本生成Gemini (google-genai), 火山方舟 (volcengine-python-sdk[ark]), Grok (xai-sdk), OpenAI (openai), Instructor (结构化输出降级)
媒体处理FFmpeg, Pillow
ORM & 数据库SQLAlchemy 2.0 (async), Alembic, aiosqlite, asyncpg — SQLite (默认) / PostgreSQL (生产)
认证JWT (pyjwt), API Key (SHA-256 哈希), Argon2 密码哈希 (pwdlib)
部署Docker, Docker Compose(deploy/ 默认, deploy/production/ 含 PostgreSQL)

文档

贡献

欢迎贡献代码、报告 Bug 或提出功能建议!

本地开发环境

# 前置要求:Python 3.12+, Node.js 20+, uv, pnpm, ffmpeg # 安装依赖 uv sync cd frontend && pnpm install && cd .. # 初始化数据库 uv run alembic upgrade head # 启动后端 (终端 1) uv run uvicorn server.app:app --reload --port 1241 # 启动前端 (终端 2) cd frontend && pnpm dev # 访问 http://localhost:5173

运行测试

# 后端测试 python -m pytest # 前端类型检查 + 测试 cd frontend && pnpm check

许可证

AGPL-3.0


如果觉得项目有用,请给个 ⭐ Star 支持一下!