| 基于 Claude Agent SDK,编排 Skill + 聚焦 Subagent 多智能体协作,自动完成从剧本创作到视频合成的完整流水线 | Gemini、火山方舟、Grok、OpenAI 及自定义供应商,角色设计图确保角色一致性,线索追踪保证道具/场景跨镜连贯 | Veo 3.1、Seedance、Grok、Sora 2 及自定义供应商,全局/项目级可切换 | RPM 速率限制 + Image/Video 独立并发通道,lease-based 调度,支持断点续传 | Web UI 管理项目、预览素材、版本回滚、实时 SSE 任务追踪,内置 AI 助手 |
git clone https://github.com/ArcReel/ArcReel.git
cd ArcReel/deploy
cp .env.example .env
docker compose up -d
# 访问 http://localhost:1241
cd ArcReel/deploy/production
cp .env.example .env # 需设置 POSTGRES_PASSWORD
docker compose up -d
首次启动后,使用默认账号登录(用户名 admin,密码在 .env 中通过 AUTH_PASSWORD 设置;未设置则首次启动时自动生成并回写到 .env),前往 设置页(/settings)完成配置:
📖 详细步骤请参考 完整入门教程
ArcReel 通过统一的 ImageBackend / VideoBackend / TextBackend 协议,支持多个预置供应商和自定义供应商,可在全局或项目级别切换:
| 供应商 | 可用模型 | 能力 | 计费方式 |
|---|---|---|---|
| Gemini (Google) | Nano Banana 2, Nano Banana Pro | 文生图、图生图(多参考图) | 按分辨率查表 (USD) |
| 火山方舟 | Seedream 5.0, Seedream 5.0 Lite, Seedream 4.5, Seedream 4.0 | 文生图、图生图 | 按张计费 (CNY) |
| Grok (xAI) | Grok Imagine Image, Grok Imagine Image Pro | 文生图、图生图 | 按张计费 (USD) |
| OpenAI | GPT Image 1.5, GPT Image 1 Mini | 文生图、图生图(多参考图) | 按张计费 (USD) |
| 供应商 | 可用模型 | 能力 | 计费方式 |
|---|---|---|---|
| Gemini (Google) | Veo 3.1, Veo 3.1 Fast, Veo 3.1 Lite | 文生视频、图生视频、视频延展、负面提示词 | 按分辨率 × 时长查表 (USD) |
| 火山方舟 | Seedance 1.5 Pro | 文生视频、图生视频、音频生成、种子控制、离线推理 | 按 token 用量 (CNY) |
| Grok (xAI) | Grok Imagine Video | 文生视频、图生视频 | 按秒计费 (USD) |
| OpenAI | Sora 2, Sora 2 Pro | 文生视频、图生视频 | 按秒计费 (USD) |
| 供应商 | 可用模型 | 能力 | 计费方式 |
|---|---|---|---|
| Gemini (Google) | Gemini 3.1 Flash, Gemini 3.1 Flash Lite, Gemini 3 Pro | 文本生成、结构化输出、视觉理解 | 按 token 用量 (USD) |
| 火山方舟 | Doubao Seed 系列 | 文本生成、结构化输出、视觉理解 | 按 token 用量 (CNY) |
| Grok (xAI) | Grok 4.20, Grok 4.1 Fast 系列 | 文本生成、结构化输出、视觉理解 | 按 token 用量 (USD) |
| OpenAI | GPT-5.4, GPT-5.4 Mini, GPT-5.4 Nano | 文本生成、结构化输出、视觉理解 | 按 token 用量 (USD) |
除预置供应商外,可接入任何 OpenAI 兼容 或 Google 兼容 API:
/v1/models 发现可用模型,按名称推断媒体类型(图片/视频/文本)供应商选择优先级:项目级设置 > 全局默认。切换供应商时通用设置(分辨率、宽高比、音频等)直接沿用,供应商特有参数保留。
扫码加入飞书交流群,获取帮助和最新动态:
ArcReel 的 AI 助手基于 Claude Agent SDK 构建,采用编排 Skill + 聚焦 Subagent 的多智能体架构:
核心设计原则:
ArcReel 支持通过 OpenClaw 等外部 AI Agent 平台调用,实现自然语言驱动的视频创作:
arc- 前缀)http://your-domain/skill.md 自动获取)技术实现:API Key 认证(Bearer Token)+ 同步 Agent 对话端点(POST /api/v1/agent/chat),内部对接 SSE 流式助手并收集完整响应返回。
| 层级 | 技术 |
|---|---|
| 前端 | React 19, TypeScript, Tailwind CSS 4, wouter, zustand, Framer Motion, Vite |
| 后端 | FastAPI, Python 3.12+, uvicorn, Pydantic 2 |
| AI 智能体 | Claude Agent SDK (Skill + Subagent 多智能体架构) |
| 图像生成 | Gemini (google-genai), 火山方舟 (volcengine-python-sdk[ark]), Grok (xai-sdk), OpenAI (openai) |
| 视频生成 | Gemini Veo 3.1 (google-genai), 火山方舟 Seedance (volcengine-python-sdk[ark]), Grok (xai-sdk), OpenAI Sora 2 (openai) |
| 文本生成 | Gemini (google-genai), 火山方舟 (volcengine-python-sdk[ark]), Grok (xai-sdk), OpenAI (openai), Instructor (结构化输出降级) |
| 媒体处理 | FFmpeg, Pillow |
| ORM & 数据库 | SQLAlchemy 2.0 (async), Alembic, aiosqlite, asyncpg — SQLite (默认) / PostgreSQL (生产) |
| 认证 | JWT (pyjwt), API Key (SHA-256 哈希), Argon2 密码哈希 (pwdlib) |
| 部署 | Docker, Docker Compose(deploy/ 默认, deploy/production/ 含 PostgreSQL) |
欢迎贡献代码、报告 Bug 或提出功能建议!
# 前置要求:Python 3.12+, Node.js 20+, uv, pnpm, ffmpeg
# 安装依赖
uv sync
cd frontend && pnpm install && cd ..
# 初始化数据库
uv run alembic upgrade head
# 启动后端 (终端 1)
uv run uvicorn server.app:app --reload --port 1241
# 启动前端 (终端 2)
cd frontend && pnpm dev
# 访问 http://localhost:5173
# 后端测试
python -m pytest
# 前端类型检查 + 测试
cd frontend && pnpm check
如果觉得项目有用,请给个 ⭐ Star 支持一下!