logo
1
0
WeChat Login
feat: 拆分README为多语言版本,优化文档结构和内容展示

CreatorBox 💸

VitePress Discord Version GitHub stars Google Colab Kaggle

English | 中文

🚀🎬 灵活、高效、可扩展,专属剪辑配音工具箱,释放创作潜力

Web界面

配音/剪辑

🔧 配音✂️ 剪辑
点击观看视频 点击观看视频

视频演示

▶️ 原始▶️ 配音

📦 快速开始

👉 参考使用指南:本地安装 | 远程部署

🎨 适用场景

  • 🎥 自媒体创作者:优化视频配音、翻译、剪辑流程,提升创作效率,释放创作潜力

  • 🌍 多语言翻译/配音:运营海外本地化内容创作、跨语言发布

  • ⚙️ 独立部署:本地部署,灵活配置,保障隐私

🎯 功能特性

  • 🎤 字幕识别

    精准转录视频和音频中的人声,灵活调整配置适应不同设备和场景,确保高质量文本生成

  • 🌐 语言翻译

    多种语言互译,允许切换翻译提供商并调整高级参数,优化翻译效果,轻松跨越语言障碍

  • 🎧 语音合成

    丰富的语音库与定制选项,提供个性化配音体验,满足创作需求,实时试听确保创作精准

  • ✂️ 剪映草稿

    支持将素材导出至剪映,提供画面、声音、字幕等多维度精细控制,助力后期调整与定制

  • 🧩 应用组件

    内置多种应用组件,高效协作,灵活调用,适应不同用户需求

  • 🔧 预览与调试

    提供灵活、高效的配置调整,确保每个环节的完美呈现,提升创作效率与质量

📅 计划支持

字幕

  • 多提供商: 支持 源字幕剪映草稿FunAsrFasterWhisper 切换
  • 自动下载 YoutubeTiktok 视频
  • 视频声音转录文字,提取字幕
  • 人声伴奏贝斯等多音轨分离
  • 声纹提取识别与字幕文字进行对齐
  • 多说话人识别
  • 情感识别:支持 生气厌恶恐惧开心中立其他难过吃惊

翻译

  • 多提供商: 支持 GeminiDashScope 切换
  • 自定义模型,指令提示词
  • 超长文本批次处理

语音

  • 多提供商: 支持 EdgeTTSCosyVoice2F5TTSCoquiTTS切换
  • 语音试听:实时语音合成及试听
  • 音色库:内置 内置视频自定义 3种音色类型
  • 音色克隆:支持 语音克隆语音指令语音转换跨语言克隆 指令

草稿

  • 轨道控制:支持 画面声音字幕 最高 6 个轨道等控制
  • 字幕生成:支持 大小位置颜色描边 字体设置
  • 音量调节:支持 原声说话声背景音乐 音量调节

应用

  • 剪映素材提取:提取草稿中视频、音频、图片等素材
  • 终极人声分离:快速提取人声、伴奏、鼓、贝斯等多轨音频
  • 视频标记去除:去除字幕、水印、角标等视觉元素
  • 视频场景检测:自动识别镜头切换,分段导出片段
  • 视频字幕提取:OCR识别嵌入字幕,生成可编辑文本

其他

  • 配音模式:视频音频自适应 3种模式选择
  • 翻译模式:将视频从原声语言翻译为另一种语言
  • 解说模式:计划中...
  • 自动化投稿

启动服务

server_start