|
|
|
|
| 场景 | 描述 |
|---|---|
| 🎬 影视配音 | 电影、电视剧、纪录片后期配音 |
| 📚 有声读物 | 小说、教材、新闻自动朗读 |
| 🎮 游戏开发 | NPC对话、角色配音 |
| 📱 短视频 | 抖音、快手、B站内容创作 |
| 🎓 在线教育 | 课程讲解、知识分享 |
| 🤖 智能助手 | 虚拟主播、AI客服 |
点击下方按钮,选择GPU环境,即可秒级启动:
| 环境 | 显存 | 消耗 | 推荐 |
|---|---|---|---|
| H20 | 96GB | 32核时/小时 | 大批量处理 |
| L40 | 48GB | 16核时/小时 | ⭐ 日常使用 |
💡 首次启动需要安装依赖,约需5-10分钟,后续启动秒开!
┌─────────────────────────────────────────────────────────┐ │ VoxCPM 1.5 架构 │ ├─────────────────────────────────────────────────────────┤ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │ │ 前端UI │───▶│ FastAPI │───▶│ VoxCPM │ │ │ │ Gradio │ │ Server │ │ Model │ │ │ └─────────┘ └─────────┘ └─────────┘ │ │ │ │ │ │ │ ▼ ▼ ▼ │ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │ │ 音频上传 │ │ ASR识别 │ │ GPU推理 │ │ │ │ 文本输入 │ │SenseVoice│ │ L40/H20 │ │ │ └─────────┘ └─────────┘ └─────────┘ │ └─────────────────────────────────────────────────────────┘
| 组件 | 版本 | 说明 |
|---|---|---|
| VoxCPM | 1.5 | 核心语音克隆模型 |
| SenseVoice | Small | 语音识别ASR |
| PyTorch | 2.0+ | 深度学习框架 |
| CUDA | 12.1 | GPU加速 |
| Gradio | 4.0+ | Web界面 |
| 指标 | 数值 | 说明 |
|---|---|---|
| 克隆相似度 | 95%+ | MOS评分 |
| 生成速度 | 0.3s/句 | L40 GPU |
| 支持语言 | 4种 | 中/英/日/韩 |
| 最大文本 | 5000字 | 单次生成 |
| 参考音频 | 3-30秒 | 推荐3-10秒 |
使用专属云端激活码,无需绑定机器码,每次启动自动激活。
| 渠道 | 联系方式 |
|---|---|
| 🎓 学员群 | 荒哥影视学员专属群 |
| 📺 B站 | 荒哥影视 |
| 💬 微信 | 联系荒哥获取 |
本工具仅供学习研究使用,请勿用于:
使用本工具即表示您同意遵守相关法律法规。