- 仅需 3秒 参考音频
- 完美复刻音色、语调、情感
- 支持中英日韩多语言
|
|
|
|
- 0.5x ~ 2.0x 自由调节
- 保持音质不失真
- 适配各种场景
|
| 场景 | 描述 |
|---|
| 🎬 影视配音 | 电影、电视剧、纪录片后期配音 |
| 📚 有声读物 | 小说、教材、新闻自动朗读 |
| 🎮 游戏开发 | NPC对话、角色配音 |
| 📱 短视频 | 抖音、快手、B站内容创作 |
| 🎓 在线教育 | 课程讲解、知识分享 |
| 🤖 智能助手 | 虚拟主播、AI客服 |
点击下方按钮,选择GPU环境,即可秒级启动:
| 环境 | 显存 | 消耗 | 推荐 |
|---|
| H20 | 96GB | 32核时/小时 | 大批量处理 |
| L40 | 48GB | 16核时/小时 | ⭐ 日常使用 |
💡 首次启动需要安装依赖,约需5-10分钟,后续启动秒开!
- 支持格式:MP3、WAV、FLAC、M4A
- 建议时长:3-10秒
- 音质要求:清晰无杂音
- 🎚️ 语速:0.5x ~ 2.0x
- 🎭 情感:中性/开心/悲伤/愤怒
- 🔊 音量:自动归一化
┌─────────────────────────────────────────────────────────┐
│ VoxCPM 1.5 架构 │
├─────────────────────────────────────────────────────────┤
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ 前端UI │───▶│ FastAPI │───▶│ VoxCPM │ │
│ │ Gradio │ │ Server │ │ Model │ │
│ └─────────┘ └─────────┘ └─────────┘ │
│ │ │ │ │
│ ▼ ▼ ▼ │
│ ┌─────────┐ ┌─────────┐ ┌─────────┐ │
│ │ 音频上传 │ │ ASR识别 │ │ GPU推理 │ │
│ │ 文本输入 │ │SenseVoice│ │ L40/H20 │ │
│ └─────────┘ └─────────┘ └─────────┘ │
└─────────────────────────────────────────────────────────┘
| 组件 | 版本 | 说明 |
|---|
| VoxCPM | 1.5 | 核心语音克隆模型 |
| SenseVoice | Small | 语音识别ASR |
| PyTorch | 2.0+ | 深度学习框架 |
| CUDA | 12.1 | GPU加速 |
| Gradio | 4.0+ | Web界面 |
| 指标 | 数值 | 说明 |
|---|
| 克隆相似度 | 95%+ | MOS评分 |
| 生成速度 | 0.3s/句 | L40 GPU |
| 支持语言 | 4种 | 中/英/日/韩 |
| 最大文本 | 5000字 | 单次生成 |
| 参考音频 | 3-30秒 | 推荐3-10秒 |
使用专属云端激活码,无需绑定机器码,每次启动自动激活。
- 获取机器码
- 联系荒哥获取激活码
- 输入激活码完成激活
| 渠道 | 联系方式 |
|---|
| 🎓 学员群 | 荒哥影视学员专属群 |
| 📺 B站 | 荒哥影视 |
| 💬 微信 | 联系荒哥获取 |
- 🎉 全新VoxCPM 1.5模型
- ⚡ 推理速度提升50%
- 🎭 新增情感控制功能
- 🔊 优化音质输出
- 🐛 修复已知问题
本工具仅供学习研究使用,请勿用于:
- ❌ 伪造他人声音进行欺诈
- ❌ 制作虚假新闻或谣言
- ❌ 侵犯他人肖像权、名誉权
- ❌ 其他违法违规用途
使用本工具即表示您同意遵守相关法律法规。
如果觉得好用,请给个 Star ⭐
Made with ❤️ by 荒哥影视
© 2024 荒哥影视 · 仅供学习交流使用