logo
124
0
WeChat Login

🎙️ VoxCPM 1.5 语音克隆魔法工坊

🔥 荒哥影视学员专属 · 三界最强语音克隆神器 🔥

CNB云端 GPU加速 Python


🚀 一键启动 · 秒级克隆 · 影视级品质 🚀

只需3秒参考音频,即可完美复刻任意人声


⚡ 核心特色

🎯 零样本语音克隆

  • 仅需 3秒 参考音频
  • 完美复刻音色、语调、情感
  • 支持中英日韩多语言

🚀 秒级生成

  • GPU加速推理
  • 实时流式输出
  • 批量处理支持

🎭 情感控制

  • 喜怒哀乐自由切换
  • 语气强度可调
  • 自然过渡不生硬

🎵 语速调节

  • 0.5x ~ 2.0x 自由调节
  • 保持音质不失真
  • 适配各种场景

🎬 应用场景

场景描述
🎬 影视配音电影、电视剧、纪录片后期配音
📚 有声读物小说、教材、新闻自动朗读
🎮 游戏开发NPC对话、角色配音
📱 短视频抖音、快手、B站内容创作
🎓 在线教育课程讲解、知识分享
🤖 智能助手虚拟主播、AI客服

🚀 一键启动

CNB云端(推荐)

点击下方按钮,选择GPU环境,即可秒级启动:

环境显存消耗推荐
H2096GB32核时/小时大批量处理
L4048GB16核时/小时⭐ 日常使用

💡 首次启动需要安装依赖,约需5-10分钟,后续启动秒开!


🎯 使用指南

1️⃣ 上传参考音频

  • 支持格式:MP3、WAV、FLAC、M4A
  • 建议时长:3-10秒
  • 音质要求:清晰无杂音

2️⃣ 输入目标文本

  • 支持中英日韩混合
  • 自动断句分段
  • 支持SSML标记

3️⃣ 调整参数

  • 🎚️ 语速:0.5x ~ 2.0x
  • 🎭 情感:中性/开心/悲伤/愤怒
  • 🔊 音量:自动归一化

4️⃣ 生成 & 下载

  • 实时预览
  • 一键下载
  • 批量导出

🛠️ 技术架构

┌─────────────────────────────────────────────────────────┐ │ VoxCPM 1.5 架构 │ ├─────────────────────────────────────────────────────────┤ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │ │ 前端UI │───▶│ FastAPI │───▶│ VoxCPM │ │ │ │ Gradio │ │ Server │ │ Model │ │ │ └─────────┘ └─────────┘ └─────────┘ │ │ │ │ │ │ │ ▼ ▼ ▼ │ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │ │ 音频上传 │ │ ASR识别 │ │ GPU推理 │ │ │ │ 文本输入 │ │SenseVoice│ │ L40/H20 │ │ │ └─────────┘ └─────────┘ └─────────┘ │ └─────────────────────────────────────────────────────────┘

核心组件

组件版本说明
VoxCPM1.5核心语音克隆模型
SenseVoiceSmall语音识别ASR
PyTorch2.0+深度学习框架
CUDA12.1GPU加速
Gradio4.0+Web界面

📊 性能指标

指标数值说明
克隆相似度95%+MOS评分
生成速度0.3s/句L40 GPU
支持语言4种中/英/日/韩
最大文本5000字单次生成
参考音频3-30秒推荐3-10秒

🔒 激活说明

CNB云端环境

使用专属云端激活码,无需绑定机器码,每次启动自动激活。

本地Docker环境

  1. 获取机器码
  2. 联系荒哥获取激活码
  3. 输入激活码完成激活

📞 技术支持

渠道联系方式
🎓 学员群荒哥影视学员专属群
📺 B站荒哥影视
💬 微信联系荒哥获取

📝 更新日志

v1.5.0 (2024-12)

  • 🎉 全新VoxCPM 1.5模型
  • ⚡ 推理速度提升50%
  • 🎭 新增情感控制功能
  • 🔊 优化音质输出
  • 🐛 修复已知问题

⚠️ 免责声明

本工具仅供学习研究使用,请勿用于:

  • ❌ 伪造他人声音进行欺诈
  • ❌ 制作虚假新闻或谣言
  • ❌ 侵犯他人肖像权、名誉权
  • ❌ 其他违法违规用途

使用本工具即表示您同意遵守相关法律法规。


🌟 Star 支持一下 🌟

如果觉得好用,请给个 Star ⭐


Made with ❤️ by 荒哥影视

© 2024 荒哥影视 · 仅供学习交流使用

About

No description, topics, or website provided.
HTYF-1.5repo-named
Language
JavaScript54.2%
Python39.1%
Dockerfile2%
CSS1.5%
Others3.2%