该仓库是CNB上运行的index-tts,用于将文本转换为语音。
fork本仓库,点击云原生开发
进入webide后执行./start.sh
默认端口为7860,在启动完毕后端口转发会自动开启公网访问,初次运行需要下载模型,需要一些时间。
source /root/index-tts/.venv/bin/activate
uv run reference.py
reference.py中配置如下参数
text = "Hi,cnb广州meetup的伙伴们大家好,我是水深火乐,一个个人开发者!"
tts.infer(
spk_audio_prompt="voices/Columbina.mp3",
text=text,
output_path="gen.wav",
verbose=True,
)
| 参数说明 | 参数值 |
|---|---|
| spk_audio_prompt | 训练数据源 |
| text | 输出的文本内容 |
| output_path | 输出文件 |
点击洞察->indextts即可访问