.
├── start.sh              # WebUI 启动脚本
├── reference.py           # Python API 调用示例
├── voices/                # 内置参考音频
│   ├── Arlecchino.mp3     #   阿蕾奇诺
│   ├── Columbina.mp3      #   哥伦比娅
│   └── Mizuki.mp3         #   梦见月瑞希
├── skills/indextts/       # NPC 声音克隆技能
├── configs/               # 配置文件
└── checkpoints/           # 模型文件（首次运行自动下载）

🚀 快速开始

方式一：云原生 WebUI（推荐）

Fork 本仓库
点击「云原生开发」进入 WebIDE
终端中执行：

./start.sh

端口 7860 会自动开启公网访问
⏳ 首次运行需要下载模型（约几分钟），请耐心等待

方式二：Python API 调用

# 进入项目目录
cd /root/index-tts

# 激活虚拟环境
source .venv/bin/activate

# 运行示例
uv run reference.py

编辑 reference.py 自定义文本与参考音频：

from indextts.infer_v2 import IndexTTS2

tts = IndexTTS2(
    cfg_path="/root/index-tts/checkpoints/config.yaml",
    model_dir="/root/index-tts/checkpoints",
    use_fp16=False,
    use_cuda_kernel=False,
    use_deepspeed=False,
)

text = "你好，欢迎使用 IndexTTS 声音克隆！"

tts.infer(
    spk_audio_prompt="voices/Columbina.mp3",  # 参考音频路径
    text=text,                                  # 要合成的文本
    output_path="gen.wav",                      # 输出文件路径
    verbose=True,
)

方式三：NPC 语音合成

在仓库页面点击「洞察 → indextts」即可通过 NPC 对话进行语音合成，支持自然语言描述需求。

🎭 内置角色语音

角色	音频文件	说明
阿蕾奇诺	`voices/Arlecchino.mp3`	原神·仆人
哥伦比娅	`voices/Columbina.mp3`	原神·少女
梦见月瑞希	`voices/Mizuki.mp3`	原神·梦见月瑞希

你也可以使用自己的音频文件（支持 wav、mp3、ogg 等格式）作为参考音频。

⚙️ 参数说明

IndexTTS2 初始化参数

参数	类型	说明
`cfg_path`	string	配置文件路径
`model_dir`	string	模型目录路径
`use_fp16`	bool	半精度推理，减少显存占用（需 GPU 支持）
`use_cuda_kernel`	bool	CUDA 加速内核，显著提升推理速度
`use_deepspeed`	bool	DeepSpeed 加速（大型 GPU 推荐）

合成参数

参数	类型	说明
`spk_audio_prompt`	string	参考音频路径，建议 5~30 秒清晰无噪音音频
`text`	string	要合成的文本，支持中英文混合
`output_path`	string	输出文件路径，默认 WAV 格式
`verbose`	bool	显示详细推理信息