文本转语音
1. 生成语音
POST /generate
将文本转换为语音的主要端点。
请求体
json
{
"mode": "sft",
"tts_text": "要转换为语音的文本",
"sft_spk": "中文女",
"prompt_text": "提示文本",
"prompt_wav_url": "提示音频URL",
"seed": 42,
"speed": 1.0
}参数说明
mode(可选):推理模式,可选值为 "sft"、"zero_shot"、"cross_lingual",默认为 "sft"tts_text(必填):输入需要合成的文本sft_spk(可选):预训练音色,可选值为 "中文女"、"中文男"、"英文女"、"英文男"、"日语男"、"粤语女"、"韩语女"prompt_text(可选):提示文本prompt_wav_url(可选):提示音频 URLseed(可选):随机种子speed(可选):语音速度调节(仅支持非流式推理),范围 0.5-2.0,默认为 1.0
响应 (200)
json
{
"id": "任务ID",
"status": "任务状态",
"message": "状态信息"
}2. 获取任务状态
GET /status/{id}
查询特定任务的状态。
路径参数
id(必填):任务 ID
响应 (200)
json
{
"id": "任务ID",
"status": "任务状态",
"message": "状态信息"
}3. 下载音频
GET /download/{id}
下载生成的音频。
路径参数
id(必填):任务 ID
响应 (200)
json
{
// 音频数据
}
