文本转语音

1. 生成语音

POST /generate

将文本转换为语音的主要端点。

请求体

json

{
  "mode": "sft",
  "tts_text": "要转换为语音的文本",
  "sft_spk": "中文女",
  "prompt_text": "提示文本",
  "prompt_wav_url": "提示音频URL",
  "seed": 42,
  "speed": 1.0
}

参数说明

mode（可选）：推理模式，可选值为 "sft"、"zero_shot"、"cross_lingual"，默认为 "sft"
tts_text（必填）：输入需要合成的文本
sft_spk（可选）：预训练音色，可选值为 "中文女"、"中文男"、"英文女"、"英文男"、"日语男"、"粤语女"、"韩语女"
prompt_text（可选）：提示文本
prompt_wav_url（可选）：提示音频 URL
seed（可选）：随机种子
speed（可选）：语音速度调节（仅支持非流式推理），范围 0.5-2.0，默认为 1.0

响应 (200)

json

{
  "id": "任务ID",
  "status": "任务状态",
  "message": "状态信息"
}

2. 获取任务状态

GET /status/{id}

查询特定任务的状态。

路径参数

id（必填）：任务 ID

响应 (200)

json

{
  "id": "任务ID",
  "status": "任务状态",
  "message": "状态信息"
}

3. 下载音频

GET /download/{id}

下载生成的音频。

路径参数

id（必填）：任务 ID

响应 (200)

json

{
  // 音频数据
}

文本转语音 ​

1. 生成语音 ​

2. 获取任务状态 ​

3. 下载音频 ​

文本转语音

1. 生成语音

2. 获取任务状态

3. 下载音频