Skip to content

文本转语音

1. 生成语音

POST /generate

将文本转换为语音的主要端点。

请求体

json
{
  "mode": "sft",
  "tts_text": "要转换为语音的文本",
  "sft_spk": "中文女",
  "prompt_text": "提示文本",
  "prompt_wav_url": "提示音频URL",
  "seed": 42,
  "speed": 1.0
}

参数说明

  • mode(可选):推理模式,可选值为 "sft"、"zero_shot"、"cross_lingual",默认为 "sft"

  • tts_text(必填):输入需要合成的文本

  • sft_spk(可选):预训练音色,可选值为 "中文女"、"中文男"、"英文女"、"英文男"、"日语男"、"粤语女"、"韩语女"

  • prompt_text(可选):提示文本

  • prompt_wav_url(可选):提示音频 URL

  • seed(可选):随机种子

  • speed(可选):语音速度调节(仅支持非流式推理),范围 0.5-2.0,默认为 1.0

响应 (200)

json
{
  "id": "任务ID",
  "status": "任务状态",
  "message": "状态信息"
}

2. 获取任务状态

GET /status/{id}

查询特定任务的状态。

路径参数

  • id(必填):任务 ID

响应 (200)

json
{
  "id": "任务ID",
  "status": "任务状态",
  "message": "状态信息"
}

3. 下载音频

GET /download/{id}

下载生成的音频。

路径参数

  • id(必填):任务 ID

响应 (200)

json
{
  // 音频数据
}