Skip to content

文本嵌入

1. 获取模型列表 API

GET /v1/models

获取当前可用的所有模型列表及其状态信息。

响应 (200)

json
{
  "data": [
    {
      "id": "Qwen2-Embedding-48",
      "stats": {
        "queue_fraction": 0,
        "queue_absolute": 0,
        "results_pending": 1,
        "batch_size": 32
      },
      "object": "model",
      "owned_by": "infinity",
      "created": 1750989144,
      "backend": "torch",
      "capabilities": ["embed"]
    }
  ],
  "object": "list"
}

响应参数说明

  • object: 响应对象类型,固定为 "list"
  • data: 模型数组,包含所有可用模型信息
    • id: 模型唯一标识符
    • object: 模型对象类型,固定为 "model"
    • owned_by: 模型提供方
    • created: 模型创建时间戳
    • backend: 模型后端框架(如 "torch")
    • capabilities: 模型支持的功能列表(如 ["embed"] 表示支持嵌入功能)
    • stats: 模型当前运行状态统计
      • queue_fraction: 队列占用比例
      • queue_absolute: 绝对队列数量
      • results_pending: 待处理结果数量
      • batch_size: 批处理大小

响应头

Content-Type: application/json
Content-Length: 243
Date: Fri, 27 Jun 2025 01:52:24 GMT
Server: uvicorn

2. 嵌入 API

POST /v1/embeddings

创建表示输入文本的嵌入向量。

请求体

json
{
  "model": "text-embedding-3-large",
  "input": "这是一段需要嵌入的文本",
  "encoding_format": "float",
  "dimensions": 1536
}

参数说明

  • model(必填):要使用的模型 ID,如 "text-embedding-3-large"
  • input(必填):要嵌入的输入文本,可以是字符串或字符串数组
  • encoding_format(可选):输出向量的编码格式,可选 "float" 或 "base64",默认为 "float"
  • dimensions(可选):输出向量的维度,仅适用于支持维度选择的模型

响应 (200)

json
{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "embedding": [0.0023064255, -0.009327292, ...],
      "index": 0
    }
  ],
  "model": "text-embedding-3-large",
  "usage": {
    "prompt_tokens": 8,
    "total_tokens": 8
  }
}