文本嵌入
1. 获取模型列表 API
GET /v1/models
获取当前可用的所有模型列表及其状态信息。
响应 (200)
json
{
"data": [
{
"id": "Qwen2-Embedding-48",
"stats": {
"queue_fraction": 0,
"queue_absolute": 0,
"results_pending": 1,
"batch_size": 32
},
"object": "model",
"owned_by": "infinity",
"created": 1750989144,
"backend": "torch",
"capabilities": ["embed"]
}
],
"object": "list"
}响应参数说明
object: 响应对象类型,固定为 "list"data: 模型数组,包含所有可用模型信息id: 模型唯一标识符object: 模型对象类型,固定为 "model"owned_by: 模型提供方created: 模型创建时间戳backend: 模型后端框架(如 "torch")capabilities: 模型支持的功能列表(如 ["embed"] 表示支持嵌入功能)stats: 模型当前运行状态统计queue_fraction: 队列占用比例queue_absolute: 绝对队列数量results_pending: 待处理结果数量batch_size: 批处理大小
响应头
Content-Type: application/json
Content-Length: 243
Date: Fri, 27 Jun 2025 01:52:24 GMT
Server: uvicorn2. 嵌入 API
POST /v1/embeddings
创建表示输入文本的嵌入向量。
请求体
json
{
"model": "text-embedding-3-large",
"input": "这是一段需要嵌入的文本",
"encoding_format": "float",
"dimensions": 1536
}参数说明
model(必填):要使用的模型 ID,如 "text-embedding-3-large"input(必填):要嵌入的输入文本,可以是字符串或字符串数组encoding_format(可选):输出向量的编码格式,可选 "float" 或 "base64",默认为 "float"dimensions(可选):输出向量的维度,仅适用于支持维度选择的模型
响应 (200)
json
{
"object": "list",
"data": [
{
"object": "embedding",
"embedding": [0.0023064255, -0.009327292, ...],
"index": 0
}
],
"model": "text-embedding-3-large",
"usage": {
"prompt_tokens": 8,
"total_tokens": 8
}
}
