Skip to content

接口兼容总览

LLMGateway 的 /v1 接口面向 OpenAI-compatible 客户端。除特别说明外,请使用:

text
Base URL: https://llm.xiaoyue9527.xyz/v1
Authorization: Bearer sk-gtw-REPLACE_ME
Content-Type: application/json

Anthropic-compatible 客户端也可以使用 x-api-key: sk-gtw-REPLACE_ME

测试环境和正式环境的 Base URL 由文档站构建配置注入,不要混用。

已支持接口

接口SDK 方法文档说明
GET /v1/modelsclient.models.list()模型列表返回当前可用模型列表
GET /v1/models/{model}client.models.retrieve(model)模型列表查询单个模型
GET /v1/model-catalogHTTP API模型列表返回模型能力、模态、任务分类
GET /v1/model-catalog/{model}HTTP API模型列表查询单个模型的能力、模态、任务分类
POST /v1/chat/completionsclient.chat.completions.create()Chat Completions文本/多模态对话,支持 SSE
POST /v2/chat/completionsclient.chat.completions.create()Chat V2OpenAI 兼容,SSE 更严格遵循 stream_options
POST /v1/responsesclient.responses.create()Responses新版 Responses API,支持 SSE 和取消
POST /v1/embeddingsclient.embeddings.create()Embeddings文本向量化
POST /v1/rerankHTTP APIRerank文档重排序,支持文本和图片
POST /v1/messagesAnthropic SDKAnthropic MessagesAnthropic Messages 兼容接口
POST /v1/messages/count_tokensAnthropic SDKAnthropic Messages本地估算 token 数,不计费
POST /v1/completionsclient.completions.create()Completions (FIM)FIM 代码补全
GET /v1/responses/{request_id}HTTP APIResponses查询断流缓存结果

通用响应

OpenAI-compatible /v1/* 接口不包裹公司内部 {code,message,data}。成功响应保持对应协议格式;失败响应使用 OpenAI 风格 error envelope:

json
{
  "error": {
    "message": "upstream service temporarily unavailable",
    "type": "upstream_error",
    "code": "502"
  }
}

通用边界

说明
鉴权必须传 Authorization: Bearer <API Key>;Anthropic-compatible 客户端可改用 x-api-key: <API Key>
模型名大小写敏感,以 /v1/models 返回为准
能力判断使用 /v1/model-catalog 查看 modalitiestasksfeatures
流式Chat Completions 和 Responses 支持 SSE
文件上传暂未开放 /v1/files 文件管理能力
未启用接口返回 501 unsupported_feature,见 不支持接口

接口页面

OpenAI-compatible API documentation.