对话 (Chat Completions)
文本生成
对话 (Chat) API
标准化多轮对话接口,兼容 OpenAI 规范,支持 Function Calling 与多模态输入
POST
对话 (Chat Completions)
Documentation Index
Fetch the complete documentation index at: https://docs.senseaudio.cn/llms.txt
Use this file to discover all available pages before exploring further.
说明
提供标准化的对话接口,兼容主流规范,支持多轮对话、工具调用 (Function Calling) 及多模态输入。- 接口地址:
POST https://api.senseaudio.cn/v1/chat/completions - Content-Type:
application/json - 鉴权方式:Bearer Token,详见 快速接入
- 流式输出:
stream: true以 SSE 协议逐块返回;收到data: [DONE]标识流结束 - 模型列表:见 模型列表
- 计费:按输入 / 输出 token 计费,详见 计费说明
Authorizations
Bearer 鉴权头,格式为
Bearer SENSEAUDIO_API_KEY。Body
application/json调用的模型名称,例如
senseaudio-s2。包含历史对话上下文和当前输入的消息列表。
模型可调用的工具列表,主要用于 Function Calling 场景。
控制模型调用工具的行为:
none / auto / required,或指定函数对象 {type: 'function', function: {name: 'my_func'}}。是否开启流式响应,开启后通过 SSE 协议逐块返回。
流式响应选项(仅
stream=true 时有效)。输出格式:
{type: 'text'}(默认)、{type: 'json_object'}(强制 JSON)。限制生成的最大 token 数量。不设置则直至自然生成完毕或达到模型上限。
采样温度,范围
[0.0, 2.0]。值越高输出越随机,建议与 top_p 二选一调整。核采样概率阈值,范围
[0.0, 1.0]。为每条输入消息生成的回复选项数量。
停止词序列(最多 4 个)。
频率惩罚系数,范围
[-2.0, 2.0]。存在惩罚系数,范围
[-2.0, 2.0]。调整特定 token 出现的概率。键为 Token ID,值为偏差
[-100, 100]。是否返回输出 token 的对数概率。
返回在每个位置最可能的 N 个 token 的概率(需开启
logprobs,范围 [0, 20])。随机种子,用于尽可能的确定性采样。
最终用户的唯一标识,可用于协助监控及防滥用。
Response
200 — application/json
本次请求的唯一标识符。
对象类型。非流式为
"chat.completion";流式为 "chat.completion.chunk"。生成成功的 Unix 时间戳(秒)。
实际响应的模型名称。
模型运行的后端配置系统指纹。
模型生成的回复选项列表。
Token 消耗统计。
流式响应示例
开启stream: true 时,基于 SSE 协议逐块返回:
错误处理
错误时返回非 200 状态码,响应体包含error 对象:
错误对象。
相关指南
授权
格式:Bearer <API_KEY>
请求体
application/json
可用选项:
deepseek-v4-flash, deepseek-v4-pro, doubao-seed-2-0-code-preview-260215, doubao-seed-2-0-lite-260215, doubao-seed-2-0-mini-260215, doubao-seed-2-0-pro-260215, glm-5.1, kimi-k2.6, minimax-m2.7, qwen3.6-27b, qwen3.6-35b-a3b, senseaudio-s2, senseaudio-s2-flash, senseaudio-s2-lite, senseaudio-vl-1.0-260319, senseaudio-vl-lite-1.0-260319, sensenova-6.7-flash-lite 示例:
"senseaudio-s2"
字段推断自素材文档
示例:
1024
示例:
0.7
示例:
1