SenseAudio 开放平台提供覆盖文本、语音、图像、视频、音乐、智能体六大方向的 RESTful API。所有接口采用统一的鉴权方式与错误语义,开发者可基于本页快速定位所需能力。Documentation Index
Fetch the complete documentation index at: https://docs.senseaudio.cn/llms.txt
Use this file to discover all available pages before exploring further.
服务地址
所有接口均在以下地址提供服务:鉴权
所有接口均使用 Bearer Token 鉴权,请在请求头中携带您的 API Key:接口分组
语音合成
将文本合成为富有情感的 AI 语音,支持多情绪、多风格、多音字纠正、公式朗读。
语音识别
音频转写、质检分析与历史记录查询,覆盖通用、极速、语义、整编、质检五档模型。
文本生成
兼容 OpenAI / Anthropic 协议的多模态大模型接口,支持对话、消息与响应三种风格。
图片生成
同步 / 异步图片生成与任务状态查询,覆盖常规尺寸与高分辨率输出。
音乐生成
歌词生成与完整歌曲合成,支持风格控制、结构化歌词与纯音乐模式。
视频生成
视频生成服务面向短视频创作、营销素材制作、内容可视化和创意分镜生成等场景。
实时智能体
实时语音对话式智能体,支持会话邀请、状态查询与离会。
自定义智能体
创建、更新、查询与删除自定义智能体,可绑定 LLM 模型与系统音色。
全部接口一览
语音合成
| 接口 | 方法 | 路径 |
|---|---|---|
| 语音合成 HTTP | POST | /v1/t2a_v2 |
| 语音合成 HTTP 流式 | POST | /v1/t2a_v2 |
| 语音合成 WebSocket | WebSocket | /ws/v1/t2a_v2 |
音色
| 接口 | 方法 | 路径 |
|---|---|---|
| 查询可用音色 | POST | /v1/get_voice |
语音识别
| 接口 | 方法 | 路径 |
|---|---|---|
| 语音识别转写 | POST | /v1/audio/transcriptions |
| 语音识别 WebSocket | WebSocket | /ws/v1/audio/transcriptions |
| 音频质量检测 | POST | /v1/audio/analysis |
| 语音识别历史 | GET | /v1/audio/records |
文本生成
| 接口 | 方法 | 路径 |
|---|---|---|
| 对话(Chat)API | POST | /v1/chat/completions |
| 消息(Messages) | POST | /v1/messages |
| 模型响应(Responses)API | POST | /v1/responses |
图片生成
音乐生成
视频生成
实时智能体
| 接口 | 方法 | 路径 |
|---|---|---|
| 获取 Agent 列表 | GET | /v1/realtime/agents |
| 创建实时会话 | POST | /v1/realtime/invoke |
| 查询 Agent 状态 | GET | /v1/realtime/status |
| 停止实时会话 | POST | /v1/realtime/leave |
自定义智能体
| 接口 | 方法 | 路径 |
|---|---|---|
| 创建自定义 Agent | POST | /v1/agent |
| 更新自定义 Agent | PUT | /v1/agent/{agent_id} |
| 获取自定义 Agent 列表 | GET | /v1/agents |
| 删除自定义 Agent | DELETE | /v1/agent/{agent_id} |
通用约定
- 请求格式:除文件上传外,均使用
application/json作为请求体格式 - 响应格式:所有响应均为
application/json,UTF-8 编码 - 幂等与重试:对于耗时较长的生成类任务(图片异步、视频、音乐),创建接口会返回
task_id,请通过对应的状态查询接口轮询结果 - 错误码:HTTP 状态码遵循标准语义;响应体中包含
code与message字段描述错误详情
相关资源
快速接入
获取 API Key 并完成首个请求。
模型列表
浏览全部可调用模型与能力概览。
API 计费
查看各项 API 的积分消耗规则。
常见问题
接入过程中的常见问题解答。