接口概览 - SenseAudio 开放平台

SenseAudio 开放平台提供覆盖文本、语音、图像、视频、音乐、智能体六大方向的 RESTful API。所有接口采用统一的鉴权方式与错误语义，开发者可基于本页快速定位所需能力。

服务地址

所有接口均在以下地址提供服务：

https://api.senseaudio.cn

鉴权

所有接口均使用 Bearer Token 鉴权，请在请求头中携带您的 API Key：

Authorization: Bearer <Your_API_Key>

API Key 的创建与管理详见快速接入，或直接前往 SenseAudio API 平台 API 密钥。

接口分组

语音合成

将文本合成为富有情感的 AI 语音，支持多情绪、多风格、多音字纠正、公式朗读。

语音识别

音频转写、质检分析与历史记录查询，覆盖通用、极速、语义、整编、质检五档模型。

文本生成

兼容 OpenAI / Anthropic 协议的多模态大模型接口，支持对话、消息与响应三种风格。

图片生成

同步 / 异步图片生成与任务状态查询，覆盖常规尺寸与高分辨率输出。

音乐生成

歌词生成与完整歌曲合成，支持风格控制、结构化歌词与纯音乐模式。

视频生成

视频生成服务面向短视频创作、营销素材制作、内容可视化和创意分镜生成等场景。

实时智能体

实时语音对话式智能体，支持会话邀请、状态查询与离会。

自定义智能体

创建、更新、查询与删除自定义智能体，可绑定 LLM 模型与系统音色。

全部接口一览

语音合成

接口	方法	路径
语音合成 HTTP	POST	`/v1/t2a_v2`
语音合成 HTTP 流式	POST	`/v1/t2a_v2`
语音合成 WebSocket	WebSocket	`/ws/v1/t2a_v2`

音色

接口	方法	路径
查询可用音色	POST	`/v1/get_voice`

语音识别

接口	方法	路径
语音识别转写	POST	`/v1/audio/transcriptions`
语音识别 WebSocket	WebSocket	`/ws/v1/audio/transcriptions`
音频质量检测	POST	`/v1/audio/analysis`
语音识别历史	GET	`/v1/audio/records`

文本生成

接口	方法	路径
对话（Chat）API	POST	`/v1/chat/completions`
消息（Messages）	POST	`/v1/messages`
模型响应（Responses）API	POST	`/v1/responses`

图片生成

接口	方法	路径
同步图片生成	POST	`/v1/image/sync`
异步图片生成	POST	`/v1/image/async`
查询图片任务	GET	`/v1/image/pending`

音乐生成

接口	方法	路径
歌词生成	POST	`/v1/music/lyrics/create`
歌曲生成	POST	`/v1/music/song/create`
查询歌曲任务	GET	`/v1/music/song/pending/{task_id}`

视频生成

接口	方法	路径
创建视频生成任务	POST	`/v1/video/create`
查询视频生成状态	GET	`/v1/video/{task_id}`

实时智能体

接口	方法	路径
获取 Agent 列表	GET	`/v1/realtime/agents`
创建实时会话	POST	`/v1/realtime/invoke`
查询 Agent 状态	GET	`/v1/realtime/status`
停止实时会话	POST	`/v1/realtime/leave`

自定义智能体

接口	方法	路径
创建自定义 Agent	POST	`/v1/agent`
更新自定义 Agent	PUT	`/v1/agent/{agent_id}`
获取自定义 Agent 列表	GET	`/v1/agents`
删除自定义 Agent	DELETE	`/v1/agent/{agent_id}`

通用约定

请求格式：除文件上传外，均使用 application/json 作为请求体格式
响应格式：所有响应均为 application/json，UTF-8 编码
幂等与重试：对于耗时较长的生成类任务（图片异步、视频、音乐），创建接口会返回 task_id，请通过对应的状态查询接口轮询结果
错误码：HTTP 状态码遵循标准语义；响应体中包含 code 与 message 字段描述错误详情

快速接入

获取 API Key 并完成首个请求。

模型列表

浏览全部可调用模型与能力概览。

API 计费

查看各项 API 的积分消耗规则。

常见问题

接入过程中的常见问题解答。

Documentation Index

​服务地址

​鉴权

​接口分组

语音合成

语音识别

文本生成

图片生成

音乐生成

视频生成

实时智能体

自定义智能体

​全部接口一览

​语音合成

​音色

​语音识别

​文本生成

​图片生成

​音乐生成

​视频生成

​实时智能体

​自定义智能体

​通用约定

​相关资源

快速接入

模型列表

API 计费

常见问题

服务地址

鉴权

接口分组

全部接口一览

语音合成

音色

语音识别

文本生成

图片生成

音乐生成

视频生成

实时智能体

自定义智能体

通用约定

相关资源