SenseAudio 语音Agent是基于语音交互的对话式 AI 服务,为开发者提供开箱即用的实时语音对话能力。通过简洁的 RESTful API,您可以快速构建具备自然语音交互的智能应用,无需关心底层的语音识别、自然语言理解和语音合成等复杂技术细节。Documentation Index
Fetch the complete documentation index at: https://docs.senseaudio.cn/llms.txt
Use this file to discover all available pages before exploring further.
什么是语音Agent
语音Agent是预配置的对话式 AI 角色,每个语音Agent都具有独特的人设、知识领域和对话风格。您可以根据业务需求选择合适的语音Agent,或定制专属的语音Agent角色,为用户提供个性化的语音交互体验。 核心能力:- 实时语音对话:支持全双工语音交互,实现自然流畅的对话体验
- 多轮对话管理:自动维护上下文关联,支持复杂的多轮对话场景
- 情感化交互:语音Agent可根据对话内容调整语气和情感,提供更具人性化的交互
- 角色定制:支持自定义语音Agent的人设、知识库和对话策略
主要特性
即开即用
无需复杂配置,通过简单的 API 调用即可启动语音Agent对话。系统自动处理语音识别、语义理解、对话管理和语音合成全流程。会话管理
语音Agent支持新建对话和继续对话两种模式。您可以为每个用户维护独立的对话会话(conv_id),实现跨时段的连贯对话体验。实时监控
提供完善的状态查询接口,支持实时监控语音Agent的运行状态,确保服务的稳定性和可控性。灵活控制
支持随时启动和停止语音Agent会话,合理控制资源消耗,优化成本效益。API 能力概览
SenseAudio 语音Agent提供以下核心 API 接口:1. 获取 Agent 列表
查询平台提供的所有可用语音Agent,包括语音Agent的基本信息、角色介绍和适用场景。支持分页查询,方便集成到您的应用选择界面。2. 创建对话式 Agent
启动语音Agent对话会话。支持两种模式:- 新对话模式:创建全新的对话会话,适用于首次交互场景
- 续接模式:基于已有对话 ID 继续对话,保持上下文连贯性
3. 查询 Agent 状态
实时查询指定房间内语音Agent的运行状态,帮助您了解当前会话是否活跃,便于进行异常处理和资源管理。4. 停止对话式 Agent
主动结束语音Agent对话会话,释放服务资源。建议在用户结束对话时及时调用此接口。应用场景
虚拟客服与咨询
为企业网站、APP 提供 7x24 小时的智能语音客服,自动解答常见问题,提升用户体验,降低人力成本。AI 陪伴与娱乐
打造具有独特人格的虚拟角色,提供情感陪伴、娱乐互动等服务,适用于社交、游戏、元宇宙等场景。教育与培训
构建智能语音教练,提供语言学习、知识问答、技能培训等教育服务,支持个性化教学路径。智能导览与助手
为旅游景点、博物馆、展厅等场所提供智能语音导览服务,也可作为智能家居、车载系统的语音助手。开始使用
获取 API Key
前往 API 密钥 页面创建您的 API 密钥。
浏览并选择语音 Agent
调用 获取 Agent 列表 查看可用 Agent,在业务界面中由用户选择目标角色。
创建对话会话
调用 创建对话式 Agent 启动对话,获取
room_id 和 token。管理会话
通过 查询 Agent 状态 监控会话运行情况;会话结束时调用 停止对话式 Agent 释放资源。
相关资源
Agent 列表
查询平台提供的所有可用语音 Agent。
创建对话
启动实时语音对话并获取会话凭证。
自定义 Agent
创建自定义人设与音色的智能体。
快速接入
5 分钟完成首个请求。