跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.senseaudio.cn/llms.txt

Use this file to discover all available pages before exploring further.

SenseAudio 语音Agent是基于语音交互的对话式 AI 服务,为开发者提供开箱即用的实时语音对话能力。通过简洁的 RESTful API,您可以快速构建具备自然语音交互的智能应用,无需关心底层的语音识别、自然语言理解和语音合成等复杂技术细节。

什么是语音Agent

语音Agent是预配置的对话式 AI 角色,每个语音Agent都具有独特的人设、知识领域和对话风格。您可以根据业务需求选择合适的语音Agent,或定制专属的语音Agent角色,为用户提供个性化的语音交互体验。 核心能力
  • 实时语音对话:支持全双工语音交互,实现自然流畅的对话体验
  • 多轮对话管理:自动维护上下文关联,支持复杂的多轮对话场景
  • 情感化交互:语音Agent可根据对话内容调整语气和情感,提供更具人性化的交互
  • 角色定制:支持自定义语音Agent的人设、知识库和对话策略

主要特性

即开即用

无需复杂配置,通过简单的 API 调用即可启动语音Agent对话。系统自动处理语音识别、语义理解、对话管理和语音合成全流程。

会话管理

语音Agent支持新建对话和继续对话两种模式。您可以为每个用户维护独立的对话会话(conv_id),实现跨时段的连贯对话体验。

实时监控

提供完善的状态查询接口,支持实时监控语音Agent的运行状态,确保服务的稳定性和可控性。

灵活控制

支持随时启动和停止语音Agent会话,合理控制资源消耗,优化成本效益。

API 能力概览

SenseAudio 语音Agent提供以下核心 API 接口:

1. 获取 Agent 列表

查询平台提供的所有可用语音Agent,包括语音Agent的基本信息、角色介绍和适用场景。支持分页查询,方便集成到您的应用选择界面。

2. 创建对话式 Agent

启动语音Agent对话会话。支持两种模式:
  • 新对话模式:创建全新的对话会话,适用于首次交互场景
  • 续接模式:基于已有对话 ID 继续对话,保持上下文连贯性
调用成功后返回房间 ID(room_id)和会话凭证(token),用于后续的实时通信。

3. 查询 Agent 状态

实时查询指定房间内语音Agent的运行状态,帮助您了解当前会话是否活跃,便于进行异常处理和资源管理。

4. 停止对话式 Agent

主动结束语音Agent对话会话,释放服务资源。建议在用户结束对话时及时调用此接口。

应用场景

虚拟客服与咨询

为企业网站、APP 提供 7x24 小时的智能语音客服,自动解答常见问题,提升用户体验,降低人力成本。

AI 陪伴与娱乐

打造具有独特人格的虚拟角色,提供情感陪伴、娱乐互动等服务,适用于社交、游戏、元宇宙等场景。

教育与培训

构建智能语音教练,提供语言学习、知识问答、技能培训等教育服务,支持个性化教学路径。

智能导览与助手

为旅游景点、博物馆、展厅等场所提供智能语音导览服务,也可作为智能家居、车载系统的语音助手。

开始使用

1

获取 API Key

前往 API 密钥 页面创建您的 API 密钥。
2

浏览并选择语音 Agent

调用 获取 Agent 列表 查看可用 Agent,在业务界面中由用户选择目标角色。
3

创建对话会话

调用 创建对话式 Agent 启动对话,获取 room_idtoken
4

建立实时语音连接并交互

使用 WebSocket / WebRTC 基于返回凭证建立实时音频通道,完成多轮语音对话。
5

管理会话

通过 查询 Agent 状态 监控会话运行情况;会话结束时调用 停止对话式 Agent 释放资源。

相关资源

Agent 列表

查询平台提供的所有可用语音 Agent。

创建对话

启动实时语音对话并获取会话凭证。

自定义 Agent

创建自定义人设与音色的智能体。

快速接入

5 分钟完成首个请求。

技术支持

如需技术支持或商务咨询,请联系: