除了系统音色外,SenseAudio 提供两种自定义音色生成方式:通过 参考音频复刻 的音色克隆,以及通过 自然语言描述生成 的文生音色。两者共享同一组音色槽位,槽位数量由套餐等级决定。生成完成后,均可使用对应的Documentation Index
Fetch the complete documentation index at: https://docs.senseaudio.cn/llms.txt
Use this file to discover all available pages before exploring further.
voice_id 在 语音合成 API 或 语音合成 WebSocket API 中调用。
文生音色与音色克隆共用同一组音色槽位。槽位占用仅表示已有音色占用存储空间;是否可直接通过 API 调用,请以文档页展示的 音色列表 为准。
音色克隆
音色克隆大模型是基于全新自研语音大模型算法打造的高效化、专业级音色定制方案。用户仅需录制几秒音频,即可快速拥有高保真的专属 AI 定制音色。产品优势
- 技术领先:采用全新自研大模型技术,提供行业领先的复刻精度与情感表现力。
- 超低成本:仅需录制 3-30 秒 音频即可快速复刻,录制门槛极低。
- 高度还原:1:1 还原真人音色特点、说话风格、口音和声学细节。
- 极速复刻:数秒完成模型训练与槽位入库,即刻拥有高品质 AI 定制音色。
使用流程
确认空余槽位
空余槽位是进行音色克隆的必要条件。每个槽位承载一个已生成的音色,在套餐有效期内可随时用于平台合成或 API 调用。槽位规则详见 音色列表。
在平台录制并克隆
- 环境要求:在安静、无回声环境下录制,确保人声纯净。
- 素材规格:时长 3-30 秒、体积 50MB 以内、格式 MP3/WAV/AAC。
- 操作步骤:
- 添加音频:选择“录制音频”或“上传音频”。
- 音色克隆:系统自动占用一个槽位,数秒完成音色克隆。
- 管理音色:在音色列表查看已生成的音色并使用。
通过 API 调用
克隆音色 API 暂不支持直接通过接口发起录制请求;请先在平台完成音色复刻,获取
voice_id 后,再传入 语音合成 API。文生音色
文生音色功能是基于自研的音色合成模型打造的个性化、无版权风险的 AI 音色解决方案。用户仅需通过自然语言描述,即可定制逼真、自然、符合需求的 AI 音色。适用场景
文生音色能力面向个性化配音、角色语音定制、品牌音色设计等场景,支持通过文本描述快速生成新的专属音色。相比传统录音采集或复杂训练流程,文生音色更适合用于快速创作和批量探索不同声线方案。使用流程
套餐权益与扩容支持
音色克隆与文生音色共用同一组槽位,槽位数量由您的套餐等级决定,并随套餐有效期动态调整。| 套餐类型 | 槽位数量 | 适用场景 | 扩容路径 |
|---|---|---|---|
| 免费版 | 1 个 | 基础功能测试与效果预览 | 升级套餐 |
| 尝鲜版 | 2 个 | 个人轻度体验,尝试不同声线 | 升级套餐 |
| 高级版 | 5 个 | 满足日常多场景、多角色的配音需求 | 升级套餐 |
| 专业版 | 8 个 | 适合高频创作者,建立稳定声线库 | 升级套餐 |
| 商业版 | 15 个 | 商业化大规模应用,支持多场景集成 | 联系客服定制 |
槽位不足处理方案
- 释放空间:您可以删除不再需要的旧音色以释放槽位,腾出空间进行新克隆或自定义音色生成。
- 升级套餐:若当前槽位已满,请点击“升级套餐”以即刻获取更多额度。
- 专属定制:若您已是最高等级(商业版)用户,但仍需更多槽位,请点击右上角“联系客服”并留下您的联系方式。我们的技术服务专员将在 24 小时内与您取得联系,为您提供 1 对 1 的专属扩容方案。
相关资源
音色列表
查看系统音色清单与套餐可调用范围。
查询可用音色
确认当前账号可调用的
voice_id。