自定义音色 - SenseAudio 开放平台

除了系统音色外，SenseAudio 提供两种自定义音色生成方式：通过 参考音频复刻 的音色克隆，以及通过 自然语言描述生成 的文生音色。两者共享同一组音色槽位，槽位数量由套餐等级决定。生成完成后，均可使用对应的 voice_id 在语音合成 API 或语音合成 WebSocket API 中调用。

文生音色与音色克隆共用同一组音色槽位。槽位占用仅表示已有音色占用存储空间；是否可直接通过 API 调用，请以文档页展示的音色列表为准。

音色克隆

音色克隆大模型是基于全新自研语音大模型算法打造的高效化、专业级音色定制方案。用户仅需录制几秒音频，即可快速拥有高保真的专属 AI 定制音色。

产品优势

技术领先：采用全新自研大模型技术，提供行业领先的复刻精度与情感表现力。
超低成本：仅需录制 3-30 秒 音频即可快速复刻，录制门槛极低。
高度还原：1:1 还原真人音色特点、说话风格、口音和声学细节。
极速复刻：数秒完成模型训练与槽位入库，即刻拥有高品质 AI 定制音色。

使用流程

确认空余槽位

空余槽位是进行音色克隆的必要条件。每个槽位承载一个已生成的音色，在套餐有效期内可随时用于平台合成或 API 调用。槽位规则详见音色列表。

在平台录制并克隆

环境要求：在安静、无回声环境下录制，确保人声纯净。
素材规格：时长 3-30 秒、体积 50MB 以内、格式 MP3/WAV/AAC。
操作步骤：
1. 添加音频：选择“录制音频”或“上传音频”。
2. 音色克隆：系统自动占用一个槽位，数秒完成音色克隆。
3. 管理音色：在音色列表查看已生成的音色并使用。

通过 API 调用

克隆音色 API 暂不支持直接通过接口发起录制请求；请先在平台完成音色复刻，获取 voice_id 后，再传入语音合成 API。

文生音色

文生音色功能是基于自研的音色合成模型打造的个性化、无版权风险的 AI 音色解决方案。用户仅需通过自然语言描述，即可定制逼真、自然、符合需求的 AI 音色。

适用场景

文生音色能力面向个性化配音、角色语音定制、品牌音色设计等场景，支持通过文本描述快速生成新的专属音色。相比传统录音采集或复杂训练流程，文生音色更适合用于快速创作和批量探索不同声线方案。

使用流程

确认空余槽位

空余槽位是进行音色生成的必要条件。每个槽位承载一个已生成的音色，在套餐有效期内可随时用于平台合成或 API 调用。

在平台完成生成

文生音色相关流程以平台侧生成与管理为主，暂不支持通过接口直接生成音色。

通过 API 调用

生成完成后，获取唯一 voice_id 并传入语音合成 API。是否可直接通过 API 调用，请以音色列表为准。

套餐权益与扩容支持

音色克隆与文生音色共用同一组槽位，槽位数量由您的套餐等级决定，并随套餐有效期动态调整。

套餐类型	槽位数量	适用场景	扩容路径
免费版	1 个	基础功能测试与效果预览	升级套餐
尝鲜版	2 个	个人轻度体验，尝试不同声线	升级套餐
高级版	5 个	满足日常多场景、多角色的配音需求	升级套餐
专业版	8 个	适合高频创作者，建立稳定声线库	升级套餐
商业版	15 个	商业化大规模应用，支持多场景集成	联系客服定制

槽位不足处理方案

释放空间：您可以删除不再需要的旧音色以释放槽位，腾出空间进行新克隆或自定义音色生成。
升级套餐：若当前槽位已满，请点击“升级套餐”以即刻获取更多额度。
专属定制：若您已是最高等级（商业版）用户，但仍需更多槽位，请点击右上角“联系客服”并留下您的联系方式。我们的技术服务专员将在 24 小时内与您取得联系，为您提供 1 对 1 的专属扩容方案。

音色列表

查看系统音色清单与套餐可调用范围。

查询可用音色

确认当前账号可调用的 voice_id。

Documentation Index

​音色克隆

​产品优势

​使用流程

​文生音色

​适用场景

​使用流程

​套餐权益与扩容支持

​槽位不足处理方案

​相关资源

音色列表

查询可用音色

音色克隆

产品优势

使用流程

文生音色

适用场景

使用流程

套餐权益与扩容支持

槽位不足处理方案

相关资源