跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.senseaudio.cn/llms.txt

Use this file to discover all available pages before exploring further.

除了系统音色外,SenseAudio 提供两种自定义音色生成方式:通过 参考音频复刻 的音色克隆,以及通过 自然语言描述生成 的文生音色。两者共享同一组音色槽位,槽位数量由套餐等级决定。生成完成后,均可使用对应的 voice_id语音合成 API语音合成 WebSocket API 中调用。
文生音色与音色克隆共用同一组音色槽位。槽位占用仅表示已有音色占用存储空间;是否可直接通过 API 调用,请以文档页展示的 音色列表 为准。

音色克隆

音色克隆大模型是基于全新自研语音大模型算法打造的高效化、专业级音色定制方案。用户仅需录制几秒音频,即可快速拥有高保真的专属 AI 定制音色。

产品优势

  • 技术领先:采用全新自研大模型技术,提供行业领先的复刻精度与情感表现力。
  • 超低成本:仅需录制 3-30 秒 音频即可快速复刻,录制门槛极低。
  • 高度还原:1:1 还原真人音色特点、说话风格、口音和声学细节。
  • 极速复刻:数秒完成模型训练与槽位入库,即刻拥有高品质 AI 定制音色。

使用流程

1

确认空余槽位

空余槽位是进行音色克隆的必要条件。每个槽位承载一个已生成的音色,在套餐有效期内可随时用于平台合成或 API 调用。槽位规则详见 音色列表
2

在平台录制并克隆

  • 环境要求:在安静、无回声环境下录制,确保人声纯净。
  • 素材规格:时长 3-30 秒、体积 50MB 以内、格式 MP3/WAV/AAC
  • 操作步骤
    1. 添加音频:选择“录制音频”或“上传音频”。
    2. 音色克隆:系统自动占用一个槽位,数秒完成音色克隆。
    3. 管理音色:在音色列表查看已生成的音色并使用。
3

通过 API 调用

克隆音色 API 暂不支持直接通过接口发起录制请求;请先在平台完成音色复刻,获取 voice_id 后,再传入 语音合成 API

文生音色

文生音色功能是基于自研的音色合成模型打造的个性化、无版权风险的 AI 音色解决方案。用户仅需通过自然语言描述,即可定制逼真、自然、符合需求的 AI 音色。

适用场景

文生音色能力面向个性化配音、角色语音定制、品牌音色设计等场景,支持通过文本描述快速生成新的专属音色。相比传统录音采集或复杂训练流程,文生音色更适合用于快速创作和批量探索不同声线方案。

使用流程

1

确认空余槽位

空余槽位是进行音色生成的必要条件。每个槽位承载一个已生成的音色,在套餐有效期内可随时用于平台合成或 API 调用。
2

在平台完成生成

文生音色相关流程以平台侧生成与管理为主,暂不支持通过接口直接生成音色。
3

通过 API 调用

生成完成后,获取唯一 voice_id 并传入 语音合成 API。是否可直接通过 API 调用,请以 音色列表 为准。

套餐权益与扩容支持

音色克隆与文生音色共用同一组槽位,槽位数量由您的套餐等级决定,并随套餐有效期动态调整。
套餐类型槽位数量适用场景扩容路径
免费版1 个基础功能测试与效果预览升级套餐
尝鲜版2 个个人轻度体验,尝试不同声线升级套餐
高级版5 个满足日常多场景、多角色的配音需求升级套餐
专业版8 个适合高频创作者,建立稳定声线库升级套餐
商业版15 个商业化大规模应用,支持多场景集成联系客服定制

槽位不足处理方案

  • 释放空间:您可以删除不再需要的旧音色以释放槽位,腾出空间进行新克隆或自定义音色生成。
  • 升级套餐:若当前槽位已满,请点击“升级套餐”以即刻获取更多额度。
  • 专属定制:若您已是最高等级(商业版)用户,但仍需更多槽位,请点击右上角“联系客服”并留下您的联系方式。我们的技术服务专员将在 24 小时内与您取得联系,为您提供 1 对 1 的专属扩容方案。

相关资源

音色列表

查看系统音色清单与套餐可调用范围。

查询可用音色

确认当前账号可调用的 voice_id