Index‑TTS2 在线语音合成

基于 Index‑TTS2 官方模型,支持专业级音色克隆与丰富情感控制,零门槛、一键生成自然逼真的 AI 语音。

AI语音合成与音色克隆平台

在线 AI 语音合成服务,支持语音克隆!

点击或拖拽音频文件至此处上传

支持WAV、MP3格式,最大20MB,最长90秒,采样率不低于16kHz

用于标注参考音频中所说的文本内容,帮助模型对齐音频与文字,从而提升语音复刻的效果。
合成文本定义了模型要生成的对话内容(汉字按2倍计数)
0/4096 字符
选择模型采用的情感控制策略

点击或拖拽音频文件至此处上传

支持WAV、MP3格式,最大10MB

当前值: 0.6
参数用于控制情感参考音频或文本对合成语音的影响强度,数值越大,生成语音的情绪特征越明显。
本接口使用人数较多,合成可能需要30-60秒左右
暂无合成结果

请先输入文本并点击"开始合成"按钮

暂无历史任务

您还没有任何历史合成任务

使用指南

基本步骤
  • 在文本框中输入或粘贴需要合成的文本内容
  • 选择公共音色或克隆自己的音色
  • 克隆音频小等于20MB,时长5–30 秒,仅支持 MP3、WAV
  • 选择情绪控制方式或开启情绪随机性
  • 调整完参数后,点击“开始合成”生成自己的音频文件
参数说明
  • 情绪控制权重:设置为 0.6 左右(或更低),以获得更自然的语音效果。
  • 情绪向量:单个维度的值范围为0-1。
  • 情绪随机性:用于增加多样性或避免每句语音完全一致的情绪表达。
实用技巧
  • 长文本建议分段合成,效果更佳
  • 克隆音色时可上传参考情绪音频
  • MP3格式适合网络使用,WAV格式适合专业制作
  • 支持中英文混合文本的自然合成
  • 生成的音频可直接用于视频配音、语音播报等场景
常见问题
  • 文本内容:单次合成最大支持 4096 字符(汉字按2倍计数)
  • 合成说明:按Token计费,¥105/百万Tokens。
  • 音频下载:音频合成后请在24小时内下载,过期自动清理。