Index-TTS2 在线语音合成 一键生成高保真语音

基于 Index-TTS2 模型,提供专业级语音克隆与情感控制服务,仅需 30 秒音频样本,即可生成高度相似的 AI 语音

AI语音合成与音色克隆平台

在线 AI 语音合成服务,支持语音克隆!

点击或拖拽音频文件至此处上传

支持WAV、MP3格式,最大10MB

点击或拖拽音频文件至此处上传

支持WAV、MP3格式,最大10MB

用于标注参考音频中所说的文本内容,帮助模型对齐音频与文字,从而提升声音克隆和语音复刻的效果。
合成文本定义了模型要生成的对话内容
0/600 字符
选择模型采用的情感控制策略,选择基于情绪音频时,需要在克隆阶段上传了情绪参考音频
暂无合成结果

请先输入文本并点击"开始合成"按钮

暂无历史任务

您还没有任何历史合成任务

使用指南

基本步骤
  • 在文本框中输入或粘贴需要合成的文本内容
  • 选择公共音色或克隆自己的音色
  • 克隆音频小等于20MB,时长5–30 秒,仅支持 MP3、WAV
  • 选择情绪控制方式或开启情绪随机性
  • 调整完参数后,点击“开始合成”生成自己的音频文件
参数说明
  • 情绪控制权重:设置为 0.6 左右(或更低),以获得更自然的语音效果。
  • 情绪向量:单个维度的值范围为0-1。
  • 情绪随机性:用于增加多样性或避免每句语音完全一致的情绪表达。
实用技巧
  • 长文本建议分段合成,效果更佳
  • 克隆音色时可上传参考情绪音频
  • MP3格式适合网络使用,WAV格式适合专业制作
  • 支持中英文混合文本的自然合成
  • 生成的音频可直接用于视频配音、语音播报等场景
常见问题
  • 文本内容:单次合成最大支持 600 字
  • 合成说明:所有用户每月免费0字符,超过后3元/万字符。
  • 音频下载:音频合成后请在24小时内下载,过期自动清理。