基本操作

1、按下图选择自己克隆后的声音角色或公共角色

2、选择“克隆”接口后,权限选择“个人”可直接定位自己所有克隆的声音角色

3、选择好音色后,在“参数设置”里可以选择不同的配音版本,版本的差异请查看下面的版本说明

版本说明

版本 标签 详细说明
V1 标准版 普通版本
V2 情绪Pro版 支持停顿、呼吸、咳嗽、笑声,叹息等控制指令
Fish S1 情绪MAX版 支持开心,生气,疑问,大笑,哭泣,悄悄话,大声,激动等情感控制
Fish S1+Mini 快速版 轻量快速生成语音

使用说明

语音合成精细控制(V2版本)

开始使用

要使用精细控制功能,可能会降低阅读数字、日期和URL的稳定性。您需要手动处理这些情况以获得最佳效果。

音素控制

音素控制允许您为单词或字符指定精确的发音。目前支持:

  • CMU Arpabet (英语)
  • 拼音 (中文)

使用音素控制时,请将所需发音包含在 <|phoneme_start|> 和 <|phoneme_end|> 标签中。每个标签应包含一个单词或字符。

示例

Standard: I am an engineer.

With control: I am an <|phoneme_start|>EH N JH AH N IH R<|phoneme_end|>.

标准: 我是一个工程师。

控制: 我是一个<|phoneme_start|>gong1<|phoneme_end|><|phoneme_start|>cheng2<|phoneme_end|><|phoneme_start|>shi1<|phoneme_end|>。

副语言控制

副语言控制允许您添加自然语音元素和停顿,使生成的语音听起来更像人类。主要有两种类型的控制:

停顿词

您可以使用常见的停顿词如"嗯"、"啊"、"um"、"uh"来控制语音的节奏。

特殊效果

以下特殊效果可以使用括号添加:

Effect Description First Available Stage
(break) 短暂停顿 V2 实验性
(long-break) 延长停顿 V2 实验性
(breath) 呼吸声 V2 实验性
(laugh) 笑声 V2 实验性
(cough) 咳嗽声 V2 实验性
(lip-smacking) 咂嘴声 V2 实验性
(sigh) 叹息声 V2 实验性

效果 (laugh)、(cough)、(lip-smacking) 和 (sigh) 正在开发中。您可能需要重复多次以获得更好的效果。 

English Example:


Standard: I am an engineer.

With paralanguage: I am, um, an (break) engineer.

中文示例:


标准: 我是一名工程师。

添加副语言: 我,嗯,是一名(break)工程师。

情感与控制指令(Fish S1版本)

简介

欢迎体验 Fish Audio 提供的先进AI语音技术。我们相信"怎么说"和"说什么"同样重要。为了让每一个合成的声音都不仅仅是"逼真",更能"触动人心",我们引入了一套强大的实时情感与声调控制指令系统。

这套系统是 Fish Audio S1 的核心部分,它让您能够精确地为声音注入情感、控制语速和音调。本指南将作为您的向导,全面介绍如何使用这些指令、相关的规则以及最佳实践,帮助您将创意变为富有表现力的声音作品。

本指南将全面介绍如何使用这些指令、相关的规则以及最佳实践。

1. 核心用法:指令语法

所有控制指令都必须放在括号 () 内。此语法是通用的。

基本格式:
(指令)要朗读的文本
作用范围:
一个指令会对其后的所有文本生效,直到遇到一个新的指令。中文的指令放置规则比其他语言更灵活,详见下文。

2. 指令分类与规则

指令分为三大类:情感指令、语气控制指令和副语言指令。

情感指令

情感指令用于设定一句话或一个短语的情感基调。

规则:
情感指令可以放置在句子的 开头 或 中间,这为表达提供了更大的灵活性。

示例:
• 句首用法:(愤怒)你就是这样回报我的吗?
• 句中用法:我对你这么信任,(愤怒)你就是这样回报我的吗?
常用中文指令列表:

正面情绪:(开心)(兴奋)(高兴)(得意)(坚定)(感激)(自信)(愉快)

负面情绪:(生气)(气愤)(愤怒)(讽刺)(讥讽)(悲伤)(难过)(无奈)(失望)(着急)(内疚)(沮丧)

中性/疑问:(疑惑)(疑问)(质问)(思考)(惊讶)(震惊)(严肃)(平静)

语气控制指令

这类指令可以放置在句子的任意位置,以调整声音的表达方式。

速度控制:
(语速变快):

用于营造紧张、急切的氛围。

示例: 快走!后面有人在追,(语速变快)再不跑就来不及了!

(语速变慢):

用于营造庄重、思考或强调的氛围。

示例: 他一字一顿,(语速变慢)仿佛每个字都有千斤重。
音量/音调控制:
(大声):

用于模拟喊叫或需要特别强调的场景。

示例: (大声)你说什么?我听不见!

(声音变小):

用于模拟耳语、自言自语或悄悄话。

示例: 他凑到我耳边,(声音变小)悄悄告诉我一个秘密。

(语气激动):

用于表达强烈的情绪波动,如惊喜、激动。

示例: 这太不可思议了!(语气激动)我们竟然真的成功了!

副语言指令

这类指令用于模拟非语言声音,并且 必须 后跟相应的拟声词。

(大笑):

用于表达开怀大笑。

示例: 听到这个笑话,他再也忍不住了,(大笑)哈哈哈哈!

(哭泣):

用于表达伤心哭泣。

示例: 她捂着脸,(哭泣)呜呜呜,再也说不出一句话。

(叹气):

用于表达失望、无奈或疲惫。

示例: 事情怎么会变成这样……(叹气)唉。

高级用法与组合示例

组合不同的指令,可以创造出富有层次和动态变化的语音效果。

中文示例 (展示灵活性):

(愤怒)你竟然敢背叛我!(语气激动) 我对你这么信任,(大声) 你就是这样回报我的吗?

重要提示与最佳实践

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。