基本操作
1、按下图选择自己克隆后的声音角色或公共角色
2、选择“克隆”接口后,权限选择“个人”可直接定位自己所有克隆的声音角色
3、选择好音色后,在“参数设置”里可以选择不同的配音版本,版本的差异请查看下面的版本说明
版本说明
版本 | 标签 | 详细说明 |
---|---|---|
V1 | 标准版 | 普通版本 |
V2 | 情绪Pro版 | 支持停顿、呼吸、咳嗽、笑声,叹息等控制指令 |
Fish S1 | 情绪MAX版 | 支持开心,生气,疑问,大笑,哭泣,悄悄话,大声,激动等情感控制 |
Fish S1+Mini | 快速版 | 轻量快速生成语音 |
使用说明
语音合成精细控制(V2版本)
开始使用
要使用精细控制功能,可能会降低阅读数字、日期和URL的稳定性。您需要手动处理这些情况以获得最佳效果。
音素控制
音素控制允许您为单词或字符指定精确的发音。目前支持:
- CMU Arpabet (英语)
- 拼音 (中文)
使用音素控制时,请将所需发音包含在 <|phoneme_start|> 和 <|phoneme_end|> 标签中。每个标签应包含一个单词或字符。
示例
Standard: I am an engineer.
With control: I am an <|phoneme_start|>EH N JH AH N IH R<|phoneme_end|>.
标准: 我是一个工程师。
控制: 我是一个<|phoneme_start|>gong1<|phoneme_end|><|phoneme_start|>cheng2<|phoneme_end|><|phoneme_start|>shi1<|phoneme_end|>。
副语言控制
副语言控制允许您添加自然语音元素和停顿,使生成的语音听起来更像人类。主要有两种类型的控制:
停顿词
您可以使用常见的停顿词如"嗯"、"啊"、"um"、"uh"来控制语音的节奏。
特殊效果
以下特殊效果可以使用括号添加:
Effect | Description | First Available | Stage |
---|---|---|---|
(break) | 短暂停顿 | V2 | 实验性 |
(long-break) | 延长停顿 | V2 | 实验性 |
(breath) | 呼吸声 | V2 | 实验性 |
(laugh) | 笑声 | V2 | 实验性 |
(cough) | 咳嗽声 | V2 | 实验性 |
(lip-smacking) | 咂嘴声 | V2 | 实验性 |
(sigh) | 叹息声 | V2 | 实验性 |
效果 (laugh)、(cough)、(lip-smacking) 和 (sigh) 正在开发中。您可能需要重复多次以获得更好的效果。
English Example:
Standard: I am an engineer.
With paralanguage: I am, um, an (break) engineer.
中文示例:
标准: 我是一名工程师。
添加副语言: 我,嗯,是一名(break)工程师。
情感与控制指令(Fish S1版本)
简介
欢迎体验 Fish Audio 提供的先进AI语音技术。我们相信"怎么说"和"说什么"同样重要。为了让每一个合成的声音都不仅仅是"逼真",更能"触动人心",我们引入了一套强大的实时情感与声调控制指令系统。
这套系统是 Fish Audio S1 的核心部分,它让您能够精确地为声音注入情感、控制语速和音调。本指南将作为您的向导,全面介绍如何使用这些指令、相关的规则以及最佳实践,帮助您将创意变为富有表现力的声音作品。
本指南将全面介绍如何使用这些指令、相关的规则以及最佳实践。
1. 核心用法:指令语法
所有控制指令都必须放在括号 () 内。此语法是通用的。
基本格式:
(指令)要朗读的文本
作用范围:
一个指令会对其后的所有文本生效,直到遇到一个新的指令。中文的指令放置规则比其他语言更灵活,详见下文。
2. 指令分类与规则
指令分为三大类:情感指令、语气控制指令和副语言指令。
情感指令
情感指令用于设定一句话或一个短语的情感基调。
规则:
情感指令可以放置在句子的 开头 或 中间,这为表达提供了更大的灵活性。
示例:
• 句首用法:(愤怒)你就是这样回报我的吗?
• 句中用法:我对你这么信任,(愤怒)你就是这样回报我的吗?
常用中文指令列表:
正面情绪:(开心)(兴奋)(高兴)(得意)(坚定)(感激)(自信)(愉快)
负面情绪:(生气)(气愤)(愤怒)(讽刺)(讥讽)(悲伤)(难过)(无奈)(失望)(着急)(内疚)(沮丧)
中性/疑问:(疑惑)(疑问)(质问)(思考)(惊讶)(震惊)(严肃)(平静)
语气控制指令
这类指令可以放置在句子的任意位置,以调整声音的表达方式。
速度控制:
(语速变快):
用于营造紧张、急切的氛围。
示例: 快走!后面有人在追,(语速变快)再不跑就来不及了!
(语速变慢):
用于营造庄重、思考或强调的氛围。
示例: 他一字一顿,(语速变慢)仿佛每个字都有千斤重。
音量/音调控制:
(大声):
用于模拟喊叫或需要特别强调的场景。
示例: (大声)你说什么?我听不见!
(声音变小):
用于模拟耳语、自言自语或悄悄话。
示例: 他凑到我耳边,(声音变小)悄悄告诉我一个秘密。
(语气激动):
用于表达强烈的情绪波动,如惊喜、激动。
示例: 这太不可思议了!(语气激动)我们竟然真的成功了!
副语言指令
这类指令用于模拟非语言声音,并且 必须 后跟相应的拟声词。
(大笑):
用于表达开怀大笑。
示例: 听到这个笑话,他再也忍不住了,(大笑)哈哈哈哈!
(哭泣):
用于表达伤心哭泣。
示例: 她捂着脸,(哭泣)呜呜呜,再也说不出一句话。
(叹气):
用于表达失望、无奈或疲惫。
示例: 事情怎么会变成这样……(叹气)唉。
高级用法与组合示例
组合不同的指令,可以创造出富有层次和动态变化的语音效果。
中文示例 (展示灵活性):
(愤怒)你竟然敢背叛我!(语气激动) 我对你这么信任,(大声) 你就是这样回报我的吗?
评论(0)