简介

欢迎体验 云声配音 提供的 Fish-Speech先进AI语音技术。我们相信“怎么说”和“说什么”同样重要。为了让每一个合成的声音都不仅仅是“逼真”,更能“触动人心”,我们引入了一套强大的实时情感与声调控制指令系统。

这套系统是 云声配音 S1 的核心部分,它让您能够精确地为声音注入情感、控制语速和音调。本教程将作为您的向导,全面介绍如何使用这些指令、相关的规则以及最佳实践,帮助您将创意变为富有表现力的声音作品。

Fish-Speech 情感与控制指令 S1 版本使用教程 1

1. 核心用法:指令语法

所有控制指令都必须放在括号 () 内,此语法为通用规则,适用于所有指令类型。

基本格式

(指令)要朗读的文本

作用范围

一个指令会对其后的所有文本生效,直到遇到一个新的指令。中文的指令放置规则比其他语言更灵活,具体详见下文各指令分类说明。

2. 指令分类与规则

指令分为三大类:情感指令、语气控制指令和副语言指令,各类指令的使用规则、示例如下,方便大家直接参考使用。

2.1 情感指令

情感指令用于设定一句话或一个短语的情感基调,是语音合成富有表现力的核心指令。

使用规则

情感指令可以放置在句子的开头或中间,为情感表达提供更大的灵活性,推荐放置在情感单元开头,效果更清晰。

使用示例

  • 句首用法:(愤怒)你就是这样回报我的吗?
  • 句中用法:我对你这么信任,(愤怒)你就是这样回报我的吗?

常用中文指令列表(可直接复制使用)

情绪类型 指令(直接复制括号内内容)
正面情绪 (开心)、(兴奋)、(高兴)、(得意)、(坚定)、(感激)、(自信)、(愉快)
负面情绪 (生气)、(气愤)、(愤怒)、(讽刺)、(讥讽)、(悲伤)、(难过)、(无奈)、(失望)、(着急)、(内疚)、(沮丧)
中性/疑问 (疑惑)、(疑问)、(质问)、(思考)、(惊讶)、(震惊)、(严肃)、(平静)

2.2 语气控制指令

这类指令可放置在句子的任意位置,用于灵活调整声音的表达方式(语速、音量、音调等),适配不同场景需求。

速度控制

  • (语速变快):用于营造紧张、急切的氛围。

示例:快走!后面有人在追,(语速变快)再不跑就来不及了!

  • (语速变慢):用于营造庄重、思考或强调的氛围。
    示例:他一字一顿,(语速变慢)仿佛每个字都有千斤重。

音量/音调控制

  • (大声):用于模拟喊叫或需要特别强调的场景。

示例:(大声)你说什么?我听不见!

  • (声音变小):用于模拟耳语、自言自语或悄悄话。
    示例:他凑到我耳边,(声音变小)悄悄告诉我一个秘密。
  • (语气激动):用于表达强烈的情绪波动,如惊喜、激动。

示例:这太不可思议了!(语气激动)我们竟然真的成功了!

2.3 副语言指令

这类指令用于模拟非语言声音,必须后跟相应的拟声词,否则无法正常生效。

  • (大笑):用于表达开怀大笑。

示例:听到这个笑话,他再也忍不住了,(大笑)哈哈哈哈!

  • (哭泣):用于表达伤心哭泣。

示例:她捂着脸,(哭泣)呜呜呜,再也说不出一句话。

  • (叹气):用于表达失望、无奈或疲惫。

示例:事情怎么会变成这样……(叹气)唉。

3. 高级用法与组合示例

组合不同类型的指令,可以创造出富有层次和动态变化的语音效果,充分发挥 S1 版本的表现力,以下为中文组合示例(体现中文指令的灵活性):

(愤怒)你竟然敢背叛我!(语气激动) 我对你这么信任,(大声) 你就是这样回报我的吗?

4. 重要提示与最佳实践

为了确保指令生效效果最佳,避免出现异常问题,请严格遵守以下提示:

  1. 严格遵守规则:虽然中文规则较灵活,但将情感指令置于情感单元的开头通常能获得最清晰的效果。
  2. 优先使用标准指令:本文表格及示例中列出的官方指令具有最高的准确率,尽量避免使用非标准指令。
  3. 慎用描述性指令:避免创造如(用悲伤安静的声音)这样的复杂指令,模型很可能会直接读出它,而不是执行命令。应组合使用标准指令,例如(悲伤)(声音变小)。
  4. 避免指令过度堆砌:在短句中使用过多指令可能会干扰模型,建议有目的地使用,聚焦核心情感和语气需求。
  5. 注意已知问题:某些拟声词(特别是笑声或哭声)的发音偶尔可能听起来不自然,这是我们正努力改进的已知问题,敬请谅解。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。