前言说明
在微软的文本转语音(TTS)服务中,计费主要基于实际合成的文本字符数。根据你提供的SSML(语音合成标记语言)代码,以下是计费和不计费的部分分析:
计费部分(实际合成的文本)
$text 变量的内容这是实际会被转换为语音的文本内容,所有字符(包括空格、标点符号)都会被计入计费。
例如:"Hello, world!" 会计为 13 个字符(包括逗号和空格)。
不计费部分(SSML标签和属性)
以下SSML标签和属性不会被计入计费:
所有XML标签:
<speak>, <voice>, <mstts:express-as>, <prosody> 等标签本身。
标签属性:
如 version="1.0"、xmlns、xml:lang、name、role、style、styledegree、volume、rate、pitch 等
背景音频配置:
<mstts:backgroundaudio> 及其属性(src、volume、fadein、fadeout)不计费。
SSML中的注释或格式字符:
例如换行符、缩进空格(如代码中的格式化空格)。
注意事项
SSML中的转义字符:
如果 $text 中包含转义字符(如 < 代表 <),会计为实际显示的字符数(< 会计为 4 个字符)。
动态变量的值:
如果 $language、$voice、$role 等变量的值包含在 $text 中(例如通过拼接),则会计费;否则仅作为参数不收费。
微软的计费规则:
微软官方文档明确说明仅对 <speak> 标签内的文本内容计费,SSML标签本身不计费。
示例计算
假设 $text = "Hello",其他变量为固定值,则:
- 计费字符:Hello(5 个字符)。
- 不计费:其余所有SSML标签和属性(即使代码有数百字符)。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)