数据结构

最近更新时间:2024-10-23 01:36:52

我的收藏

DisplayInfo

同传结果数据

被如下接口引用:TongChuanDisplay, TongChuanSync。

名称 类型 描述
SeId String 句子 ID
示例值:xxx
SeVer Integer 句子版本号
示例值:1
SourceText String 识别结果
示例值:你好
TargetText String 翻译结果
示例值:Hello
StartTime Integer 句子开始时间
示例值: 122
EndTime Integer 句子结束时间
示例值:126
IsEnd Boolean 当前句子是否已结束
示例值:false
Audio String base64编码的wav/mp3音频数据
示例值:UklGRlR/AABXQVZFZm10IBAAAAABAAEAgD4AAAB9AAACABAAZGF0YSx9AAD+

TTS

同传TTS请求参数

被如下接口引用:TongChuanRecognize, TongChuanSync。

名称 类型 必选 描述
Codec String 返回音频格式,可取值:wav,mp3,pcm
示例值:wav
VoiceType Integer 音色 ID,只包括标准音色(注,日文只有一个固定音色)。
完整的音色 ID 列表请参见音色列表
示例值:0
Volume Float 音量大小,范围[-10,10],对应音量大小。默认为0,代表正常音量,值越大音量越高。
示例值:1
Speed Float 语速,范围:[-2,6],分别对应不同语速:

- -2代表0.6倍
- -1代表0.8倍
- 0代表1.0倍(默认)
- 1代表1.2倍
- 2代表1.5倍
- 6代表2.5倍

如果需要更细化的语速,可以保留小数点后 2 位,例如0.5/1.25/2.81等。
参数值与实际语速转换,可参考代码示例
示例值:1
SampleRate Integer 音频采样率:

- 16000:16k(默认)
- 8000:8k
示例值:16000