数据结构

最近更新时间:2025-09-11 01:51:02

我的收藏

AgeDetectTask

年龄语音识别子任务

被如下接口引用:CreateAgeDetectTask。

名称 类型 必选 描述
DataId String 数据唯一ID
示例值:abcd
Url String 数据文件的url,为 urlencode 编码,音频文件格式支持的类型:.wav、.m4a、.amr、.mp3、.aac、.wma、.ogg
示例值:https://xxx.com/yy.wav

AgeDetectTaskResult

年龄语音任务结果

被如下接口引用:DescribeAgeDetectTask。

名称 类型 描述
DataId String 数据唯一ID
示例值:abcd
Url String 数据文件的url
示例值:https://xxx.com/yyy.wav
Status Integer 任务状态,0: 已创建,1:运行中,2:正常结束,3:异常结束,4:运行超时
示例值:2
Age Integer 任务结果:0: 成年,1:未成年,100:未知
示例值:1

AgentConfig

机器人参数

被如下接口引用:StartAIConversation。

名称 类型 必选 描述
UserId String 机器人的UserId,用于进房发起任务。【注意】这个UserId不能与当前房间内的主播观众UserId重复。如果一个房间发起多个任务时,机器人的UserId也不能相互重复,否则会中断前一个任务。需要保证机器人UserId在房间内唯一。
示例值:user_124
UserSig String 机器人UserId对应的校验签名,即UserId和UserSig相当于机器人进房的登录密码。
示例值:ehbciOiJS
TargetUserId String 机器人拉流的UserId, 填写后,机器人会拉取该UserId的流进行实时处理
示例值:user_124
MaxIdleTime Integer 房间内超过MaxIdleTime 没有推流,后台自动关闭任务,默认值是60s。
示例值:60
WelcomeMessage String 机器人的欢迎语
示例值:你好呀
InterruptMode Integer 智能打断模式,默认为0,0表示服务端自动打断,1表示服务端不打断,由端上发送打断信令进行打断
示例值:0
InterruptSpeechDuration Integer InterruptMode为0时使用,单位为毫秒,默认为500ms。表示服务端检测到持续InterruptSpeechDuration毫秒的人声则进行打断。
示例值:500
TurnDetectionMode Integer 控制新一轮对话的触发方式,默认为0。
- 0表示当服务端语音识别检测出的完整一句话后,自动触发一轮新的对话。
- 1表示客户端在收到字幕消息后,自行决定是否手动发送聊天信令触发一轮新的对话。
示例值:0
FilterOneWord Boolean 是否过滤掉用户只说了一个字的句子,true表示过滤,false表示不过滤,默认值为true
示例值:true
WelcomeMessagePriority Integer 欢迎消息优先级,0默认,1高优,高优不能被打断。
示例值:0
FilterBracketsContent Integer 用于过滤LLM返回内容,不播放括号中的内容。
1:中文括号()
2:英文括号()
3:中文方括号【】
4:英文方括号[]
5:英文花括号{}
默认值为空,表示不进行过滤。
示例值:1
AmbientSound AmbientSound 环境音设置
VoicePrint VoicePrint 声纹配置
InitLLMMessage String 与WelcomeMessage参数互斥,当该参数有值时,WelcomeMessage将失效。\n在对话开始后把该消息送到大模型来获取欢迎语。
示例值:你好呀
TurnDetection TurnDetection 语义断句检测
SubtitleMode Integer 机器人字幕显示模式。 - 0表示尽快显示,不会和音频播放进行同步。此时字幕全量下发,后面的字幕会包含前面的字幕。 - 1表示句子级别的实时显示,会和音频播放进行同步,只有当前句子对应的音频播放完后,下一条字幕才会下发。此时字幕增量下发,端上需要把前后的字幕进行拼接才是完整字幕。
示例值:1

AmbientSound

背景音设置,将在通话中添加环境音效,使体验更加逼真。目前支持以下选项:
coffee_shops: 咖啡店氛围,背景中有人聊天。
busy_office: 客服中心
street_traffic: 户外街道
evening_mountain: 户外山林

被如下接口引用:StartAIConversation。

名称 类型 必选 描述
Scene String 环境场景选择
示例值:coffee_shops
Volume Float 控制环境音的音量。取值的范围是 [0,2]。值越低,环境音越小;值越高,环境音越响亮。如果未设置,则使用默认值 1。
示例值:1.0

AppStatisticsItem

应用用量统计数据

被如下接口引用:DescribeAppStatistics。

名称 类型 描述
RealtimeSpeechStatisticsItem RealTimeSpeechStatisticsItem 实时语音统计数据
示例值:{"MainLandPcu":1,"OverseaDuration":1,"OverseaPcu":1,"OverseaDau":1,"MainLandDuration":1,"MainLandDau":1}
VoiceMessageStatisticsItem VoiceMessageStatisticsItem 语音消息统计数据
示例值:{"Dau":1018}
VoiceFilterStatisticsItem VoiceFilterStatisticsItem 语音过滤统计数据
示例值:{"Duration" : 18000}
Date Date 统计时间
示例值:2022-10-01
AudioTextStatisticsItem AudioTextStatisticsItem 录音转文本用量统计数据
示例值:{"Data":0}
StreamTextStatisticsItem StreamTextStatisticsItem 流式转文本用量数据
示例值:{"Data":0}
OverseaTextStatisticsItem OverseaTextStatisticsItem 海外转文本用量数据
示例值:{"Data":0}
RealtimeTextStatisticsItem RealtimeTextStatisticsItem 实时语音转文本用量数据
示例值:{"Data":0}

ApplicationDataStatistics

应用统计数据

被如下接口引用:DescribeApplicationData。

名称 类型 描述
BizId Integer 应用ID
示例值:1400000000
DauDataNum Integer Dau统计项数目
示例值:25
DauDataMainland Array of StatisticsItem 大陆地区Dau统计数据,单位人
DauDataOversea Array of StatisticsItem 海外地区Dau统计数据,单位人
DauDataSum Array of StatisticsItem 大陆和海外地区Dau统计数据汇总,单位人
DurationDataNum Integer 实时语音时长统计项数目
示例值:34
DurationDataMainland Array of StatisticsItem 大陆地区实时语音时长统计数据,单位分钟
DurationDataOversea Array of StatisticsItem 海外地区实时语音时长统计数据,单位分钟
DurationDataSum Array of StatisticsItem 大陆和海外地区实时语音时长统计数据汇总,单位分钟
PcuDataNum Integer Pcu统计项数目
示例值:38
PcuDataMainland Array of StatisticsItem 大陆地区Pcu统计数据,单位人
PcuDataOversea Array of StatisticsItem 海外地区Pcu统计数据,单位人
PcuDataSum Array of StatisticsItem 大陆和海外地区Pcu统计数据汇总,单位人
MiniGameDataNum Integer 小游戏时长统计项数目
MiniGameDataMainland Array of StatisticsItem 大陆地区小游戏时长统计数据,单位分钟
MiniGameDataOversea Array of StatisticsItem 海外地区小游戏时长统计数据,单位分钟
MiniGameDataSum Array of StatisticsItem 大陆和海外地区小游戏时长统计数据汇总,单位分钟

ApplicationList

获取应用列表返回

被如下接口引用:DescribeApplicationList。

名称 类型 描述
ServiceConf ServiceStatus 服务开关状态
BizId Integer 应用ID(AppID)
示例值:1400000000
AppName String 应用名称
示例值:app_test
ProjectId Integer 项目ID,默认为0
示例值:1
AppStatus Integer 应用状态,返回0表示正常,1表示关闭,2表示欠费停服,3表示欠费回收
示例值:1
CreateTime Integer 创建时间,Unix时间戳格式
示例值:1736238797
AppType Integer 应用类型,无需关注此数值
示例值:1

AsrConf

语音转文本配置数据

被如下接口引用:CreateApp。

名称 类型 必选 描述
Status String 语音转文本服务开关,取值:open/close
示例值:open

AudioTextStatisticsItem

录音转文本用量统计数据

被如下接口引用:DescribeAppStatistics。

名称 类型 描述
Data Float 统计值,单位:秒
示例值:1.23

CreateAppResp

CreateApp的输出参数

被如下接口引用:CreateApp。

名称 类型 描述
BizId Integer 应用ID,由后台自动生成。
示例值:1400000000
AppName String 应用名称,透传输入参数的AppName
示例值:app_test1
ProjectId Integer 项目ID,透传输入的ProjectId
示例值:0
SecretKey String 应用密钥,GME SDK初始化时使用
示例值:sdsd
CreateTime Integer 服务创建时间戳
示例值:1736238797
RealtimeSpeechConf RealtimeSpeechConf 实时语音服务配置数据
VoiceMessageConf VoiceMessageConf 语音消息服务配置数据
VoiceFilterConf VoiceFilterConf 语音分析服务配置数据
AsrConf AsrConf 语音转文本服务配置数据

CustomizationConfigs

语音消息转文本热句模型配置

被如下接口引用:GetCustomizationList。

名称 类型 必选 描述
BizId Integer 应用 ID,登录控制台创建应用得到的AppID
示例值:1400000000
ModelId String 模型ID
示例值:f440dfa77ae411eda5d3564a2eb5fd49
ModelState Integer 模型状态,-1下线状态,1上线状态, 0训练中, -2训练失败, 3上线中, 4下线中
示例值:1
ModelName String 模型名称
示例值:ModelName
TextUrl String 文本文件的下载地址,服务会从该地址下载文件,目前仅支持腾讯云cos
示例值:https://file.myqcloud.com/keywords_template.txt
UpdateTime Integer 更新时间,11位时间戳
示例值:1736238797

DeleteResult

剔除房间操作结果

被如下接口引用:DeleteRoomMember。

名称 类型 描述
Code Integer 错误码,0-剔除成功 其他-剔除失败
示例值:1300000
ErrorMsg String 错误描述
示例值:room does not exist

DescribeAppStatisticsResp

获取应用用量统计数据输出参数

被如下接口引用:DescribeAppStatistics。

名称 类型 描述
AppStatistics Array of AppStatisticsItem 应用用量统计数据
示例值:[]

DescribeScanResult

语音检测结果返回

被如下接口引用:DescribeScanResultList。

名称 类型 描述
Code Integer 业务返回码
示例值:0
DataId String 数据唯一 ID
示例值:1400000000_test_data_id
ScanFinishTime Integer 检测完成的时间戳
示例值:1566720906
HitFlag Boolean 是否违规
示例值:false
Live Boolean 是否为流
示例值:false
Msg String 业务返回描述
示例值:Success
ScanPiece Array of ScanPiece 检测结果,Code 为 0 时返回
ScanStartTime Integer 提交检测的时间戳
示例值:1574684231
Scenes Array of String 语音检测场景,对应请求时的 Scene
示例值:["default"]
TaskId String 语音检测任务 ID,由后台分配
示例值:6330xxxx-9xx7-11ed-98e3-52xxxxe4ac3b
Url String 文件或接流地址
示例值:http://xx.mp3
Status String 检测任务执行结果状态,分别为:
  • Start: 任务开始
  • Success: 成功结束
  • Error: 异常

  • 示例值:Success
    BizId Integer 提交检测的应用 ID
    示例值:140011111

    Filter

    查找过滤

    被如下接口引用:DescribeApplicationList。

    名称 类型 必选 描述
    Name String 要过滤的字段名, 比如"AppName"
    示例值:AppName
    Values Array of String 多个关键字
    示例值:app_game

    InOutTimeInfo

    房间内的事件

    被如下接口引用:DescribeUserInAndOutTime。

    名称 类型 描述
    StartTime Integer 进入房间时间
    示例值:1606355700701
    EndTime Integer 退出房间时间
    示例值:1606355712545

    InvokeLLM

    调用服务端主动发起请求到LLM

    被如下接口引用:ControlAIConversation。

    名称 类型 必选 描述
    Content String 请求LLM的内容
    示例值:今天天气怎么样
    Interrupt Boolean 是否允许该文本打断机器人说话
    示例值:false

    ModifyAppStatusResp

    ModifyAppStatus接口输出参数

    被如下接口引用:ModifyAppStatus。

    名称 类型 描述
    BizId Integer GME应用ID
    示例值:1400000000
    Status String 应用状态,取值:open/close
    示例值:open

    OverseaTextStatisticsItem

    海外转文本用量数据

    被如下接口引用:DescribeAppStatistics。

    名称 类型 描述
    Data Float 统计值,单位:秒
    示例值:324.88

    RealTimeSpeechStatisticsItem

    实时语音用量统计数据

    被如下接口引用:DescribeAppStatistics。

    名称 类型 描述
    MainLandDau Integer 大陆地区DAU
    示例值:764
    MainLandPcu Integer 大陆地区PCU
    示例值:471
    MainLandDuration Integer 大陆地区总使用时长,单位为min
    示例值:98434
    OverseaDau Integer 海外地区DAU
    示例值:643
    OverseaPcu Integer 海外地区PCU
    示例值:848
    OverseaDuration Integer 海外地区总使用时长,单位为min
    示例值:2682

    RealtimeSpeechConf

    实时语音配置数据

    被如下接口引用:CreateApp。

    名称 类型 必选 描述
    Status String 实时语音服务开关,取值:open/close
    示例值:open
    Quality String 实时语音音质类型,取值:high-高音质 ordinary-普通音质
    示例值:high

    RealtimeTextStatisticsItem

    实时语音转文本用量数据

    被如下接口引用:DescribeAppStatistics。

    名称 类型 描述
    Data Float 统计值,单位:秒
    示例值:451.26

    RecordInfo

    房间内录制信息。
    注意:此字段可能返回 null,表示取不到有效值。

    被如下接口引用:DescribeRecordInfo。

    名称 类型 描述
    UserId String 用户ID(当混流模式时,取值为0)。
    示例值:6787
    FileName String 录制文件名。
    示例值:/3400352518_2314_447947346201176660_9081
    RecordBeginTime Integer 录制开始时间(unix时间戳如:1234567868)。
    示例值:1234567868
    RecordStatus Integer 录制状态:2代表正在录制 10代表等待转码 11代表正在转码 12正在上传 13代表上传完成 14代表通知用户完成。
    示例值:2

    RoomUser

    房间内用户信息

    被如下接口引用:DescribeRoomInfo。

    名称 类型 描述
    RoomId Integer 房间id
    示例值:261974
    Uins Array of Integer 房间里用户uin列表
    示例值:[100261]
    StrRoomId String 字符串房间id
    示例值:"261974"
    StrUins Array of String 房间里用户字符串uin列表
    示例值:["100261"]

    STTConfig

    语音转文字参数

    被如下接口引用:StartAIConversation。

    名称 类型 必选 描述
    Language String
    语音转文字支持识别的语言,默认是"zh" 中文

    可通过购买「AI智能识别时长包」解锁或领取包月套餐体验版解锁不同语言.

    语音转文本不同套餐版本支持的语言如下:

    基础版
    - "zh": 中文(简体)
    - "zh-TW": 中文(繁体)
    - "en": 英语

    标准版:
    - "8k_zh_large": 普方大模型引擎. 当前模型同时支持中文等语言的识别,模型参数量极大,语言模型性能增强,针对电话音频中各类场景、各类中文方言的识别准确率极大提升.
    - "16k_zh_large": 普方英大模型引擎. 当前模型同时支持中文、英文、多种中文方言等语言的识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.
    - "16k_multi_lang": 多语种大模型引擎. 当前模型同时支持英语、日语、韩语、阿拉伯语、菲律宾语、法语、印地语、印尼语、马来语、葡萄牙语、西班牙语、泰语、土耳其语、越南语、德语的识别,可实现15个语种的自动识别(句子/段落级别).
    - "16k_zh_en": 中英大模型引擎. 当前模型同时支持中文、英语识别,模型参数量极大,语言模型性能增强,针对噪声大、回音大、人声小、人声远等低质量音频的识别准确率极大提升.

    高级版:
    - "zh-dialect": 中国方言
    - "zh-yue": 中国粤语
    - "vi": 越南语
    - "ja": 日语
    - "ko": 韩语
    - "id": 印度尼西亚语
    - "th": 泰语
    - "pt": 葡萄牙语
    - "tr": 土耳其语
    - "ar": 阿拉伯语
    - "es": 西班牙语
    - "hi": 印地语
    - "fr": 法语
    - "ms": 马来语
    - "fil": 菲律宾语
    - "de": 德语
    - "it": 意大利语
    - "ru": 俄语
    - "sv": 瑞典语
    - "da": 丹麦语
    - "no": 挪威语

    注意:
    如果缺少满足您需求的语言,请联系我们技术人员。
    示例值:zh
    AlternativeLanguage Array of String 发起模糊识别为高级版能力,默认按照高级版收费,仅支持填写基础版和高级版语言.
    注意:不支持填写"zh-dialect"
    示例值:["AlternativeLanguage"]
    CustomParam String 自定义参数,联系后台使用

    示例值:CustomParam
    VadSilenceTime Integer 语音识别vad的时间,范围为240-2000,默认为1000,单位为ms。更小的值会让语音识别分句更快。
    示例值:1000
    HotWordList String 热词表:该参数用于提升识别准确率。 单个热词限制:"热词|权重",单个热词不超过30个字符(最多10个汉字),权重[1-11]或者100,如:“腾讯云|5” 或 “ASR|11”; 热词表限制:多个热词用英文逗号分割,最多支持128个热词,如:“腾讯云|10,语音识别|5,ASR|11”;
    示例值:腾讯云|10,语音识别|5,ASR|11
    VadLevel Integer vad的远场人声抑制能力(不会对asr识别效果造成影响),范围为[0, 3],默认为0。推荐设置为2,有较好的远场人声抑制能力。
    示例值:1

    ScanDetail

    语音检测详情

    被如下接口引用:DescribeScanResultList。

    名称 类型 描述
    Label String 违规场景,参照Label定义
    示例值:abuse
    Rate String 该场景下概率[0.00,100.00],分值越大违规概率越高
    示例值:90.00
    KeyWord String 违规关键字
    示例值:违规字
    StartTime Integer 关键字在音频的开始时间,从0开始的偏移量,单位为毫秒,Label=moan时有效
    示例值:1736238797
    EndTime Integer 关键字在音频的结束时间,从0开始的偏移量,,单位为毫秒,Label=moan时有效
    示例值:1736249000

    ScanPiece

    语音检测结果,Code 为 0 时返回

    被如下接口引用:DescribeScanResultList。

    名称 类型 描述
    DumpUrl String 流检测时返回,音频转存地址,保留30min
    示例值:https://cos.xxx.com/tianyu-xxx-1200000000/w-audio-ZxxxI8xxxqGxxxxr/audio_0_1600000000.mp3?X-Amz-xxxxxxxxx=
    HitFlag Boolean 是否违规
    示例值:false
    MainType String 违规主要类型
    示例值:normal
    ScanDetail Array of ScanDetail 语音检测详情
    RoomId String gme实时语音房间ID,透传任务传入时的RoomId
    示例值:261974
    OpenId String gme实时语音用户ID,透传任务传入时的OpenId
    示例值:1001807
    Info String 备注
    示例值:现在开始第一段测试....
    Offset Integer 流检测时分片在流中的偏移时间,单位毫秒
    示例值:0
    Duration Integer 流检测时分片时长
    示例值:0
    PieceStartTime Integer 分片开始检测时间
    示例值:0

    ScanVoiceResult

    语音检测返回结果

    被如下接口引用:ScanVoice。

    名称 类型 描述
    DataId String 数据ID
    示例值:1400000000_test_data_id
    TaskId String 任务ID
    示例值:6330xxxx-9xx7-11ed-98e3-52xxxxe4ac3b

    SceneInfo

    SceneInfo场景信息
    'RealTime','实时语音分析',
    'VoiceMessage','语音消息',
    'GMECloudApi':'GME云API接口'

    被如下接口引用:CreateApp。

    名称 类型 必选 描述
    SceneId String 'RealTime','实时语音分析',
    'VoiceMessage','语音消息',
    'GMECloudApi':'GME云API接口'
    示例值:RealTime
    Status Boolean 开关状态,true开启/false关闭
    示例值:false
    CallbackUrl String 用户回调地址
    示例值:https://0.0.0.0/user_callback

    ServerPushText

    服务端控制AI对话机器人播报指定文本

    被如下接口引用:ControlAIConversation。

    名称 类型 必选 描述
    Text String 服务端推送播报文本
    Interrupt Boolean 是否允许该文本打断机器人说话
    StopAfterPlay Boolean 播报完文本后,是否自动关闭对话任务
    Audio String 服务端推送播报音频
    格式说明:音频必须为单声道,采样率必须跟对应TTS的采样率保持一致,编码为Base64字符串。
    输入规则:当提供Audio字段时,将不接受Text字段的输入。系统将直接播放Audio字段中的音频内容。
    DropMode Integer 默认为0,仅在Interrupt为false时有效
    - 0表示当前有交互发生时,会丢弃Interrupt为false的消息
    - 1表示当前有交互发生时,不会丢弃Interrupt为false的消息,而是缓存下来,等待当前交互结束后,再去处理

    注意:DropMode为1时,允许缓存多个消息,如果后续出现了打断,缓存的消息会被清空
    示例值:0
    Priority Integer ServerPushText消息的优先级,0表示可被打断,1表示不会被打断。目前仅支持传入0,如果需要传入1,请提工单联系我们添加权限。
    注意:在接收到Priority=1的消息后,后续其他任何消息都会被忽略(包括Priority=1的消息),直到Priority=1的消息处理结束。该字段可与Interrupt、DropMode字段配合使用。
    例子:
    - Priority=1、Interrupt=true,会打断现有交互,立刻播报,播报过程中不会被打断
    - Priority=1、Interrupt=false、DropMode=1,会等待当前交互结束,再进行播报,播报过程中不会被打断

    示例值:0

    ServiceStatus

    服务开关状态

    被如下接口引用:DescribeApplicationList。

    名称 类型 描述
    RealTimeSpeech StatusInfo 实时语音服务开关状态
    示例值:1
    VoiceMessage StatusInfo 语音消息服务开关状态
    示例值:1
    Porn StatusInfo 语音内容安全服务开关状态
    示例值:1
    Live StatusInfo 语音录制服务开关状态
    示例值:1
    RealTimeAsr StatusInfo 语音转文本服务开关状态
    示例值:1
    TextTranslate StatusInfo 文本翻译服务开关状态
    示例值:1

    StatisticsItem

    用量数据单元

    被如下接口引用:DescribeApplicationData。

    名称 类型 描述
    StatDate Date 日期,格式为年-月-日,如2018-07-13
    示例值:2020-09-22
    Data Integer 统计值
    示例值:1087

    StatusInfo

    服务开关状态

    被如下接口引用:DescribeApplicationList。

    名称 类型 描述
    Status Integer 服务开关状态, 0-正常,1-关闭
    示例值:0

    StreamTextStatisticsItem

    流式转文本用量数据

    被如下接口引用:DescribeAppStatistics。

    名称 类型 描述
    Data Float 统计值,单位:秒
    示例值:825.31

    SubscribeRecordUserIds

    指定订阅流白名单或者黑名单。

    被如下接口引用:DescribeTaskInfo, ModifyRecordInfo, StartRecord。

    名称 类型 必选 描述
    UnSubscribeUserIds Array of String 订阅音频流黑名单,指定不订阅哪几个UserId的音频流,例如["1", "2", "3"], 代表不订阅UserId 1,2,3的音频流。默认不填订阅房间内所有音频流,订阅列表用户数不超过20。
    注意:只能同时设置UnSubscribeAudioUserIds、SubscribeAudioUserIds 其中1个参数
    示例值:7619
    SubscribeUserIds Array of String 订阅音频流白名单,指定订阅哪几个UserId的音频流,例如["1", "2", "3"], 代表订阅UserId 1,2,3的音频流。默认不填订阅房间内所有音频流,订阅列表用户数不超过20。
    注意:只能同时设置UnSubscribeAudioUserIds、SubscribeAudioUserIds 其中1个参数。
    示例值:3342

    Tag

    标签列表

    被如下接口引用:CreateApp, DescribeApplicationList。

    名称 类型 必选 描述
    TagKey String 标签键
    示例值:tag_key1
    TagValue String 标签值
    示例值:tag_value1

    Task

    语音检测任务列表

    被如下接口引用:ScanVoice。

    名称 类型 必选 描述
    DataId String 数据的唯一ID
    示例值:1400000000_test_data_id
    Url String 数据文件的url,为 urlencode 编码,流式则为拉流地址
    示例值:http://xxxx/audio_store/xxxx.mp3
    RoomId String gme实时语音房间ID,通过gme实时语音进行语音分析时输入
    示例值:261974
    OpenId String gme实时语音用户ID,通过gme实时语音进行语音分析时输入
    示例值:100261

    TurnDetection

    断句配置

    被如下接口引用:StartAIConversation。

    名称 类型 必选 描述
    SemanticEagerness String TurnDetectionMode为3时生效,语义断句的灵敏程度


    功能简介:根据用户所说的话来判断其已完成发言来分割音频


    可选: "low" | "medium" | "high" | "auto"


    auto 是默认值,与 medium 相同。
    low 将让用户有足够的时间说话。
    high 将尽快对音频进行分块。


    如果您希望模型在对话模式下更频繁地响应,可以将 SemanticEagerness 设置为 high
    如果您希望在用户停顿时,AI能够等待片刻,可以将 SemanticEagerness 设置为 low
    无论什么模式,最终都会分割送个大模型进行回复

    示例值:auto

    UserMicStatus

    用户麦克风状态

    被如下接口引用:ModifyUserMicStatus。

    名称 类型 必选 描述
    EnableMic Integer 开麦状态。1表示关闭麦克风,2表示打开麦克风。
    示例值:1
    Uid Integer 客户端用于标识用户的Openid。(Uid、StrUid必须填一个,优先处理StrUid。)
    示例值:9798
    StrUid String 客户端用于标识字符串型用户的Openid。(Uid、StrUid必须填一个,优先处理StrUid。)
    示例值:jelly

    VoiceFilterConf

    语音过滤服务配置数据

    被如下接口引用:CreateApp。

    名称 类型 必选 描述
    Status String 语音过滤服务开关,取值:open/close
    示例值:open
    SceneInfos Array of SceneInfo 场景配置信息,如开关状态,回调地址。

    VoiceFilterStatisticsItem

    语音过滤用量统计数据

    被如下接口引用:DescribeAppStatistics。

    名称 类型 描述
    Duration Integer 语音过滤总时长,单位为min
    示例值:100

    VoiceMessageConf

    离线语音服务配置数据

    被如下接口引用:CreateApp。

    名称 类型 必选 描述
    Status String 离线语音服务开关,取值:open/close
    示例值:open
    Language String 离线语音支持语种,取值: all-全部,cnen-中英文。默认为中英文
    示例值:all

    VoiceMessageStatisticsItem

    语音消息用量统计信息

    被如下接口引用:DescribeAppStatistics。

    名称 类型 描述
    Dau Integer 离线语音DAU
    示例值:1807

    VoicePrint

    声纹配置参数

    被如下接口引用:StartAIConversation。

    名称 类型 必选 描述
    Mode Integer 默认为0,表示不启用声纹。1表示启用声纹,此时需要填写voiceprint id。
    示例值:1
    IdList Array of String VoicePrint Mode为1时需要填写,目前仅支持填写一个声纹id
    示例值:["your-voiceprint-id"]

    VoicePrintInfo

    声纹查询数据

    被如下接口引用:DescribeVoicePrint。

    名称 类型 描述
    VoicePrintId String 声纹ID
    示例值:1300056123-fd91f128-52a6-4692-b94a-c0f9fd3c4287
    AppId Integer 应用id
    示例值:1300056123
    VoicePrintMetaInfo String 和声纹绑定的MetaInfo
    示例值:metainfo
    CreateTime String 创建时间
    示例值:2025-05-21 19:23:54
    UpdateTime String 更新时间
    示例值:2025-05-21 19:23:54
    AudioFormat Integer 音频格式,当前只有0(代表wav)
    示例值:0
    AudioName String 音频名称
    示例值:jackson
    ReqTimestamp Integer 请求毫秒时间戳
    示例值:1748249540000