AI 智能识别

最近更新时间:2025-09-29 17:29:22

我的收藏
AI 智能识别包括语音转文本和实时翻译两个能力。
语音转文本识别 TRTC 房间内指定用户或所有用户的音频流,将其进行语音转文本(Speech-To-Text,STT)识别并输出。
实时翻译在语音转文本的基础上,通过 AI 将转写出来的文本翻译成目标语言。

计费说明

付费方式
价格

AI 智能识别时长包

(预付费)
AI 智能识别轻量版:50 元/月(每个账号限购 1 次),含 1,000 分钟抵扣量。
AI 智能识别基础版:500 元/月,含 10,000 分钟抵扣量。
AI 智能识别尊享版:1000 元/月,含 20,000 分钟抵扣量。
注意:
购买包月套餐尊享版 Plus 或 旗舰版 Plus 后赠送的 AI 智能识别时长包,抵扣规则同购买 AI 智能识别时长包的抵扣规则一致。
购买以上任一规格的套餐包,均支持 API 文档 中所有模型的识别。针对不同模型单价和抵扣不同,具体如下:
赠送的分钟数可抵扣基础语言引擎、标准语言引擎、高级语言引擎的用量,抵扣系数的比例为 1 : 1.6 : 3。标准语言引擎于 2025 年 5 月 20 日起,支持 AI 智能识别时长包抵扣。自 2025 年 9 月 24 日 0 时起,支持抵扣实时翻译用量,抵扣比例为 1 : 1.4 。
套餐包的有效期为购买当日 - 次月当日。例如:2025年3月1日购买,其有效时间为2025年3月1日 - 2025年4月1日。
每个套餐仅对单个 SDKAppID 生效,可用于抵扣当前应用(SDKAppID)产生的 AI 智能识别时长用量消耗,如果您有多个 SDKAppID 需要购买,您需依次为其 购买 单独的套餐。超额的部分按套餐外超量费用进行收费。
当单个 SDKAppID 购买的 AI 智能识别套餐包到期后,对应应用解锁的增值功能也将停用,建议您购买时,开启自动续期避免影响业务使用。开启续期:登录腾讯云控制台 > 费用中心,在左侧导航中选择 续期管理
AI 智能识别套餐包退费规则详细请参见 退费说明

套餐外超量费用

(日结后付费)
语音转文本支持的所有语言可参见 API 文档
基础语言引擎:0.05 元/分钟,支持普通话(简体)、普通话(繁体)、英语的单语种识别。
标准语言引擎:0.08 元/分钟,支持普通话(简体)、普通话(繁体)、英语、方言、海外多语种的混合识别。
高级语言引擎:0.15 元/分钟,支持小语种精准识别。
注意:
购买 AI 智能识别任一规格套餐包时,当赠送的抵扣量用尽且套餐包仍在有效期内时,超出的用量会按照套餐外超量费用进行计费。
实时翻译支持的所有语言可参见 支持语种列表
实时翻译引擎:0.07 元/分钟,支持15种语言的翻译。
解锁 AI 智能识别能力位的方式具体如下:
说明:
若您领取了实时音视频 包月套餐体验版本,也可快速试用 AI 智能识别所有功能,产生的用量按照日结后付费形式收取。
并发限制 100 QPS ,若您有更高的并发需求,请 联系我们
套餐包
版本
语音转文本
实时翻译
轻量版(1000 分钟)
基础版(10000 分钟)
-
尊享版(20000 分钟)
体验版
入门版
-
-
基础版
-
-
尊享版
-
-
尊享版 Plus
-
旗舰版
-
-
旗舰版 Plus

用量统计

语音转文本

只有开始参与 AI 智能识别的音频时长才进行用量统计。
主播多路流输入,若调用不同的语言引擎模型,则按照不同语言引擎单价进行区分收费。
注意:
使用 AI 智能识别服务时,将会有机器人作为虚拟观众加入房间,订阅需要识别的音频流。机器人费用按照 音视频时长计费规则 进行计费。
时长统计精度为秒,按 SDKAppID 维度,以每日累计秒数转换成分钟数后进行计费,不足一分钟按一分钟计。

实时翻译

按照参与 AI 智能识别翻译能力的音频时长进行用量统计。
主播单路流输入,若输出多种翻译语言,则按照输入的音频时长 * 输出的语种个数进行收费。
说明:
时长统计精度为秒,按日累计秒数转换成分钟数后进行计费,不足一分钟按一分钟计算。

计费示例

示例 1

用户 A 希望使用语音转文本的功能,那么需要购买 AI 智能识别任一规格套餐包,在2024年11月01日一次性购买了 AI 智能识别(10,000 分钟规格)3个月,并开启了“自动续期”功能。
则:
客户一次性付费 = 500元/月 × 3个月 = 1500元,(3个月套餐分别在2024年11月01日、2024年12月01日、2025年01月01日下发)。
从2025年02月01日开始触发“自动续费”,每月自动扣费500元,并下发 AI 智能识别包含 10,000 时长的套餐包。
说明:
自动续期可随时前往费用中心 > 续期管理 关闭。

示例 2

用户 A 和 B 用中文通话,观众 C 需要看到英文字幕,观众 D 需要看到日文字幕,使用大语言模型进行语音转文本,再使用实时翻译的功能,通话 5 分钟的计费如下:
计费类型
用户 A
用户 B
小计
语音转文本
5 分钟
5 分钟
10 分钟
实时翻译
5 分钟 * 2
5 分钟 * 2
20 分钟
分析:
语音转文本:共产生 10 分钟用量,单价为 0.08 元/分钟,共 0.8 元。
实时翻译:共产生 20 分钟用量,单价为 0.07 元/分钟,共 1.4 元。
则此场景中,您需要支付 2.2 元。
注意:
本文计费示例采用刊例价计算,如果您与腾讯云的商务经理签订了合同,以合同约定的价格为准。

接入说明

AI 智能识别具体接入步骤请参见 语音转录与翻译 接入说明。

支持的语言列表


支持语言种类
支持方言种类
语音转文本
中文、英语、越南语、日语、韩语、印度尼西亚语、泰语、葡萄牙语、土耳其语、阿拉伯语、西班牙语、印地语、法语、马来语、菲律宾语、德语、意大利语、俄语、瑞典语、丹麦语、挪威语。
上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话、闽南语、广东话、客家话、南宁话。
实时翻译
中文、英语、越南语、日语、韩语、印度尼西亚语、泰语、葡萄牙语、阿拉伯语、西班牙语、法语、马来语、德语、意大利语、俄语。
/