操作场景
媒体处理智能识别模板适用于需要对视频进行智能识别的场景,如人脸识别、文本全文识别、语音全文识别、语音翻译和物体识别等。您可以在服务编排管理中直接使用系统提供的智能识别预设模板,或者根据业务需要自定义创建智能识别模板。创建好的模板可在模板列表里展示,并能对模板进行筛选查看、编辑和删除等管理操作。
前提条件
1. 已 注册腾讯云 账户并完成实名认证。
操作说明
配置项 | 说明 |
模板名称 | 仅支持中文、英文、数字、空格、下划线(_)、短横线(-)和句点(.),长度不能超过64个字符。 |
智能识别项配置 | 配置项包括人脸识别、文本全文识别、语音全文识别、语音翻译、物体识别。 |
说明:
人脸识别
人脸识别可以设置过滤分数和筛选标签。
过滤分数用来约束识别结果的置信度,取值范围:0-100,默认值为95。当识别结果达到所填写分数以上,则返回识别结果。
筛选标签可以选择“娱乐明星”、“体育明星”、“政治人物”。选择后会返回对应标签结果,不选则全部返回。
语音全文识别
开启语音全文识别,需要选择视频源语言。如需在识别语音后,同时生成字幕文件,需要选择字幕文件格式。
注意:
当前字幕文件功能仅对点播任务及点播文件生效,对直播流发起的语音识别任务不生效。
当前支持的语言如下表:
视频源语言 | |||||
简体中文 | 英语 | 日语 | 韩语 | 中英粤 | 中文医疗 |
中文粤语 | 越南语 | 马来语 | 印度尼西亚语 | 菲律宾语 | 泰语 |
葡萄牙语 | 土耳其语 | 阿拉伯语 | 西班牙语 | 印地语 | 法语 |
德语 | 意大利语 | 俄语 | 中文方言 | - | - |
语音翻译
开启语音翻译功能,需要选择视频源语言,和目标翻译语言。如需在翻译语言后,同时生成字幕文件,需要选择字幕文件格式。
注意:
当前字幕文件功能仅对点播任务及点播文件生效,对直播流发起的语音识别任务不生效。
当前支持的语言如下表:
视频源语言 | ||||
简体中文 | 英语 | 日语 | 韩语 | 越南语 |
马来语 | 泰语 | 葡萄牙语 | 土耳其语 | 阿拉伯语 |
西班牙语 | 印地语 | 法语 | - | - |
文本全文识别
开启文本全文识别后,会通过回调返回视频内的文字识别结果,当前可识别中文和英语,其他语言暂不支持。