文档中心>云点播>实践教程>如何基于 VOD 能力构建视频问答 Agent

如何基于 VOD 能力构建视频问答 Agent

最近更新时间:2026-05-14 11:18:22

我的收藏

能力介绍

VOD 提供智能媒资 Agent 能力,支持对智能媒资库内的媒体资源进行自然语言问答,实现便捷的内容检索与交互。


计费说明

调用 VOD Agent 能力将产生以下费用:
1. 视频大模型解析费用:入库理解基于 MPS 能力计费,按照启用的理解维度进行计费:
音频级理解:收取 MPS 视频摘要费用,具体可参考 大模型视频摘要计费
视频级/画面摘要理解:收取 MPS 大模型视频理解,具体可参考 大模型理解计费
文本转录:收取 MPS 智能字幕 ASR 语音识别费用,具体可参考 智能字幕 > ASR 语音识别计费
2. 视频入库将产品向量化存储费用,具体可参考 智能媒资计费说明
3. 视频问答所产生的问答费用,具体可参考 智能媒资计费说明

接入指南

步骤一:导入到媒体知识库

您可以通过 导入媒体到知识库 接口将现有媒体文件导入到知识库中。
Definition 字段决定了系统将对视频内容进行哪些方面的分析入库:
选择的分析内容范围越广,后续进行视频智能问答时系统所能提供的答案就越精确,但同时相应的处理成本也会提高。
为方便用户快速上手,VOD 平台内置了多种预置模板,包括100(音频分析)和101(视频分析)等常用模板。您可以直接使用这些预设模板,也可以通过 获取大模型解析模板列表 接口来查看可用模板的详细配置信息。
如果预设模板不能满足您的特定需求,您还可以调用 创建大模型解析模板 接口,根据实际业务场景创建完全自定义的分析模板,以获得更符合您需求的内容分析结果。
任务提交后,系统将在后台自动执行处理流程。您可以通过 查询任务详情 接口查询任务的处理进度和当前状态。

步骤二:创建 API Token

在进行调用前,需要通过 创建 AIGC API Token 接口创建 API Token。
注意:
Token 没有过期时间,只要不主动删除,Token 长期有效,无需每次调用都创建一个 token。
创建的 Token 会与选择的子应用关联,后续调用 Agent 时,会自动搜索该子应用下的知识库,并根据媒体内容进行回答。
请妥善保管您创建的 Token,避免泄露。

步骤三:调用 Agent

智能媒资 Agent 通过 OpenAI Chat Completion 兼容接口进行调用。
请求地址 (URL):https://smartmedia.vod-qcloud.com/v1/chat/completions
请求方式:POST

使用 OpenAI SDK

安装 SDK:
pip install openai
调用 API:
from openai import OpenAI

client = OpenAI(
api_key="API_TOKEN",
base_url="https://smartmedia.vod-qcloud.com/v1"
)

response = client.chat.completions.create(
model="default",
messages=[
{"role": "user", "content": "Hi, how are you?"},
]
)

print(f"Text:\\n{response.choices[0].message.content}\\n")

使用 Curl

curl -X POST https://smartmedia.vod-qcloud.com/v1/chat/completions \\
-H "Content-Type: application/json" \\
-H "Authorization: Bearer ${API_TOKEN}" \\
-d '{
"stream": true,
"messages": [
{
"role": "user",
"content": "who are you?"
}
]
}'