能力介绍
VOD 提供智能媒资 Agent 能力,支持对智能媒资库内的媒体资源进行自然语言问答,实现便捷的内容检索与交互。

计费说明
调用 VOD Agent 能力将产生以下费用:
1. 视频大模型解析费用:入库理解基于 MPS 能力计费,按照启用的理解维度进行计费:
音频级理解:收取 MPS 视频摘要费用,具体可参考 大模型视频摘要计费。
视频级/画面摘要理解:收取 MPS 大模型视频理解,具体可参考 大模型理解计费。
文本转录:收取 MPS 智能字幕 ASR 语音识别费用,具体可参考 智能字幕 > ASR 语音识别计费。
2. 视频入库将产品向量化存储费用,具体可参考 智能媒资计费说明。
3. 视频问答所产生的问答费用,具体可参考 智能媒资计费说明。
接入指南
步骤一:导入到媒体知识库
Definition 字段决定了系统将对视频内容进行哪些方面的分析入库:
选择的分析内容范围越广,后续进行视频智能问答时系统所能提供的答案就越精确,但同时相应的处理成本也会提高。
为方便用户快速上手,VOD 平台内置了多种预置模板,包括100(音频分析)和101(视频分析)等常用模板。您可以直接使用这些预设模板,也可以通过 获取大模型解析模板列表 接口来查看可用模板的详细配置信息。
如果预设模板不能满足您的特定需求,您还可以调用 创建大模型解析模板 接口,根据实际业务场景创建完全自定义的分析模板,以获得更符合您需求的内容分析结果。
步骤二:创建 API Token
注意:
Token 没有过期时间,只要不主动删除,Token 长期有效,无需每次调用都创建一个 token。
创建的 Token 会与选择的子应用关联,后续调用 Agent 时,会自动搜索该子应用下的知识库,并根据媒体内容进行回答。
请妥善保管您创建的 Token,避免泄露。
步骤三:调用 Agent
智能媒资 Agent 通过 OpenAI Chat Completion 兼容接口进行调用。
请求地址 (URL):https://smartmedia.vod-qcloud.com/v1/chat/completions
请求方式:POST
使用 OpenAI SDK
安装 SDK:
pip install openai
调用 API:
from openai import OpenAIclient = OpenAI(api_key="API_TOKEN",base_url="https://smartmedia.vod-qcloud.com/v1")response = client.chat.completions.create(model="default",messages=[{"role": "user", "content": "Hi, how are you?"},])print(f"Text:\\n{response.choices[0].message.content}\\n")
使用 Curl
curl -X POST https://smartmedia.vod-qcloud.com/v1/chat/completions \\-H "Content-Type: application/json" \\-H "Authorization: Bearer ${API_TOKEN}" \\-d '{"stream": true,"messages": [{"role": "user","content": "who are you?"}]}'