注意:
模型服务
模型服务在多个场景中使用,仅对平台内置的模型进行收费。包括:
1. 对话场景
以下对话入口中,使用模型会进行收费:
对话测试:应用设置对话页面或工作流调试页面执行。
应用评测:通过应用评测功能使用。
体验用户端及渠道:经由微信、企业微信、体验用户端三类入口使用。
API :调用对话 API ,工作流异步任务接口、知识检索 API 。
收费场景说明:
在标准模式下选用相应生成模型、思考模型、多模态问答模型、多模态阅读理解模型、Prompt 改写模型、向量模型、重排序模型、nl2sql 模型、文档解析模型等进行收费。
生成模型/思考模型:
在标准模式下的应用设置中选择生成模型,对话中模型输出结果为问答回复、文档回复、大模型直接回复、数据库回复场景。
在标准模式下的应用设置中选择思考模型,使用思考模型判断对话意图。
在工作流的大模型节点中选择模型,对话调用相关节点。
在知识库问答插件中选择模型,对话时调用插件。
Multi-Agent 模式下,调用 Agent时 按 Agent 模型上报用量。
对话过程中启用长期记忆功能,对记忆内容的写入、更新及检索操作,按所选模型对写入数据进行计量。
多模态模型:此场景下仅收取多模态问答模型 Token ,不再叠加生成模型费用。
多模态问答模型:用户提问包含图片,基于图片理解回复会按照选择的多模态问答模型上报用量。
多模态阅读理解模型:在应用设置中开启“检索知识库回答图片问题”功能,且用户提问包含图片,使用图片检索知识库进行回复的场景,会按照多模态阅读理解模型中选择的模型上报用量。
Prompt 改写模型:
在应用设置中开启“模型上下文改写”时,将对用户提问改写的结果上报用量。
在应用设置中开启“检索知识库回答图片问题”功能,且用户提问包含图片,使用图片检索知识库进行回复的场景下,调用改写模型处理问题与图片理解内容。
向量模型:
标准模式下,检索知识库结果用于回复的场景,会按照选择的向量模型上报用量。
对话时调用工作流的大模型知识问答、知识检索节点。
对话时调用知识库问答插件、知识检索插件。
重排序模型:
标准模式下,检索知识库结果用于回复的场景。
对话时调用工作流的大模型知识问答、知识检索节点。
对话时调用知识库问答插件、知识检索插件、重排序插件。
nl2sql模型:
标准模式下,开启数据库或开启 Excel 检索增强功能时,成功检索知识库中的智能化表格的场景,会按照选择的 nl2sql 模型上报用量。
对话时调用数据库 text2sql 插件。
文档解析模型:
用户在对话中输入文档,使用文档解析模型按页上报用量。
2. 一键优化场景
应用设置中,使用提示词、欢迎语、转角描述一键优化功能。
工作流节点、工作流描述中,使用一键优化功能。
3. 应用运营-对话记录智能分类
点击智能分类功能,依据所选生成模型和向量模型上报用量。
4. 生成 Widget
在 Widget 开发中,使用自然语言生成创建 Widget 。
5. 知识库使用场景
文档生成问答对、相似问题生成,根据选择的问答对生成模型上报用量。
生成知识库 Schema ,根据选择的知识库 Schema 生成模型上报用量。
模型用量可以在数据报表-资源看板-模型用量中查看:


插件
除调用知识库问答插件、知识检索插件、数据库 text2sql 插件、重排序插件会产生模型用量以外,其他插件在被调用时均按插件上报用量,调用场景包括添加为 Agent 工具调用,在工作流中调用。可在数据报表-资源看板-插件用量中查看:

知识库超量存储
使用场景:在知识库中上传文档、问答、数据库,需要对使用容量进行收费,企业维度生效,计算企业内用量之和,可使用套餐包中的知识库容量、PU 资源、增购预付费资源包。扣费优先级:套餐包中的知识库容量 > 套餐包中的 PU 包 > 预付费资源包。
扣费逻辑:上传的知识优先使用套餐包中的知识库容量,如超出套餐包知识库容量额度的部分被称为超额使用量,将对知识库超额使用量进行收费,直到超额部分被主动删除。 知识库超额使用量收费的计费公式如下:
超额使用量收费 = (知识库总使用量- 套餐额度)× 超额时间 × 单价金额(单位:元)
超额时间为超出免费额度部分的使用时长,直到用户删除知识库文件,使用量恢复到套餐额度以下时停止计费,每小时上报一次用量。
单价为 xx 元/ GB /小时,可使用 PU 资源进行抵扣。
知识库超额用量将区分为“存储用量”和“计算用量”,按照不同的价格计算。
存储用量:包含 cos 用量收费(客户选择 cos 文档导入,或者导入问答对,超量时上报存储用量)。
计算用量:对知识向量化后的数据进行收费。
超额存储与计算:超出套餐容量(免费 1 GB、专业版 100 GB、企业版 2 TB)时,存储按 1.5 PU / GB /小时计费,向量化计算按 60 PU / GB /小时计费。
可在数据报表-资源看板-知识库容量中查看知识库使用情况:


平台服务
1. 长期记忆
使用长期记忆时,按存储的对话条数每小时上报收费,例如 12:00 存入 1 条,12:30 存入 5 条,则 13:00 上报 12:00–13:00 区间共计 6 条。
2. 内容安全
使用自定义策略内容安全功能,按问答和答案调用次数收费,如一轮有问题和答案,则按“问题 + 答案”计为 2 次调用。
3. 联网搜索
标准模式下使用联网搜索功能,按调用搜索引擎的次数收费。
4. 对话体验(暂未收费)
涵盖音色、形象、语音通话等功能。
可在数据报表 > 资源看板 > 平台用量 中查看:
