计费概述

最近更新时间:2025-02-21 16:45:22

我的收藏
大模型知识引擎提供大模型应用构建平台,根据用户所使用的 tokens 数、知识库容量、并发数等资源进行计费,目前为公测阶段,注册开通体验即可获得一定量的免费额度。如需购买或扩容,请单击购买或联系架构师。

开通方式

大模型知识引擎的开通使用需要先通过腾讯云企业实名认证 或者腾讯云个人实名认证。通过实名认证后,首次在大模型知识引擎产品页单击产品体验时,即可开通大模型知识引擎使用权限。

免费额度

选择 DeepSeek系列 模型作为生成模型时 ,调用联网搜索限时免费中!
说明:
所有腾讯云用户通过知识引擎创建应用,选择DeepSeek-R1 或 DeepSeek-V3 作为生成模型时,限时免费试用联网搜索功能,限时免费期间不收取联网搜索调用费用。限时免费结束后,将按照调用次数进行收费。
限时免费结束时间另行通知。


通过实名认证的主账号首次登录大模型知识引擎产品时,获得一定量的免费体验额度,详情如下图所示:
资源类别
免费额度
精调知识大模型标准版
开通大模型知识引擎服务即获赠累计50万 tokens 的免费调用额度,有效期2个月;以资源包的形式发放到您的腾讯云账号中,优先扣除。(模型通用)

在活动期间(北京时间2025年2月13日起到2025年3月10日止),使用大模型知识引擎服务即额外获赠DeepSeek系列模型专属的免费额度,按个人账户50万 tokens、企业账户100万 tokens下发(有效期2个月)。免费额度用尽后,支持 开通后付费 使用。(DeepSeek系列模型目前未提供预付费资源包,仅支持开通后付费使用)

免费额度:支持在 知识引擎-计费管理-资源包 中查看。


精调知识大模型高级版
混元大模型标准版
混元大模型高级版
混元大模型长文本版
混元大模型角色扮演版
混元大模型Turbo版
医学行业大模型标准版
金融行业大模型标准版
教育行业大模型标准版
教育行业大模型高级版
DeepSeek-R1
DeepSeek-V3
应用服务-知识库容量
开通大模型知识引擎服务即获赠累计300万字符数的免费知识库容量,有效期6个月;(注:针对2024年7月5日及以后开通产品的账号生效)
到期后,知识库中的知识将被处理成“超量失效”状态,“超量失效”状态的知识在对话中不生效,且“超量失效”状态的知识30天后将被自动删除,如需要继续使用知识库,请在到期前及时购买。
原子能力-多轮改写
开通大模型知识引擎服务即获赠累计100万 tokens 原子能力token体验资源,有效期2个月,以资源包的形式发放到您的腾讯云账号中,优先扣除。

(注:针对2025年1月6日及以后开通产品的账号生效)
原子能力-Rerank
原子能力-Embedding
原子能力-解析拆分-MLLM解析
原子能力-RAG套件-知识库检索
开通大模型知识引擎服务即获赠累计500次 知识库检索调用额度,有效期2个月;以资源包的形式发放到您的腾讯云账号中,优先扣除。
(注:针对2025年1月6日及以后开通产品的账号生效)
原子能力-RAG套件-知识库容量
开通大模型知识引擎服务即获赠累计100万字符数的免费知识库容量,有效期6个月;(注:针对2025年1月6日及以后开通产品的账号生效)
该知识库容量只在调用原子能力-RAG套件中使用,与应用服务-知识库容量不共用。
原子能力-文档解析
开通大模型知识引擎服务即获赠累计500页 文档解析体验额度,有效期2个月;以资源包的形式发放到您的腾讯云账号中,优先扣除。
(注:针对2025年1月6日及以后开通产品的账号生效)

特别说明

在以下场景/功能中发生交互时,会对 tokens 产生消耗:
应用配置管理:
应用配置 > 角色设定中,一键优化功能。
知识库管理 > 问答 > 导入问答 > 文档生成问答对。
知识库管理 > 任务流程 > 插入节点 > 自动生成询问语。
知识库管理 > 任务流程 > 插入节点 > 自动生成答案的预览。
问答过程中,在应用配置中测试、应用发布后调用应用 API /使用体验链接、应用评测、应用体验。
计算消耗内容:包括用户的输入 + 系统 prompt + 召回信息(含文档、问答、开启搜索引擎后搜索召回的内容)+ 输出

备注

1. tokens 换算方式:1 tokens ≈ 1~1.5个汉字。
2. 基于已配置的任务流程会调用任务型专属模型,消耗对应的 tokens。
3. 应用对话交互中触发的应用配置的欢迎语、输出配置-回复设置中自定义的保守回复、敏感词拦截后的回复不计入 tokens 消耗。
4. 如不使用任务流程和搜索引擎,建议关闭"应用配置 > 知识来源"中的相关开关,以减少额外的 tokens 消耗。
5. 应用配置 > 知识来源中,文档和问答的召回数量会影响召回 tokens ,设定的数量越高,拼接输入到大模型的召回片段越多,消耗 tokens 数量相应增加。
注意:
在账单结算时,系统将按照免费资源包 > 预付费资源包的顺序进行结算,即免费资源包是优先扣除的。
若您欠费或因违禁原因停服后,将不能继续享受免费额度,服务恢复后可继续使用有效期范围内的免费额度。
通用免费额度:精调知识大模型标准版、精调知识大模型高级版、混元大模型系列、行业大模型系列、DeepSeek系列共用50万 tokens 免费额度。
DeepSeek系列模型活动专属的免费额度:支持 DeepSeek-R1 和 DeepSeek-V3 共用,个人账户50万 tokens、企业账户100万 tokens。
优先消耗到期时间排在前面的免费额度。

计费大纲

计费场景
计费类型
资源类型
说明
应用服务
应用服务-平台预置模型
大模型 tokens 资源包
多种预置大模型服务调用价格,包括精调知识大模型、混元大模型、行业大模型等。
大模型按量后付费
大模型共享并发包
预置大模型提供默认并发,如有并发增购的诉求可购买共享并发包。
应用服务-用户部署模型
大模型专属并发包
提供独立部署模型资源,独立部署模型不按照 tokens 消耗计费,可通过购买专属并发包使用。
应用服务(通用)
知识库扩容包
购买知识库扩容包可上传文档、问答到知识管理中实现知识问答场景。
搜索服务包
通过购买搜索服务包实现调用搜索引擎。
原子能力
文档解析
文档解析预付费资源包
提供文档解析 API ,包括同步接口、异步接口、准实时接口。
文档解析后付费
文档解析 QPS 叠加包
文档解析 API 接口购买资源包后提供 5 QPS ,如有 QPS 扩充需求,可购买 QPS 叠加包。
Embedding
Embedding 预付费资源包
提供 Embedding API。
Embedding 后付费
多轮改写
多轮改写预付费资源包
提供多轮改写 API。
多轮改写后付费
Rerank 重排序
Rerank 预付费资源包
提供Rerank 重排序 API。
Rerank 后付费
RAG 套件
知识库检索预付费资源包
提供RAG 套件相关API,包括上传知识、知识库检索等接口。
知识库检索后付费
知识库容量
购买RAG套件-知识库容量,才能使用RAG套件的接口上传知识,进行知识库检索。
该计费项与应用服务中的知识库扩容包不共用。
解析拆分
文档解析预付费资源包
提供解析拆分 API ,调用时按照执行文档解析和拆分任务进行收费。

与文档解析原子能力的计费项共用。
文档解析后付费
文档拆分后付费
购买说明:
应用服务-用户部署模型购买前需联系架构师提前部署。
如使用应用中的知识管理,需要购买知识库扩容包。
需要使用应用中的搜索增强时,可购买搜索服务包。
原子能力均按需购买。

产品价格

应用服务

大模型 tokens 资源包

定义:一次性购买一定数量的 tokens 资源包,有效期内调用模型服务时优先抵扣资源包当中的 tokens 余量, tokens 资源包如果到期未用完,会当做过期作废处理。
资源包有效期:1年,1年后未使用的资源包清零。
付费方式:预付费,购买 tokens 资源包越大,单价越低。
适用范围:稳定调用,具有一定规模的业务体量。
tokens 资源包
精调知识大模型标准版
精调知识大模型高级版
医学行业大模型标准版
金融行业大模型标准版
教育行业大模型标准版
教育行业大模型高级版
混元大模型Turbo版
1000万 tokens
¥120
¥1,200
¥120
¥180
¥180
¥900
¥240
5000万 tokens
¥600
¥6,000
¥600
¥900
¥900
¥4,350
¥1,200
1亿 tokens
¥1,180
¥11,800
¥1,180
¥1,770
¥1,770
¥8,700
¥2,300
5亿 tokens
¥5,900
¥59,000
¥5,900
¥8,850
¥8,850
¥43,000
¥11,500
10亿 tokens
¥11,700
¥117,000
¥11,700
¥17,550
¥17,550
¥84,000
¥22,600
注意:
购买的预付费 tokens 资源包有效期为1年,1年后未使用的资源包清零。
账户基础购买 tokens 预付费配额后,服务并发数保持不变,如果无法满足实际的业务需求,可按需增购并发

大模型按量后付费

定义:预置模型除了提供预付费的 tokens 资源包外,还提供按量后付费的计费方式。按量后付费根据实际调用接口产生的 tokens 数量计费,不同的模型价格不同,按照实际消耗的输入、输出总 tokens 数量,每小时对腾讯云账户进行扣费。
模型版本
单价
精调知识大模型标准版
输入:0.012元/千tokens
输出:0.012元/千tokens
精调知识大模型高级版
输入:0.12元/千tokens
输出:0.12元/千tokens
医学行业大模型标准版
输入:0.012元/千tokens
输出:0.012元/千tokens
金融行业大模型标准版
输入:0.018元/千tokens
输出:0.018元/千tokens
教育行业大模型标准版
输入:0.018元/千tokens
输出:0.018元/千tokens
教育行业大模型高级版
输入:0.06元/千tokens
输出:0.18元/千tokens
混元大模型标准版
输入:0.0045元/千tokens
输出:0.005元/千tokens
混元大模型高级版
输入:0.03元/千tokens
输出:0.1元/千tokens
混元大模型长文本版
输入:0.015元/千tokens
输出:0.06元/千tokens
混元大模型角色扮演版
输入:0.004元/千tokens
输出:0.008元/千tokens
混元大模型Turbo版
输入:0.015元/千tokens
输出:0.05元/千tokens
DeepSeek-R1
输入:0.026元/千tokens
输出:0.075元/千tokens
DeepSeek-V3
输入:0.0115元/千tokens
输出:0.017元/千tokens
注意:
支持在知识引擎管理后台-计费管理-后付费设置中开启后付费。(如DeepSeek开启后付费未生效,请提交工单联系我们)
子账号默认无后付费设置功能权限,支持主账号在用户权限管理中为子账号开通权限。

大模型并发包

定义:同时进行的会话数量,从请求发起到流式返回全部结果的整个过程都算在占用并发,一个对话占用并发时间约3-15秒不等。
付费方式:包月包年。
大模型共享并发包价格
模型版本
并发数量
包月
包年
备注
精调知识大模型标准版
1并发
¥800
¥9,200
账号下默认5并发,可在此基础上增购
2并发
¥1,250
¥15,000
5并发
¥3,000
¥35,000
精调知识大模型高级版
1并发
¥2,400
¥28,800
2并发
¥3,800
¥45,600
5并发
¥9,000
¥108,000
医学行业大模型标准版
1并发
¥1,200
¥14,400
2并发
¥1,880
¥22,500
5并发
¥4,500
¥54,000
金融行业大模型标准版
1并发
¥1,200
¥14,400
2并发
¥1,880
¥22,500
5并发
¥4,500
¥54,000
教育行业大模型标准版
1并发
¥1,200
¥14,400
2并发
¥1,880
¥22,500
5并发
¥4,500
¥54,000
教育行业大模型高级版
1并发
¥3,600
¥43,200
2并发
¥5,800
¥67,500
5并发
¥13,500
¥162,000
混元大模型标准版
1并发
¥800
¥9,200
2并发
¥1,250
¥15,000
5并发
¥3,000
¥35,000
混元大模型高级版
1并发
¥2,400
¥28,800
2并发
¥3,800
¥45,600
5并发
¥9,000
¥108,000
混元大模型长文本版
1并发
¥1,200
¥14,400
2并发
¥1,880
¥22,500
5并发
¥4,500
¥54,000
混元大模型角色扮演版
1并发
¥800
¥9,200
2并发
¥1,250
¥15,000
5并发
¥3,000
¥35,000
混元大模型Turbo版
1并发
¥2,400
¥28,800
2并发
¥3,800
¥45,600
5并发
¥9,000
¥108,000
大模型专属并发包价格
模型版本
并发数量
包月
包年
备注
精调知识大模型标准版
1并发
¥17,000
¥200,000
5并发起购(增购可按照1、2、5并发增购)
2并发
¥24,000
¥280,000
5并发
¥34,000
¥400,000
精调知识大模型高级版
1并发
¥55,000
¥660,000
2并发
¥72,000
¥860,000
5并发
¥100,000
¥1,200,000
医学行业大模型标准版
1并发
¥25,000
¥300,000
2并发
¥36,000
¥420,000
5并发
¥51,000
¥600,000
金融行业大模型标准版
1并发
¥25,000
¥300,000
2并发
¥36,000
¥420,000
5并发
¥51,000
¥600,000
教育行业大模型标准版
1并发
¥25,000
¥300,000
2并发
¥36,000
¥420,000
5并发
¥51,000
¥600,000
教育行业大模型高级版
1并发
¥76,500
¥900,000
2并发
¥108,000
¥1,260,000
5并发
¥153,000
¥1,800,000
购买说明:
购买共享并发包,同时必须购买 tokens 资源包或开通按量后付费使用。
购买专属并发包可独立使用,无需购买 tokens 资源。

知识库容量

定义:知识库容量计算用户所有应用上传的文档和问答的总字符数,删除的文档和应用不占用知识库容量。
资源有效期:可选,即将过期如需继续使用请续费。已过期的知识库仅支持删除操作。
付费方式:包年包月。
知识库扩容包
包月
包年
1000万字符
¥160
¥1,800
1亿字符
¥1,400
¥16,000
注意:
字符数不计算文档中的空格,文档中存在图片的将转存为图片链接,每张图大约换算为150个字符。
一篇3万字的硕士论文,大约相当于4万字符,50页文档。1000万字符约为250篇硕士论文,1亿字符约为2500篇硕士论文。
知识库扩容包到期说明:
到期后,知识库中的知识将被处理成“超量失效”状态,“超量失效”状态的知识在对话中不生效,且“超量失效”状态的知识30天后将被自动删除,如需要继续使用知识库,请在到期前及时续费。
“超量失效”状态的知识在购买知识库扩容包后,需要手动批量恢复并发布后,可支持正式环境对话中使用。

搜索服务包

知识引擎提供搜索服务,如您在知识来源中勾选了搜索引擎,则每次调用搜索引擎将会扣减搜索服务次数。搜索服务资源包根据业务量级划分为不同规格,可一次性付费购买,自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
资源包规格
价格
10万次
¥2,200
50万次
¥11,000
100万次
¥20,000
500万次
¥90,000
1000万次
¥170,000

原子能力

知识引擎支持以 API 形式提供原子能力接口,支持具有开发能力的用户自行搭建大模型应用,拓展大模型能力边界。
如需购买或扩容,请单击购买或联系架构师。
原子能力资源包根据业务量级划分为不同规格,可一次性付费购买,自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
注意:
调用量的扣费顺序为:免费额度->资源包,即先消耗账号中的免费额度,免费额度耗尽后再消耗资源包。

Embedding

Embedding 原子能力可通过 API 进行调用,单击 Embedding 查看 API 文档。资源包自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
Embedding预付费资源包
资源包规格
价格
5000万 tokens
¥100
1亿 tokens
¥200
5亿 tokens
¥900
10亿 tokens
¥1,800
Embedding后付费
后付费
单价
Embedding
0.002元/千tokens

多轮改写

多轮改写原子能力可通过 API 进行调用,单击多轮改写查看 API 文档。资源包自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
多轮改写预付费资源包
资源包规格
价格
1000万 tokens
¥60
5000万 tokens
¥300
1亿 tokens
¥600
5亿 tokens
¥2,800
10亿 tokens
¥5,600
多轮改写后付费
后付费
单价
多轮改写
0.006元/千tokens

文档解析

文档解析资源包
文档解析原子能力可通过 API 进行调用,单击 文档解析 查看 API 文档。资源包自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
文档解析预付费资源包
资源包规格
价格
500页
¥100
1000页
¥180
1万页
¥1,700
5万页
¥5,600
10万页
¥9,800
50万页
¥40,000
100万页
¥75,000
500万页
¥290,000
文档解析后付费
后付费
单价
文档解析
0.2元/页
注意:
文档解析按照文档调用成功的页数计费;不同文档按页计费规则:doc、docx、ppt、pptx、pdf、jpeg、png 按单页计量;xlsx、txt、md、csv 以1份为一页。
文档解析 QPS 叠加包
购买预付费资源包后,默认提供 5 QPS,可按接口类型增购。
接口类型
价格
同步接口
¥10,000/QPS/月
异步接口
实时接口

Rerank

Rerank 重排序原子能力可通过 API 进行调用,单击 重排序 查看 API 文档。资源包自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
Rerank预付费资源包
资源包规格
价格
5亿 tokens
¥50
10亿 tokens
¥100
50亿 tokens
¥460
100亿 tokens
¥900
Rerank后付费
后付费
单价
Rerank
0.0001元/千tokens

RAG套件

RAG 套件原子能力可通过相关API进行调用,包括上传知识、知识库检索等接口。
知识库检索预付费套餐包
资源包自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
资源包规格
价格
1万次
¥300
知识库检索后付费
后付费
单价
知识库检索
0.04元/次
RAG套件-知识库容量
知识库容量计算用户在RAG 套件原子能力中上传的文档和问答的总字符数,删除的文档和问答不占用知识库容量字符数。
资源有效期:已过期的知识库仅支持删除操作,不支持上传知识、检索知识。如需继续使用请在到期前及时续费。
付费方式:包年包月。
知识库容量
包月
包年
1000万字符
¥160
¥1,800
1亿字符
¥1,400
¥16,000

解析拆分

可通过调用解析拆分接口,实现文档解析及拆分。文档解析接口为异步接口。
文档解析:可使用 文档解析 原子能力的预付费和后付费计费项,按页收费。
文档拆分:提供后付费,按token收费。
后付费
单价
文档拆分
0.03元/千tokens
说明:
文档解析按照文档调用成功的页数计费;不同文档按页计费规则:
doc、docx、ppt、pptx、pdf 按页计量。
jpeg、png等图片格式以一张图为一页。
xlsx、txt、md、csv 以1份为一页。
文档拆分接口调用时,根据文件类型的不同,将分别计算解析和拆分的费用,详情如下:
输入文件为pdf/docx/doc/ppt/pptx文档格式和jpg/png等图片格式时,需要计算文档解析费用(按页计费),支持预付费和后付费。
输入文件为txt/md/xlsx/xls格式时,仅需工程解析,不需要付费。
两种方式输入的文件都需要计算拆分消耗的费用,按token消耗数量计费。