大模型知识引擎提供大模型应用构建平台,根据用户所使用的 tokens 数、知识库容量、并发数等资源进行计费,目前为公测阶段,注册开通体验即可获得一定量的免费额度。如需购买或扩容,请单击购买或联系架构师。
开通方式
免费额度
选择 DeepSeek系列 模型作为生成模型时 ,调用联网搜索限时免费中!
说明:
所有腾讯云用户通过知识引擎创建应用,选择DeepSeek-R1 或 DeepSeek-V3 作为生成模型时,限时免费试用联网搜索功能,限时免费期间不收取联网搜索调用费用。限时免费结束后,将按照调用次数进行收费。
限时免费结束时间另行通知。

通过实名认证的主账号首次登录大模型知识引擎产品时,获得一定量的免费体验额度,详情如下图所示:
资源类别 | 免费额度 |
精调知识大模型标准版 | 开通大模型知识引擎服务即获赠累计50万 tokens 的免费调用额度,有效期2个月;以资源包的形式发放到您的腾讯云账号中,优先扣除。(模型通用) 在活动期间(北京时间2025年2月13日起到2025年3月10日止),使用大模型知识引擎服务即额外获赠DeepSeek系列模型专属的免费额度,按个人账户50万 tokens、企业账户100万 tokens下发(有效期2个月)。免费额度用尽后,支持 开通后付费 使用。(DeepSeek系列模型目前未提供预付费资源包,仅支持开通后付费使用) |
精调知识大模型高级版 | |
混元大模型标准版 | |
混元大模型高级版 | |
混元大模型长文本版 | |
混元大模型角色扮演版 | |
混元大模型Turbo版 | |
医学行业大模型标准版 | |
金融行业大模型标准版 | |
教育行业大模型标准版 | |
教育行业大模型高级版 | |
DeepSeek-R1 | |
DeepSeek-V3 | |
应用服务-知识库容量 | 开通大模型知识引擎服务即获赠累计300万字符数的免费知识库容量,有效期6个月;(注:针对2024年7月5日及以后开通产品的账号生效) 到期后,知识库中的知识将被处理成“超量失效”状态,“超量失效”状态的知识在对话中不生效,且“超量失效”状态的知识30天后将被自动删除,如需要继续使用知识库,请在到期前及时购买。 |
原子能力-多轮改写 | 开通大模型知识引擎服务即获赠累计100万 tokens 原子能力token体验资源,有效期2个月,以资源包的形式发放到您的腾讯云账号中,优先扣除。 (注:针对2025年1月6日及以后开通产品的账号生效) |
原子能力-Rerank | |
原子能力-Embedding | |
原子能力-解析拆分-MLLM解析 | |
原子能力-RAG套件-知识库检索 | 开通大模型知识引擎服务即获赠累计500次 知识库检索调用额度,有效期2个月;以资源包的形式发放到您的腾讯云账号中,优先扣除。 (注:针对2025年1月6日及以后开通产品的账号生效) |
原子能力-RAG套件-知识库容量 | 开通大模型知识引擎服务即获赠累计100万字符数的免费知识库容量,有效期6个月;(注:针对2025年1月6日及以后开通产品的账号生效) 该知识库容量只在调用原子能力-RAG套件中使用,与应用服务-知识库容量不共用。 |
原子能力-文档解析 | 开通大模型知识引擎服务即获赠累计500页 文档解析体验额度,有效期2个月;以资源包的形式发放到您的腾讯云账号中,优先扣除。 (注:针对2025年1月6日及以后开通产品的账号生效) |
特别说明
在以下场景/功能中发生交互时,会对 tokens 产生消耗:
应用配置管理:
应用配置 > 角色设定中,一键优化功能。
知识库管理 > 问答 > 导入问答 > 文档生成问答对。
知识库管理 > 任务流程 > 插入节点 > 自动生成询问语。
知识库管理 > 任务流程 > 插入节点 > 自动生成答案的预览。
问答过程中,在应用配置中测试、应用发布后调用应用 API /使用体验链接、应用评测、应用体验。
计算消耗内容:包括用户的输入 + 系统 prompt + 召回信息(含文档、问答、开启搜索引擎后搜索召回的内容)+ 输出
备注
1. tokens 换算方式:1 tokens ≈ 1~1.5个汉字。
2. 基于已配置的任务流程会调用任务型专属模型,消耗对应的 tokens。
3. 应用对话交互中触发的应用配置的欢迎语、输出配置-回复设置中自定义的保守回复、敏感词拦截后的回复不计入 tokens 消耗。
4. 如不使用任务流程和搜索引擎,建议关闭"应用配置 > 知识来源"中的相关开关,以减少额外的 tokens 消耗。
5. 应用配置 > 知识来源中,文档和问答的召回数量会影响召回 tokens ,设定的数量越高,拼接输入到大模型的召回片段越多,消耗 tokens 数量相应增加。
注意:
在账单结算时,系统将按照免费资源包 > 预付费资源包的顺序进行结算,即免费资源包是优先扣除的。
若您欠费或因违禁原因停服后,将不能继续享受免费额度,服务恢复后可继续使用有效期范围内的免费额度。
通用免费额度:精调知识大模型标准版、精调知识大模型高级版、混元大模型系列、行业大模型系列、DeepSeek系列共用50万 tokens 免费额度。
DeepSeek系列模型活动专属的免费额度:支持 DeepSeek-R1 和 DeepSeek-V3 共用,个人账户50万 tokens、企业账户100万 tokens。
优先消耗到期时间排在前面的免费额度。
计费大纲
计费场景 | 计费类型 | 资源类型 | 说明 |
应用服务 | 应用服务-平台预置模型 | 大模型 tokens 资源包 | 多种预置大模型服务调用价格,包括精调知识大模型、混元大模型、行业大模型等。 |
| | 大模型按量后付费 | |
| | 大模型共享并发包 | 预置大模型提供默认并发,如有并发增购的诉求可购买共享并发包。 |
| 应用服务-用户部署模型 | 大模型专属并发包 | 提供独立部署模型资源,独立部署模型不按照 tokens 消耗计费,可通过购买专属并发包使用。 |
| 应用服务(通用) | 知识库扩容包 | 购买知识库扩容包可上传文档、问答到知识管理中实现知识问答场景。 |
| | 搜索服务包 | 通过购买搜索服务包实现调用搜索引擎。 |
原子能力 | 文档解析 | 文档解析预付费资源包 | 提供文档解析 API ,包括同步接口、异步接口、准实时接口。 |
| | 文档解析后付费 | |
| | 文档解析 QPS 叠加包 | 文档解析 API 接口购买资源包后提供 5 QPS ,如有 QPS 扩充需求,可购买 QPS 叠加包。 |
| Embedding | Embedding 预付费资源包 | 提供 Embedding API。 |
| | Embedding 后付费 | |
| 多轮改写 | 多轮改写预付费资源包 | 提供多轮改写 API。 |
| | 多轮改写后付费 | |
| Rerank 重排序 | Rerank 预付费资源包 | 提供Rerank 重排序 API。 |
| | Rerank 后付费 | |
| RAG 套件 | 知识库检索预付费资源包 | 提供RAG 套件相关API,包括上传知识、知识库检索等接口。 |
| | 知识库检索后付费 | |
| | 知识库容量 | 购买RAG套件-知识库容量,才能使用RAG套件的接口上传知识,进行知识库检索。 该计费项与应用服务中的知识库扩容包不共用。 |
| 解析拆分 | 文档解析预付费资源包 | 提供解析拆分 API ,调用时按照执行文档解析和拆分任务进行收费。 与文档解析原子能力的计费项共用。 |
| | 文档解析后付费 | |
| | 文档拆分后付费 | |
购买说明:
应用服务-用户部署模型购买前需联系架构师提前部署。
如使用应用中的知识管理,需要购买知识库扩容包。
需要使用应用中的搜索增强时,可购买搜索服务包。
原子能力均按需购买。
产品价格
应用服务
大模型 tokens 资源包
定义:一次性购买一定数量的 tokens 资源包,有效期内调用模型服务时优先抵扣资源包当中的 tokens 余量, tokens 资源包如果到期未用完,会当做过期作废处理。
资源包有效期:1年,1年后未使用的资源包清零。
付费方式:预付费,购买 tokens 资源包越大,单价越低。
适用范围:稳定调用,具有一定规模的业务体量。
tokens 资源包 | 精调知识大模型标准版 | 精调知识大模型高级版 | 医学行业大模型标准版 | 金融行业大模型标准版 | 教育行业大模型标准版 | 教育行业大模型高级版 | 混元大模型Turbo版 |
1000万 tokens | ¥120 | ¥1,200 | ¥120 | ¥180 | ¥180 | ¥900 | ¥240 |
5000万 tokens | ¥600 | ¥6,000 | ¥600 | ¥900 | ¥900 | ¥4,350 | ¥1,200 |
1亿 tokens | ¥1,180 | ¥11,800 | ¥1,180 | ¥1,770 | ¥1,770 | ¥8,700 | ¥2,300 |
5亿 tokens | ¥5,900 | ¥59,000 | ¥5,900 | ¥8,850 | ¥8,850 | ¥43,000 | ¥11,500 |
10亿 tokens | ¥11,700 | ¥117,000 | ¥11,700 | ¥17,550 | ¥17,550 | ¥84,000 | ¥22,600 |
注意:
购买的预付费 tokens 资源包有效期为1年,1年后未使用的资源包清零。
账户基础购买 tokens 预付费配额后,服务并发数保持不变,如果无法满足实际的业务需求,可按需增购并发。
大模型按量后付费
定义:预置模型除了提供预付费的 tokens 资源包外,还提供按量后付费的计费方式。按量后付费根据实际调用接口产生的 tokens 数量计费,不同的模型价格不同,按照实际消耗的输入、输出总 tokens 数量,每小时对腾讯云账户进行扣费。
模型版本 | 单价 |
精调知识大模型标准版 | 输入:0.012元/千tokens 输出:0.012元/千tokens |
精调知识大模型高级版 | 输入:0.12元/千tokens 输出:0.12元/千tokens |
医学行业大模型标准版 | 输入:0.012元/千tokens 输出:0.012元/千tokens |
金融行业大模型标准版 | 输入:0.018元/千tokens 输出:0.018元/千tokens |
教育行业大模型标准版 | 输入:0.018元/千tokens 输出:0.018元/千tokens |
教育行业大模型高级版 | 输入:0.06元/千tokens 输出:0.18元/千tokens |
混元大模型标准版 | 输入:0.0045元/千tokens 输出:0.005元/千tokens |
混元大模型高级版 | 输入:0.03元/千tokens 输出:0.1元/千tokens |
混元大模型长文本版 | 输入:0.015元/千tokens 输出:0.06元/千tokens |
混元大模型角色扮演版 | 输入:0.004元/千tokens 输出:0.008元/千tokens |
混元大模型Turbo版 | 输入:0.015元/千tokens 输出:0.05元/千tokens |
DeepSeek-R1 | 输入:0.026元/千tokens 输出:0.075元/千tokens |
DeepSeek-V3 | 输入:0.0115元/千tokens 输出:0.017元/千tokens |
大模型并发包
定义:同时进行的会话数量,从请求发起到流式返回全部结果的整个过程都算在占用并发,一个对话占用并发时间约3-15秒不等。
付费方式:包月包年。
大模型共享并发包价格
模型版本 | 并发数量 | 包月 | 包年 | 备注 |
精调知识大模型标准版 | 1并发 | ¥800 | ¥9,200 | 账号下默认5并发,可在此基础上增购 |
| 2并发 | ¥1,250 | ¥15,000 | |
| 5并发 | ¥3,000 | ¥35,000 | |
精调知识大模型高级版 | 1并发 | ¥2,400 | ¥28,800 | |
| 2并发 | ¥3,800 | ¥45,600 | |
| 5并发 | ¥9,000 | ¥108,000 | |
医学行业大模型标准版 | 1并发 | ¥1,200 | ¥14,400 | |
| 2并发 | ¥1,880 | ¥22,500 | |
| 5并发 | ¥4,500 | ¥54,000 | |
金融行业大模型标准版 | 1并发 | ¥1,200 | ¥14,400 | |
| 2并发 | ¥1,880 | ¥22,500 | |
| 5并发 | ¥4,500 | ¥54,000 | |
教育行业大模型标准版 | 1并发 | ¥1,200 | ¥14,400 | |
| 2并发 | ¥1,880 | ¥22,500 | |
| 5并发 | ¥4,500 | ¥54,000 | |
教育行业大模型高级版 | 1并发 | ¥3,600 | ¥43,200 | |
| 2并发 | ¥5,800 | ¥67,500 | |
| 5并发 | ¥13,500 | ¥162,000 | |
混元大模型标准版 | 1并发 | ¥800 | ¥9,200 | |
| 2并发 | ¥1,250 | ¥15,000 | |
| 5并发 | ¥3,000 | ¥35,000 | |
混元大模型高级版 | 1并发 | ¥2,400 | ¥28,800 | |
| 2并发 | ¥3,800 | ¥45,600 | |
| 5并发 | ¥9,000 | ¥108,000 | |
混元大模型长文本版 | 1并发 | ¥1,200 | ¥14,400 | |
| 2并发 | ¥1,880 | ¥22,500 | |
| 5并发 | ¥4,500 | ¥54,000 | |
混元大模型角色扮演版 | 1并发 | ¥800 | ¥9,200 | |
| 2并发 | ¥1,250 | ¥15,000 | |
| 5并发 | ¥3,000 | ¥35,000 | |
混元大模型Turbo版 | 1并发 | ¥2,400 | ¥28,800 | |
| 2并发 | ¥3,800 | ¥45,600 | |
| 5并发 | ¥9,000 | ¥108,000 | |
大模型专属并发包价格
模型版本 | 并发数量 | 包月 | 包年 | 备注 |
精调知识大模型标准版 | 1并发 | ¥17,000 | ¥200,000 | 5并发起购(增购可按照1、2、5并发增购) |
| 2并发 | ¥24,000 | ¥280,000 | |
| 5并发 | ¥34,000 | ¥400,000 | |
精调知识大模型高级版 | 1并发 | ¥55,000 | ¥660,000 | |
| 2并发 | ¥72,000 | ¥860,000 | |
| 5并发 | ¥100,000 | ¥1,200,000 | |
医学行业大模型标准版 | 1并发 | ¥25,000 | ¥300,000 | |
| 2并发 | ¥36,000 | ¥420,000 | |
| 5并发 | ¥51,000 | ¥600,000 | |
金融行业大模型标准版 | 1并发 | ¥25,000 | ¥300,000 | |
| 2并发 | ¥36,000 | ¥420,000 | |
| 5并发 | ¥51,000 | ¥600,000 | |
教育行业大模型标准版 | 1并发 | ¥25,000 | ¥300,000 | |
| 2并发 | ¥36,000 | ¥420,000 | |
| 5并发 | ¥51,000 | ¥600,000 | |
教育行业大模型高级版 | 1并发 | ¥76,500 | ¥900,000 | |
| 2并发 | ¥108,000 | ¥1,260,000 | |
| 5并发 | ¥153,000 | ¥1,800,000 | |
购买说明:
购买共享并发包,同时必须购买 tokens 资源包或开通按量后付费使用。
购买专属并发包可独立使用,无需购买 tokens 资源。
知识库容量
定义:知识库容量计算用户所有应用上传的文档和问答的总字符数,删除的文档和应用不占用知识库容量。
资源有效期:可选,即将过期如需继续使用请续费。已过期的知识库仅支持删除操作。
付费方式:包年包月。
知识库扩容包 | 包月 | 包年 |
1000万字符 | ¥160 | ¥1,800 |
1亿字符 | ¥1,400 | ¥16,000 |
注意:
字符数不计算文档中的空格,文档中存在图片的将转存为图片链接,每张图大约换算为150个字符。
一篇3万字的硕士论文,大约相当于4万字符,50页文档。1000万字符约为250篇硕士论文,1亿字符约为2500篇硕士论文。
知识库扩容包到期说明:
到期后,知识库中的知识将被处理成“超量失效”状态,“超量失效”状态的知识在对话中不生效,且“超量失效”状态的知识30天后将被自动删除,如需要继续使用知识库,请在到期前及时续费。
“超量失效”状态的知识在购买知识库扩容包后,需要手动批量恢复并发布后,可支持正式环境对话中使用。
搜索服务包
知识引擎提供搜索服务,如您在知识来源中勾选了搜索引擎,则每次调用搜索引擎将会扣减搜索服务次数。搜索服务资源包根据业务量级划分为不同规格,可一次性付费购买,自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
资源包规格 | 价格 |
10万次 | ¥2,200 |
50万次 | ¥11,000 |
100万次 | ¥20,000 |
500万次 | ¥90,000 |
1000万次 | ¥170,000 |
原子能力
知识引擎支持以 API 形式提供原子能力接口,支持具有开发能力的用户自行搭建大模型应用,拓展大模型能力边界。
原子能力资源包根据业务量级划分为不同规格,可一次性付费购买,自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
注意:
调用量的扣费顺序为:免费额度->资源包,即先消耗账号中的免费额度,免费额度耗尽后再消耗资源包。
Embedding
Embedding预付费资源包
资源包规格 | 价格 |
5000万 tokens | ¥100 |
1亿 tokens | ¥200 |
5亿 tokens | ¥900 |
10亿 tokens | ¥1,800 |
Embedding后付费
后付费 | 单价 |
Embedding | 0.002元/千tokens |
多轮改写
多轮改写预付费资源包
资源包规格 | 价格 |
1000万 tokens | ¥60 |
5000万 tokens | ¥300 |
1亿 tokens | ¥600 |
5亿 tokens | ¥2,800 |
10亿 tokens | ¥5,600 |
多轮改写后付费
后付费 | 单价 |
多轮改写 | 0.006元/千tokens |
文档解析
文档解析资源包
文档解析预付费资源包
资源包规格 | 价格 |
500页 | ¥100 |
1000页 | ¥180 |
1万页 | ¥1,700 |
5万页 | ¥5,600 |
10万页 | ¥9,800 |
50万页 | ¥40,000 |
100万页 | ¥75,000 |
500万页 | ¥290,000 |
文档解析后付费
后付费 | 单价 |
文档解析 | 0.2元/页 |
注意:
文档解析按照文档调用成功的页数计费;不同文档按页计费规则:doc、docx、ppt、pptx、pdf、jpeg、png 按单页计量;xlsx、txt、md、csv 以1份为一页。
文档解析 QPS 叠加包
购买预付费资源包后,默认提供 5 QPS,可按接口类型增购。
接口类型 | 价格 |
同步接口 | ¥10,000/QPS/月 |
异步接口 | |
实时接口 | |
Rerank
Rerank预付费资源包
资源包规格 | 价格 |
5亿 tokens | ¥50 |
10亿 tokens | ¥100 |
50亿 tokens | ¥460 |
100亿 tokens | ¥900 |
Rerank后付费
后付费 | 单价 |
Rerank | 0.0001元/千tokens |
RAG套件
RAG 套件原子能力可通过相关API进行调用,包括上传知识、知识库检索等接口。
知识库检索预付费套餐包
资源包自购买日起一年内有效,一年内若资源包未使用完,则过期作废。
资源包规格 | 价格 |
1万次 | ¥300 |
知识库检索后付费
后付费 | 单价 |
知识库检索 | 0.04元/次 |
RAG套件-知识库容量
知识库容量计算用户在RAG 套件原子能力中上传的文档和问答的总字符数,删除的文档和问答不占用知识库容量字符数。
资源有效期:已过期的知识库仅支持删除操作,不支持上传知识、检索知识。如需继续使用请在到期前及时续费。
付费方式:包年包月。
知识库容量 | 包月 | 包年 |
1000万字符 | ¥160 | ¥1,800 |
1亿字符 | ¥1,400 | ¥16,000 |
解析拆分
可通过调用解析拆分接口,实现文档解析及拆分。文档解析接口为异步接口。
文档解析:可使用 文档解析 原子能力的预付费和后付费计费项,按页收费。
文档拆分:提供后付费,按token收费。
后付费 | 单价 |
文档拆分 | 0.03元/千tokens |
说明:
文档解析按照文档调用成功的页数计费;不同文档按页计费规则:
doc、docx、ppt、pptx、pdf 按页计量。
jpeg、png等图片格式以一张图为一页。
xlsx、txt、md、csv 以1份为一页。
文档拆分接口调用时,根据文件类型的不同,将分别计算解析和拆分的费用,详情如下:
输入文件为pdf/docx/doc/ppt/pptx文档格式和jpg/png等图片格式时,需要计算文档解析费用(按页计费),支持预付费和后付费。
输入文件为txt/md/xlsx/xls格式时,仅需工程解析,不需要付费。
两种方式输入的文件都需要计算拆分消耗的费用,按token消耗数量计费。