Token Plan 企业版专业套餐是面向企业/团队的大模型 API 按月预付费套餐,支持自定义月预算(购买积分池,调用模型时,按各模型的 Token 单价从积分池中实时扣减,不同模型单价不同)和多 Key 配额分配,适用于团队和企业级场景采用积分制统一管理多模型调用额度。
快速开始
套餐详情
核心概念
套餐 → 积分池 → API Key,三者的关系如下:
层级 | 说明 |
账号 | 一个腾讯云账号可以购买多个独立套餐,每个套餐拥有独立的积分池、API Key 配额和到期时间,不同套餐互不干扰。适合按部门、项目或业务线分别采购管理。 |
套餐(积分池) | 每个套餐对应一个独立的积分池,积分池大小由购买时的月预算决定(100 积分售价为 1 元)。积分池是该套餐下所有 API Key 共享的总额度,调用任何模型都从同一个积分池实时扣减。 说明: 积分不具有货币属性,不具备法定货币的流通性质,禁止在账号间交易,亦不得用以支付、购买实物产品或兑换腾讯的其他产品和服务。积分一经发放或购买,不支持折现或退还。 |
API Key | 每个套餐下可创建多个 API Key,数量上限与套餐积分成正比(每 1 万积分可创建 1 个 Key)。每个 Key 可以独立设置可用模型、独占配额、配额上限和调用速率(TPM),实现团队内的精细化分发和管控。 |
积分机制
积分换算:100 积分售价为 1 元。
积分共享:同一套餐下的所有 API Key 共享该套餐的积分池,按实际调用量实时扣减。
配额管控:支持为每个 Key 设置独占配额(仅该 Key 可用的专属积分)和配额上限(该 Key 最多可使用的积分总量,含独占 + 共享部分),未设置独占配额的部分为共享池,各 Key 先到先得。
扣减规则:调用模型时,按各模型的 Token 单价从积分池中实时扣减,不同模型单价不同,详情请参见 模型与积分换算说明。
套餐规格
配置项 | 说明 |
月预算 | |
购买时长 | 1 ~ 12 个月 |
可用模型 | Auto 智能路由、GLM-5、GLM-5.1、GLM-5-Turbo、Kimi-K2.5、Kimi-K2.6、MiniMax-M2.5、MiniMax-M2.7、DeepSeek-V4-Flash、DeepSeek-V4-Pro(持续增加) 说明: 当前模型暂不支持图片、视频等多模态能力。 |
积分抵扣规则
模型与积分换算说明
说明:
输入价(命中缓存):命中上下文缓存的输入 Token 价格。
输入价(未命中缓存):未命中缓存的输入 Token 价格。
Auto 智能路由:系统根据请求内容自动选择模型进行响应,按固定价计费。
实际扣减积分 = Token 用量 × 对应单价 。
模型 | 阶梯条件 | 命中缓存输入价 (积分/百万 tokens) | 未命中缓存输入价 (积分/百万 tokens) | 输出价 (积分/百万 tokens) |
GLM-5 | 输入 [0, 32k) | 100 | 400 | 1800 |
| 输入 32k+ | 150 | 600 | 2200 |
GLM-5.1 | 输入 [0, 32k) | 130 | 600 | 2400 |
| 输入 [32k+) | 200 | 800 | 2800 |
GLM-5-Turbo | 输入 [0, 32k) | 120 | 500 | 2200 |
| 输入 [32k+) | 180 | 700 | 2600 |
Kimi-K2.5 | - | 70 | 400 | 2100 |
Kimi-K2.6 | - | 110 | 650 | 2700 |
MiniMax-M2.5 | - | 21 | 210 | 840 |
MiniMax-M2.7 | - | 42 | 210 | 840 |
DeepSeek-V4-Flash | - | 20 | 100 | 200 |
DeepSeek-V4-Pro | - | 100 | 1200 | 2400 |
Auto 智能路由 | - | 50 | 324 | 1596 |
Token 数测算说明
不同模型的 Token 单价不同(区分缓存命中输入、未命中缓存输入、输出三种计价),为帮助用户直观评估“一定预算能买多少 Token”,平台提供基于 2026 年运营经验值的综合单价测算。
注意:
本测算结果仅作为企业预算规划的参考依据,不代表实际可使用 Token 数量。
综合单价计算过程中已嵌入各模型历史缓存命中率,页面展示价格若存在四舍五入处理,可能导致测算结果出现差异。
实际可使用 Token 数受用户真实业务场景的调用复杂度直接影响,最终以真实调用时的实际缓存命中率、输入输出 Token 比例、模型混合使用情况及实时定价规则为准,请注意积分消耗。
模型 | 综合单价预估 (积分/百万 tokens) | 50 万积分可抵扣 Token 数预估(亿 tokens) | 100 万积分可抵扣 Token 数预估(亿 tokens) |
GLM-5 | 约 440 | 约 11.36 | 约 22.73 |
GLM-5.1 | 约 380 | 约 13.16 | 约 26.32 |
GLM-5-Turbo | 约 340 | 约 14.71 | 约 29.41 |
Kimi-K2.5 | 约 230 | 约 21.74 | 约 43.48 |
Kimi-K2.6 | 约 280 | 约 17.86 | 约 35.71 |
MiniMax-M2.5 | 约 110 | 约 45.45 | 约 90.91 |
MiniMax-M2.7 | 约 100 | 约 50.00 | 约 100.00 |
DeepSeek-V4-Flash | 约 70 | 约 71.43 | 约 142.86 |
DeepSeek-V4-Pro | 约 930 | 约 5.38 | 约 10.75 |
Auto 智能路由 | 约 190 | 约 26.32 | 约 52.63 |
综合单价公式:
综合单价 = (缓存命中率 × 命中缓存输入价 + (1 - 缓存命中率)× 未命中缓存输入价)× 输入占比 + 输出价 × 输出占比 ,如模型存在阶梯定价(如 GLM-5 按上下文长度分档),建议优先按最长上下文档位进行预算评估,以获得更保守的预估结果。
可购买 Token 数 = 预算金额 ÷ 综合单价
测算参数来源:
以下参数取自平台 2026 年运营经验值,反映实际业务场景下的典型调用特征,非用户自定义:
参数 | 取值 | 说明 |
输入占比 | 20/21(≈95.24%) | 基于历史运营数据,典型场景下输入 Token 远大于输出 Token。 |
输出占比 | 1/21(≈4.76%) | = 1 - 输入占比 |
缓存命中率 | 各模型不同 | 基于各模型历史运营数据的实际缓存命中率,已内置于综合单价计算中。 |
购买须知
类别 | 说明 |
购买说明 | Token Plan 企业版套餐一经购买开通,即刻生效,请尽快创建 API Key 并开始使用。 |
续费说明 | 请在套餐过期前完成续费,套餐到期后将无法进行续费,套餐将失效,剩余积分不会转结到下个月。API Key 也会失效,使用该 API Key 的工具/应用/服务将立即无法调用 API。详情请参见 续费指南。 |
配额与限制
配额
配额 | 说明 |
每个套餐包可购买积分数上限 | |
API Key 创建数量 | 每个套餐包每 1 万积分可创建 1 个 API Key。 |
API Key 配置修改次数 | 每个 API Key 每日最多可修改 10 次。 |
限制
Token Plan 企业版专业套餐不支持降配。
Token Plan 企业版专业套餐一经购买不支持退订。