大模型服务平台 TokenHub Token Plan 企业版专

Token Plan 企业版专业套餐是面向企业/团队的大模型 API 按月预付费套餐，支持自定义月预算（购买积分池，调用模型时，按各模型的 Token 单价从积分池中实时扣减，不同模型单价不同）和多 Key 配额分配，适用于团队和企业级场景采用积分制统一管理多模型调用额度。
快速开始
已经了解 Token Plan 企业版专业套餐的用户，可以参照 快速入门 指引快速开始。
套餐详情
核心概念
套餐 → 积分池 → API Key，三者的关系如下：
层级
说明
账号
一个腾讯云账号可以购买多个独立套餐，每个套餐拥有独立的积分池、API Key 配额和到期时间，不同套餐互不干扰。适合按部门、项目或业务线分别采购管理。
套餐（积分池）
每个套餐对应一个独立的积分池，积分池大小由购买时的月预算决定（100 积分售价为 1 元）。积分池是该套餐下所有 API Key 共享的总额度，调用任何模型都从同一个积分池实时扣减。
说明：
积分不具有货币属性，不具备法定货币的流通性质，禁止在账号间交易，亦不得用以支付、购买实物产品或兑换腾讯的其他产品和服务。积分一经发放或购买，不支持折现或退还。
API Key
每个套餐下可创建多个 API Key，数量上限与套餐积分成正比（每 1 万积分可创建 1 个 Key）。每个 Key 可以独立设置可用模型、独占配额、配额上限和调用速率（TPM），实现团队内的精细化分发和管控。
积分机制
积分换算：100 积分售价为 1 元。
积分共享：同一套餐下的所有 API Key 共享该套餐的积分池，按实际调用量实时扣减。
配额管控：支持为每个 Key 设置独占配额（仅该 Key 可用的专属积分）和配额上限（该 Key 最多可使用的积分总量，含独占 + 共享部分），未设置独占配额的部分为共享池，各 Key 先到先得。
扣减规则：调用模型时，按各模型的 Token 单价从积分池中实时扣减，不同模型单价不同，详情请参见 模型与积分换算说明。
套餐规格
配置项
说明
刊例价
每月 1 元/100积分
套餐规格
支持自定义购买规格，单次购买最低 10 万积分，最终价格及规则请以 控制台 为准。
购买时长
1 ~ 12 个月
套餐可用模型
注意：
为持续优化模型服务能力与使用体验，平台套餐内提供的 AI 模型为动态更新的模型库，可能根据模型性能、服务稳定性、合规要求、授权状况及第三方模型供应情况等进行新增、替换、版本升级、可用范围调整或逐步下线。套餐所提供的是“可使用平台当期模型库中相应模型”的服务，而非对任一特定模型的持续、固定或永久提供作出承诺。用户在订阅时所见的模型仅代表当时的可用情况，实际可用模型、版本及调用范围以购买页、控制台展示及平台公告为准。对可能影响已订阅用户使用的模型下线或重大调整，平台将通过公告、站内信或控制台提示等合理方式提前告知。
Model Name
Model ID
备注
Auto 
auto
-
GLM-5.2
glm-5.2
glm-5-2
-
GLM-5
glm-5
glm-5-0
-
GLM-5.1
glm-5.1
glm-5-1
-
﻿
﻿
﻿
GLM-5-Turbo
glm-5-turbo
-
﻿
﻿
﻿
Kimi K2.7 Code
kimi-k2.7-code
-
Kimi K2.7 Code HighSpeed
kimi-k2.7-code-highspeed
-
Kimi-K2.5 
kimi-k2.5
kimi-k-2-5
将于2026年7月31日下线。
Kimi-K2.6
kimi-k2.6
kimi-k-2-6
-
MiniMax-M2.5
minimax-m2.5
minimax-m-2-5
将于2026年8月6日下线。
MiniMax-M2.7
minimax-m2.7
minimax-m-2-7
-
MiniMax-M3
minimax-m3
minimax-m-3-0
-
DeepSeek-V4-Flash
deepseek-v4-flash
-
DeepSeek-V4-Pro
deepseek-v4-pro
-
DeepSeek-V4-Flash 原厂直供
deepseek-v4-flash-202605
由 DeepSeek 直接提供的 DeepSeek V4 Flash 模型服务，TokenHub 不对该服务提供 SLA 保障。使用该模型即视为您已知晓并同意遵守 DeepSeek 的服务协议，请您在使用前务必仔细阅读相关内容，如不接受上述内容，请立即停止使用。
DeepSeek-V4-Pro 原厂直供
deepseek-v4-pro-202606
由 DeepSeek 直接提供的 DeepSeek V4 Pro 模型服务，TokenHub 不对该服务提供 SLA 保障。使用该模型即视为您已知晓并同意遵守 DeepSeek 的服务协议，请您在使用前务必仔细阅读相关内容，如不接受上述内容，请立即停止使用。
积分抵扣规则
模型与积分换算说明
说明：
输入价（命中缓存）：命中上下文缓存的输入 Token 价格。
输入价（未命中缓存）：未命中缓存的输入 Token 价格。
Auto 智能路由：系统根据请求内容自动选择模型进行响应，按固定价计费。
实际扣减积分 = Token 用量 × 对应单价 。
模型
阶梯条件
命中缓存输入价
（积分/百万 tokens）
未命中缓存输入价
（积分/百万 tokens）
输出价
（积分/百万 tokens）
GLM-5.2
-
200 
800 
2800 
GLM-5
输入 [0, 32k)
100
400
1800
﻿
输入 32k+
150
600
2200
GLM-5.1
输入 [0, 32k)
130
600
2400
﻿
输入 32k+
200
800
2800
GLM-5-Turbo
输入 [0, 32k)
120
500
2200
﻿
输入 32k+
180
700
2600
Kimi K2.7 Code
-
130 
650 
2700 
Kimi K2.7 Code HighSpeed
-
260 
1300 
5400 
Kimi-K2.5
-
70
400
2100
Kimi-K2.6
-
110
650
2700
MiniMax-M2.5
-
21
210
840
MiniMax-M2.7
-
42
210
840
MiniMax-M3
输入 [0, 512k)
42 
210
840
MiniMax-M3
输入 512k+
84
420
1680 
DeepSeek-V4-Flash
-
20
100
200
DeepSeek-V4-Pro
-
100
1200
2400
DeepSeek-V4-Flash 
原厂直供
-
2
100
200
DeepSeek-V4-Pro 
原厂直供
-
2.5
300
600
Auto 智能路由
-
50
324
1596
Token 数测算说明
不同模型的 Token 单价不同（区分缓存命中输入、未命中缓存输入、输出三种计价），为帮助用户直观评估“一定预算能买多少 Token”，平台提供基于 2026 年运营经验值的综合单价测算。
注意：
本测算结果仅作为企业预算规划的参考依据，不代表实际可使用 Token 数量。
综合单价计算过程中已嵌入各模型历史缓存命中率，页面展示价格若存在四舍五入处理，可能导致测算结果出现差异。
实际可使用 Token 数受用户真实业务场景的调用复杂度直接影响，最终以真实调用时的实际缓存命中率、输入输出 Token 比例、模型混合使用情况及实时定价规则为准，请注意积分消耗。
模型
综合单价预估
（积分/百万 tokens）
50 万积分可抵扣 
Token 数预估（亿 tokens）
100 万积分可抵扣 
Token 数预估（亿 tokens）
GLM-5.2
约 440
约 11.36 
约 22.73 
GLM-5
约 440
约 11.36 
约 22.73 
GLM-5.1
约 380 
约 13.16 
约 26.32 
GLM-5-Turbo
约 340
约 14.71 
约 29.41 
Kimi K2.7 Code
约 280
约 17.86 
约 35.71 
Kimi K2.7 Code HighSpeed
约 820
约 6.10 
约 12.20 
Kimi-K2.5
约 230
约 21.74 
约 43.48  
Kimi-K2.6
约 280 
约 17.86 
约 35.71 
MiniMax-M2.5
约 110
约 45.45 
约 90.91  
MiniMax-M2.7
约 100 
约 50.00 
约 100.00 
MiniMax-M3
约 250
约 20.00 
约 40.00 
DeepSeek-V4-Flash
约 70
约 71.43 
约 142.86 
DeepSeek-V4-Pro
约 930
约 5.38 
约 10.75 
DeepSeek-V4-Flash 
原厂直供
约 70 
约 71.43 
约 142.86 
DeepSeek-V4-Pro 
原厂直供
约 230 
约 21.74 
约 43.48 
Auto 智能路由
约 190
约 26.32 
约 52.63 
综合单价公式：
综合单价 = （缓存命中率 × 命中缓存输入价 + （1 - 缓存命中率）× 未命中缓存输入价）× 输入占比 + 输出价 × 输出占比 ，如模型存在阶梯定价（如 GLM-5 按上下文长度分档），建议优先按最长上下文档位进行预算评估，以获得更保守的预估结果。 
可购买 Token 数 = 预算金额 ÷ 综合单价 
测算参数来源：
以下参数取自平台 2026 年运营经验值，反映实际业务场景下的典型调用特征，非用户自定义：
参数
取值
说明
输入占比
20/21（≈95.24%）
基于历史运营数据，典型场景下输入 Token 远大于输出 Token。
输出占比
1/21（≈4.76%）
= 1 - 输入占比
缓存命中率
各模型不同
基于各模型历史运营数据的实际缓存命中率，已内置于综合单价计算中。
购买须知
类别
说明
购买说明
Token Plan 企业版套餐一经购买开通，即刻生效，请尽快创建 API Key 并开始使用。
续费说明
请在套餐过期前完成续费，套餐到期后将无法进行续费，套餐将失效，剩余积分不会转结到下个月。API Key 也会失效，使用该 API Key 的工具/应用/服务将立即无法调用 API。详情请参见 续费指南。
配额与限制
配额
配额
说明
API Key 创建数量
每个套餐包每 1 万积分可创建 1 个 API Key。
API Key 配置修改次数
每个 API Key 每日最多可修改 10 次。
限制
Token Plan 企业版专业套餐不支持降配。
Token Plan 企业版专业套餐一经购买不支持退订。
更多操作
更多操作请参见 操作指南。

层级	说明
账号	一个腾讯云账号可以购买多个独立套餐，每个套餐拥有独立的积分池、API Key 配额和到期时间，不同套餐互不干扰。适合按部门、项目或业务线分别采购管理。
套餐（积分池）	每个套餐对应一个独立的积分池，积分池大小由购买时的月预算决定（100 积分售价为 1 元）。积分池是该套餐下所有 API Key 共享的总额度，调用任何模型都从同一个积分池实时扣减。说明：积分不具有货币属性，不具备法定货币的流通性质，禁止在账号间交易，亦不得用以支付、购买实物产品或兑换腾讯的其他产品和服务。积分一经发放或购买，不支持折现或退还。
API Key	每个套餐下可创建多个 API Key，数量上限与套餐积分成正比（每 1 万积分可创建 1 个 Key）。每个 Key 可以独立设置可用模型、独占配额、配额上限和调用速率（TPM），实现团队内的精细化分发和管控。

配置项	说明
刊例价	每月 1 元/100积分
套餐规格	支持自定义购买规格，单次购买最低 10 万积分，最终价格及规则请以控制台为准。
购买时长	1 ~ 12 个月

Model Name	Model ID	备注
Auto	auto	-
GLM-5.2	glm-5.2 glm-5-2	-
GLM-5	glm-5 glm-5-0	-
GLM-5.1	glm-5.1 glm-5-1	-
GLM-5.1	glm-5.1 glm-5-1	-
GLM-5-Turbo	glm-5-turbo	-
GLM-5-Turbo	glm-5-turbo	-
Kimi K2.7 Code	kimi-k2.7-code	-
Kimi K2.7 Code HighSpeed	kimi-k2.7-code-highspeed	-
Kimi-K2.5	kimi-k2.5 kimi-k-2-5	将于2026年7月31日下线。
Kimi-K2.6	kimi-k2.6 kimi-k-2-6	-
MiniMax-M2.5	minimax-m2.5 minimax-m-2-5	将于2026年8月6日下线。
MiniMax-M2.7	minimax-m2.7 minimax-m-2-7	-
MiniMax-M3	minimax-m3 minimax-m-3-0	-
DeepSeek-V4-Flash	deepseek-v4-flash	-
DeepSeek-V4-Pro	deepseek-v4-pro	-
DeepSeek-V4-Flash 原厂直供	deepseek-v4-flash-202605	由 DeepSeek 直接提供的 DeepSeek V4 Flash 模型服务，TokenHub 不对该服务提供 SLA 保障。使用该模型即视为您已知晓并同意遵守 DeepSeek 的服务协议，请您在使用前务必仔细阅读相关内容，如不接受上述内容，请立即停止使用。
DeepSeek-V4-Pro 原厂直供	deepseek-v4-pro-202606	由 DeepSeek 直接提供的 DeepSeek V4 Pro 模型服务，TokenHub 不对该服务提供 SLA 保障。使用该模型即视为您已知晓并同意遵守 DeepSeek 的服务协议，请您在使用前务必仔细阅读相关内容，如不接受上述内容，请立即停止使用。

模型	阶梯条件	命中缓存输入价（积分/百万 tokens）	未命中缓存输入价（积分/百万 tokens）	输出价（积分/百万 tokens）
GLM-5.2	-	200	800	2800
GLM-5	输入 [0, 32k)	100	400	1800
GLM-5		输入 32k+	150	600	2200
GLM-5.1	输入 [0, 32k)	130	600	2400
GLM-5.1		输入 32k+	200	800	2800
GLM-5-Turbo	输入 [0, 32k)	120	500	2200
GLM-5-Turbo		输入 32k+	180	700	2600
Kimi K2.7 Code	-	130	650	2700
Kimi K2.7 Code HighSpeed	-	260	1300	5400
Kimi-K2.5	-	70	400	2100
Kimi-K2.6	-	110	650	2700
MiniMax-M2.5	-	21	210	840
MiniMax-M2.7	-	42	210	840
MiniMax-M3	输入 [0, 512k)	42	210	840
MiniMax-M3	输入 512k+	84	420	1680
DeepSeek-V4-Flash	-	20	100	200
DeepSeek-V4-Pro	-	100	1200	2400
DeepSeek-V4-Flash 原厂直供	-	2	100	200
DeepSeek-V4-Pro 原厂直供	-	2.5	300	600
Auto 智能路由	-	50	324	1596

模型	综合单价预估（积分/百万 tokens）	50 万积分可抵扣 Token 数预估（亿 tokens）	100 万积分可抵扣 Token 数预估（亿 tokens）
GLM-5.2	约 440	约 11.36	约 22.73
GLM-5	约 440	约 11.36	约 22.73
GLM-5.1	约 380	约 13.16	约 26.32
GLM-5-Turbo	约 340	约 14.71	约 29.41
Kimi K2.7 Code	约 280	约 17.86	约 35.71
Kimi K2.7 Code HighSpeed	约 820	约 6.10	约 12.20
Kimi-K2.5	约 230	约 21.74	约 43.48
Kimi-K2.6	约 280	约 17.86	约 35.71
MiniMax-M2.5	约 110	约 45.45	约 90.91
MiniMax-M2.7	约 100	约 50.00	约 100.00
MiniMax-M3	约 250	约 20.00	约 40.00
DeepSeek-V4-Flash	约 70	约 71.43	约 142.86
DeepSeek-V4-Pro	约 930	约 5.38	约 10.75
DeepSeek-V4-Flash 原厂直供	约 70	约 71.43	约 142.86
DeepSeek-V4-Pro 原厂直供	约 230	约 21.74	约 43.48
Auto 智能路由	约 190	约 26.32	约 52.63

参数	取值	说明
输入占比	20/21（≈95.24%）	基于历史运营数据，典型场景下输入 Token 远大于输出 Token。
输出占比	1/21（≈4.76%）	= 1 - 输入占比
缓存命中率	各模型不同	基于各模型历史运营数据的实际缓存命中率，已内置于综合单价计算中。

类别	说明
购买说明	Token Plan 企业版套餐一经购买开通，即刻生效，请尽快创建 API Key 并开始使用。
续费说明	请在套餐过期前完成续费，套餐到期后将无法进行续费，套餐将失效，剩余积分不会转结到下个月。API Key 也会失效，使用该 API Key 的工具/应用/服务将立即无法调用 API。详情请参见续费指南。

配额	说明
API Key 创建数量	每个套餐包每 1 万积分可创建 1 个 API Key。
API Key 配置修改次数	每个 API Key 每日最多可修改 10 次。

Token Plan 企业版专业套餐

本页目录：

快速开始

套餐详情

核心概念

积分机制

套餐规格

套餐可用模型

积分抵扣规则

模型与积分换算说明

Token 数测算说明

购买须知

配额与限制

配额

限制

更多操作