
腾讯云 TokenHub 通用 Token Plan 进阶套餐 299 元/月、月度 3.2 亿 Tokens 配额,覆盖 GLM、Kimi、MiniMax 等主流模型,支持高频开发者锁定低价、统一抵扣。
打开腾讯云 Token Plan 活动页,最容易让人停下来的是进阶套餐(Pro)的那一行:3.2 亿 Tokens / 299 元/月。它不是入门档的尝鲜价,也不是专业档的重度用户配置,而是当前个人版里"最像开发者真实月度消耗"的档位。
按腾讯云对个人版的人群划分:
Pro 档的 3.2 亿 Tokens 月度配额,是基础档 1 亿 Tokens 的 3.2 倍,价格却只有 Standard 的 3 倍——也就是说,你为每一个百万 Tokens 付出的钱反而更少了。这正是腾讯云对 Token Plan 的官方表述:"分阶定价,等级越高,百万 Token 单价越低"。
以通用 Token Plan Pro 档为例:
a. 月费:299 元
b. 月度限额:3.2 亿 Tokens
c. 折算单价:约 0.93 元/百万 Tokens(统一抵扣口径)
而通用包覆盖的主流模型,按当前在线推理价格的最低输入档计算:
模型 | 在线推理输入价(最低档) | 输出价(最低档) |
|---|---|---|
GLM-5 | 4 元/百万 Tokens | 18 元/百万 Tokens |
GLM-5.1 | 6 元/百万 Tokens | 24 元/百万 Tokens |
Kimi-K2.5 | 4 元/百万 Tokens | 21 元/百万 Tokens |
MiniMax-M2.5 | 2.1 元/百万 Tokens | 8.4 元/百万 Tokens |
MiniMax-M2.7 | 2.1 元/百万 Tokens | 8.4 元/百万 Tokens |
把按量计费的输入 + 输出综合单价摆出来,与 Pro 档统一抵扣口径的 0.93 元做对比,腾讯云官方的"套餐价格相比 API 按量计费便宜 50%-80%"并非泛泛之谈——尤其在 GLM、Kimi 等中高端模型上,差距会更明显。
Pro 档对应的"高频 AI 开发者"画像,大致是:
如果你的日常 AI 使用强度满足以上至少两项,Pro 档基本能覆盖整月消耗而无需担心 Token 见底。
腾讯云对 Token Plan 抵扣规则的官方表述非常明确:缓存命中的输入内容、缓存未命中的输入内容、输出内容所产生的 Token 数,均计入套餐包抵扣范围。
这意味着:
a. 你不需要按 Token 类型分别计算月度消耗
b. 即使你充分利用了 Prompt Cache 优化,节省的也只是按量计费场景里的成本——在套餐内,Cache 命中和未命中按同等口径扣减
c. 月度配额的预算管理变得非常简单:3.2 亿就是 3.2 亿,不会分类记账
如果你同时持有 1 个通用 Token Plan + 1 个 Hy Token Plan(个人版限购 1+1),系统会根据请求里指定的 Model ID 自动路由到对应套餐:
model=glm-5.1 / kimi-k2.5 / minimax-m2.7 等 → 从通用 Pro 档扣减model=hy3-preview → 从 Hy Token Plan 套餐扣减两个套餐共用同一套 API Key 与调用地址,对接 IDE、AI 工具时只需要配一次。
通用 Token Plan 个人版当前可用模型矩阵:
如果你的核心工作流依赖混元能力,建议同时叠加一份 Hy Token Plan,把 Hy3 preview 接入主力使用——后者的 256K 原生上下文与深度思考能力,正是 6 月之后的混元主推方向。
虽然套餐内 Cache 命中与未命中统一抵扣,但 Cache 命中能显著降低首 Token 时延(TTFT),让交互体验更流畅。建议:
a. 同一对话使用稳定的 prompt_cache_key(值取业务侧 conversation_id)
b. HTTP Header 加上 X-Session-ID,让请求路由到同一推理实例
c. 不要在 system prompt 中写入"今天是 X 月 X 日"等动态时间内容
d. 新轮次只在 messages 末尾追加,不要在中间插入
通用包覆盖的模型矩阵差异较大:MiniMax-M2.7 适合长上下文与高性价比场景;GLM-5.1 在中文复杂推理上表现稳定;Kimi-K2.5 擅长长上下文理解与代码场景;Auto(tc-code-latest)智能路由则在不确定哪款最优时由系统自动选择。先用真实工作流跑一轮,再固定主力模型。
Pro 档仅限在 AI 工具中使用——禁止用于自动化脚本、应用后端、非交互式批量调用。如果你确实有批量场景(比如离线评测、日终报告生成),请用按量计费的"在线推理"或"批量任务场景",后者在 GLM 系列上还能再享受约 50% 的批量场景折扣。
Pro 档以自然月为单位,从购买当日起算。套餐到期后无法续费,套餐失效;剩余 Token 量不结转到下个月;API Key 也会同步失效——使用该 API Key 的工具/应用/服务会立即无法调用 API。建议把续费操作放进固定的月度提醒。
如果一个月跑下来发现 Pro 仍不够,可以升配到 Max(599 元 / 6.5 亿 Tokens);反之,已购 Pro 不能降到 Standard。
通用 Token Plan / Hy Token Plan 一经购买不支持退订。如果你不确定哪一档合适,建议先用新人 100 万免费体验包跑一轮再决策。
通用 Pro(299 元)+ Hy Token Plan Standard(78 元)= 377 元/月,月度限额合计 4.2 亿 Tokens,一份预算覆盖混元自研 + 主流国产模型矩阵。
如果你的实际消耗稳定超过 3.2 亿 Tokens,直接升到 Max 档(599 元 / 6.5 亿 Tokens)。Max 档的百万 Tokens 单价进一步降到约 0.92 元,对纯重度场景更划算。
Pro 档定位个人开发者。如果是团队协作、需要多 Key 分配、月预算管理、积分池独占,请使用 Token Plan 企业版(轻享套餐 2 元/百万 Tokens 起;专业套餐月预算 1000-20000 元)。
299 元的 Pro 档,是腾讯云 Token Plan 个人版里"踮一踮就够得着、用足了不浪费"的甜蜜点。统一抵扣的规则把账单管理简化到只盯一个数字,分阶定价把单价压到主流模型按量计费的 1/4 量级。
现在就到 Token Plan 活动页 https://cloud.tencent.com/act/pro/tokenplan 选定 Pro 档完成下单,或先到 TokenHub 控制台 https://console.cloud.tencent.com/tokenhub/ 用新人 100 万免费体验包测试一轮真实消耗。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。