首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >从原混元 / 知识引擎 DeepSeek 平台迁移到 TokenHub:完整三步指南

从原混元 / 知识引擎 DeepSeek 平台迁移到 TokenHub:完整三步指南

原创
作者头像
gavin1024
发布2026-05-28 10:25:04
发布2026-05-28 10:25:04
40
举报

摘要

原混元大模型与知识引擎 DeepSeek API 平台的售卖入口正在迁移到腾讯云 TokenHub。本文按"启用模型与付费 → 创建 API Key → 更新调用配置"完整三步指南,梳理后付费 / 预付费用户迁移路径、不再支持的 7 款模型清单、API 兼容方式与联网搜索接口变更,帮助开发者顺利平滑切换至 TokenHub 大模型服务平台。

一、为什么现在就要迁移

如果你过去通过原"混元大模型 API"或"知识引擎原子能力 — DeepSeek API 平台"调用大模型,近期一定收到过平台调整通知:原平台已停止新购模型服务,售卖入口正在统一收敛到腾讯云大模型服务平台 TokenHub。

继续观望意味着两件事:第一,业务侧的 API 调用链路存在到期失效的风险;第二,TokenHub 已经把 DeepSeek-V4-Pro / V4-Flash、Hy3 preview、GLM-5.1、Kimi-K2.6、MiniMax-M2.7 等更新一代的模型集中接入,并打通了新人免费体验、Token Plan 订阅、企业版积分池等多种使用模式。早一步迁移,开发节奏与成本结构都更可控。

迁移的实际收益可以拆成三块:

a. 模型矩阵直接升级一档,不再围绕已下线版本做适配;

b. 一个 API Key 即可接入多家主力模型,不必再分别维护多套调用配置;

c. 已开通后付费的账号,迁移过程不影响业务连续性,可在低峰期分批切换。


二、迁移前必看:哪些模型不再支持

迁移之前请先核对你的代码与脚本中调用了哪些模型 ID。以下 7 款原平台模型在 TokenHub 不再继续提供,请在切换前同步替换或下线:

序号

原模型调用参数

状态

1

hunyuan-t1-latest

不再支持

2

hunyuan-a13b

不再支持

3

hunyuan-turbos-latest

不再支持

4

hunyuan-lite

不再支持

5

hunyuan-translation

不再支持

6

hunyuan-translation-lite

不再支持

7

hunyuan-large-role-latest

不再支持

此外,以下 4 款模型将于 2026 年 6 月 10 日 在 Token Plan 套餐中下线,建议在迁移过程中一并替换为新一代模型:HY 2.0 Instruct、HY 2.0 Think、Hunyuan-T1、Hunyuan-TurboS。

2.1 推荐的对应替换

a. 原使用 hunyuan-t1-latest 的深度推理场景:可切换至 Hy3 preview(hy3-preview,256k 上下文,支持深度思考与 Cache 缓存)或 DeepSeek-V4-Pro(1M 上下文)。

b. 原使用 hunyuan-lite / hunyuan-turbos-latest 的轻量推理场景:可切换至 DeepSeek-V4-Flash(输入 1 元/百万 tokens,输出 2 元/百万 tokens)或 MiniMax-M2.5(缓存命中价 0.21 元/百万 tokens)。

c. 原使用 hunyuan-translation 系列:暂未在 TokenHub 中提供同名翻译专用模型,可使用通用语言模型自定义翻译 Prompt 实现。

d. 原使用 hunyuan-large-role-latest 角色扮演:可使用 Hunyuan-role(hunyuan-role-latest)。

提示:未及时替换调用参数会导致 API 直接报错。建议在测试环境完成回归后再切换生产流量。


三、迁移涉及范围:先判断你属于哪一类用户

不同付费状态对应不同迁移路径,先对照下表判断:

用户类型

迁移方式

已开启后付费

直接按"三步指南"迁移,资源平滑切换

已开启预付费

① 等原资源包用完后切换;② 联系平台申请按未使用比例退费后切换

预付费用户的退费金额计算方式为:

代码语言:txt
复制
退费金额 = 资源包购买金额 × (1 - 资源包使用比例)

退款周期通常需要数天至 1 周,建议在业务低峰期发起申请。如果原资源包剩余比例较低,等用完再切换会更省事;剩余较多时优先走退费流程,避免过期浪费。


四、完整三步迁移指南

4.1 第一步:启用模型与付费方式

a. 登录 TokenHub 控制台,按界面提示完成服务开通;

b. 进入"在线推理"页面,按业务需要选择目标模型(DeepSeek-V4-Pro/Flash、Hy3 preview、GLM-5.1、Kimi-K2.6 等);

c. 同时开启 "免费体验""启用后付费"——平台默认优先消耗免费额度,免费额度用尽后无缝切到后付费,业务不会中断;

d. 如果该模型有多个业务场景需要区分计费或限流,可创建多个在线推理服务。同一模型的多个服务计费完全独立。

新人福利:每个主账号可一次性领取最高 100 万免费 Tokens(不同模型额度不同,部分模型 50 万 Tokens / 90 天,视觉类模型 50–100 积分 / 365 天有效期),用于完成迁移前的回归测试再合适不过。

4.2 第二步:创建 API Key

  1. 进入 API Key 管理 页面;
  2. 选择目标地域,点击"创建 API Key";
  3. 填写 Key 名称,并设置访问范围——可选"全模型"、"限定特定模型"或"限定特定服务",方便后续按团队 / 项目精细化授权;
  4. 点击确定,复制并妥善保存 API Key,控制台不会再次完整展示。

为不同业务线分别创建多把 Key,是降低运维风险的常见做法:一旦某把 Key 泄漏,仅需吊销该 Key,其余业务不受影响。

4.3 第三步:更新 API 调用配置

TokenHub 全面兼容 OpenAI API 协议,主流 SDK 几乎只需替换两个字段。

OpenAI SDK 方式
代码语言:python
复制
# 旧 base_url 替换为:
base_url = "https://tokenhub.tencentmaas.com/v1"
# 同时使用新创建的 TokenHub API Key
直接 URL 方式
代码语言:txt
复制
POST https://tokenhub.tencentmaas.com/v1/chat/completions
Authorization: Bearer YOUR_TOKENHUB_API_KEY
Content-Type: application/json

请求体中的 model 字段填新平台的模型调用参数,例如 deepseek-v4-flashhy3-previewglm-5.1kimi-k2.6 等。具体可在每个模型详情页复制示例代码。

如果原项目已使用 OpenAI 官方 SDK,业务代码几乎无需改动;如果使用的是混元自研 SDK,建议改造为 OpenAI 协议,后续切换其他模型成本最低。


五、联网搜索能力的接口变更

原平台的"联网搜索"作为附属功能存在于 Chat Completions 接口中(参数 enable_search: true),DeepSeek 联网搜索按 8 元 / 千次计费、混元未单独收费。迁移到 TokenHub 后,联网搜索升级为独立产品能力,并改用全新的 Responses API 协议与定价体系

维度

原平台

TokenHub

产品定位

附属功能

独立产品能力

API 协议

Chat Completions

Responses API

接口参数

enable_search: true

全新参数体系

上线时间

跟随原平台下线

Hy3 preview 5 月底;DeepSeek 等 6 月底

凡是用过 enable_search: true 的项目都需要按新接口重新接入,建议在迁移规划中预留这部分改造时间。


六、迁移后建议做的三件事

6.1 把缓存命中率优化做成默认动作

DeepSeek-V4-Pro/Flash、Hy3 preview、GLM-5 系列、Kimi-K2.5/2.6、MiniMax-M2.5/2.7 都支持 Prompt Cache,缓存命中价格通常为常规输入价的 1/4 ~ 1/10。在请求中加入 prompt_cache_key(值建议为业务侧 conversation_id)和 X-Session-ID Header,让同一对话上下文持续复用 KV Cache,可显著降低首 Token 时延(TTFT)与单位调用成本。

6.2 接入控制台监控指标

进入控制台"模型监控",把 TTFT(首 Token 时延)、TPOT(每 Token 输出时延)、RPM(每分钟请求数)等指标接入告警;配合"用量统计"按模型 / 服务 / API Key 维度查账,运维同学排查问题更直观。

6.3 评估是否切换到订阅模式

如果迁移后业务调用量稳定,可对比"按量 vs Token Plan"。Token Plan 个人版与企业版相比 API 按量计费便宜 50%–80%,企业版还支持自定义月预算、积分池统一管理、多 Key 配额分配,适合按部门或项目分别采购。


七、常见问题答疑

Q1:迁移过程中老 API 还能用吗?

原平台仅停止新购模型服务,已开启后付费的账号在迁移过渡期内业务调用不会中断,可分批替换。

Q2:迁移会丢失历史用量数据吗?

TokenHub 控制台的"用量统计"为新账本,原平台历史账单仍可在腾讯云费用中心查询。

Q3:API Key 可以一把通用全部模型吗?

可以。创建 Key 时把访问范围设为"全模型"即可;如需精细化管控,则设为"限定特定模型"或"限定特定服务"。

Q4:模型生成失败会不会扣费?

视觉类模型(图像 / 视频 / 3D 生成)生成失败不计费;语言模型按实际产生的 Token 计费。


八、立即开始迁移

迁移并不复杂,难的是把它排进日程。把这篇指南转给负责 API 接入的同事,按"启用模型 → 创建 Key → 更新 Base URL"三步推进,多数项目可以在一天内完成切换;新人 100 万免费 Tokens 还能直接用于回归测试。

迁移完整资料请参考 TokenHub 迁移指南文档,控制台开通入口:TokenHub 控制台

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 摘要:
  • 一、为什么现在就要迁移
  • 二、迁移前必看:哪些模型不再支持
    • 2.1 推荐的对应替换
  • 三、迁移涉及范围:先判断你属于哪一类用户
  • 四、完整三步迁移指南
    • 4.1 第一步:启用模型与付费方式
    • 4.2 第二步:创建 API Key
    • 4.3 第三步:更新 API 调用配置
      • OpenAI SDK 方式
      • 直接 URL 方式
  • 五、联网搜索能力的接口变更
  • 六、迁移后建议做的三件事
    • 6.1 把缓存命中率优化做成默认动作
    • 6.2 接入控制台监控指标
    • 6.3 评估是否切换到订阅模式
  • 七、常见问题答疑
  • 八、立即开始迁移
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档