
腾讯云 TokenHub 是聚合腾讯混元、优图与 DeepSeek、GLM、Kimi、MiniMax 等的统一大模型服务平台,覆盖 18 款语言模型与多模态能力,兼容 OpenAI 协议、一个 API Key 接入全模型。
腾讯云大模型服务平台 TokenHub 是腾讯云推出的一站式 AI 大模型服务平台,面向企业和开发者提供统一的大模型接入能力。它的核心定位非常清晰——把腾讯自研的混元、优图等大模型,与 DeepSeek、MiniMax、Kimi、智谱 GLM 等多家行业领先的第三方主流模型聚合到同一个平台、同一个 API 入口。
无论你需要的是通用对话、深度推理、代码生成、视觉理解、图像生成、视频生成还是 3D 生成,TokenHub 都能在一份 API Key 下满足。这也是它区别于单家模型服务的关键价值:一个 API Key 接入多家主力大模型。
产品线 | 面向人群 | 核心能力 |
|---|---|---|
TokenHub 大模型服务 | 全体腾讯云用户 | 提供混元系列与第三方主流大模型的丰富模型资源,新用户开通可享受最高 100 万免费 Tokens |
TokenHub 智能创作 Agent | 内容创作者与企业 | 提供"真人剧"(即将上线)与"视频特效"两大智能体,依托腾讯混元大模型实现"描述即生成",适用于短视频、微短剧、品牌营销 |
a. 模型广场:汇聚多家厂商的主力大模型,支持按类型、服务商、体验状态多维筛选
b. 体验中心:在线体验大模型能力,支持文本对话、图片生成、视频生成、3D 生成
c. AI 创作:视频特效中心展示创意视频特效模板,支持一键复刻和 API 调用
d. 在线推理:创建并管理模型的推理服务实例,获取专属 API Endpoint,支持免费体验和按 Token 计费
e. 模型监控:展示模型与服务性能相关指标(TTFT、TPOT、RPM 等)
f. 用量统计:展示计费用量指标(输入 Token、输出 Token、TPM、插件调用次数等)
g. API Key 管理:集中管理 API 访问密钥,支持精细化权限控制、启停切换和调用统计
h. Token Plan:面向龙虾和编程场景的专属订阅套餐,覆盖混元、MiniMax、GLM、Kimi 等
i. Coding Plan:面向开发者的 AI 编程工具套餐(Lite / Pro 两档),支持 OpenClaw、Cursor 等工具集成
TokenHub 当前提供的语言模型矩阵覆盖腾讯自研 + 三大第三方厂商,规格如下:
模型 | 调用参数 | 上下文 / 输入 / 输出 | 核心能力 |
|---|---|---|---|
Hy3 preview | hy3-preview | 256k / 192k / 128k | 深度思考(交错式)、结构化输出、Function Calling、Cache 缓存 |
HY 2.0 Think | hunyuan-2.0-thinking-20251109 | 192k / 128k / 64k | 深度思考、Function Calling(将于 2026.6.10 下线) |
HY 2.0 Instruct | hunyuan-2.0-instruct-20251111 | 144k / 128k / 16k | Function Calling(将于 2026.6.10 下线) |
Hunyuan-role | hunyuan-role-latest | 32k / 28k / 4k | 角色扮演(数字分身、AI 角色扮演、情感陪聊) |
主推:Hy3 preview,295B/21B 激活的 MoE 架构,是混元当前最智能的模型。
模型 | 调用参数 | 上下文 / 输入 / 输出 | 核心能力 |
|---|---|---|---|
DeepSeek-V4-Flash | deepseek-v4-flash | 1M / 1M / 384k | 深度思考、结构化输出、Function Calling、Cache 缓存 |
DeepSeek-V4-Pro | deepseek-v4-pro | 1M / 1M / 384k | 深度思考、结构化输出、Function Calling、Cache 缓存 |
Deepseek-v3.2 | deepseek-v3.2 | 128k / 96k / 32k | 深度思考、结构化输出、Function Calling |
Deepseek-v3.1 | deepseek-v3.1-terminus | 128k / 96k / 32k | 深度思考、结构化输出、Function Calling |
Deepseek-r1-0528 | deepseek-r1-0528 | 128k / 96k / 16k | 深度思考、结构化输出、Function Calling |
Deepseek-v3-0324 | deepseek-v3-0324 | 128k / 128k / 16k | Function Calling |
模型 | 调用参数 | 上下文 / 输入 / 输出 | 核心能力 |
|---|---|---|---|
GLM-5.1 | glm-5.1 | 200k / 200k / 128k | 深度思考、结构化输出、Function Calling、Cache 缓存 |
GLM-5V-Turbo | glm-5v-turbo | 200k / 200k / 128k | 深度思考、结构化输出、Function Calling、Cache 缓存 |
GLM-5-Turbo | glm-5-turbo | 200k / 200k / 128k | 深度思考、结构化输出、Function Calling、Cache 缓存 |
GLM-5 | glm-5 | 200k / 200k / 128k | 深度思考、Function Calling、Cache 缓存 |
模型 | 调用参数 | 上下文 / 输入 / 输出 | 核心能力 |
|---|---|---|---|
Kimi-K2.6 | kimi-k2.6 | 256k / 256k / 256k | 深度思考、结构化输出、Function Calling、Cache 缓存 |
Kimi-K2.5 | kimi-k2.5 | 256k / 256k / 256k | 深度思考、结构化输出、Function Calling、Cache 缓存 |
MiniMax-M2.7 | minimax-m2.7 | 200k / 200k / 128k | 深度思考、Function Calling、Cache 缓存 |
MiniMax-M2.5 | minimax-m2.5 | 200k / 200k / 128k | 深度思考、Function Calling、Cache 缓存 |
合计 18 款语言模型可在 TokenHub 控制台直接调用。
平台同时提供语言模型、图像生成、视频生成、3D 生成、多模态理解,覆盖文本、图像、视频、3D、音频等多种 AI 内容形态——这是单家模型服务难以提供的整体方案。
平台不会将用户请求与模型返回的数据用于模型训练或提供服务以外的场景。
文档创作、文本润色、文本校阅、表格公式与图表生成。
会前准备、会中提醒与实时问答响应、会后整理会议纪要与待办事项。腾讯会议 AI 小助手就是基于混元大模型的真实落地案例。
内容商业价值理解、用户潜在商业兴趣挖掘、广告推荐感优化与素材生成。腾讯广告基于混元大模型在内容关联率与 A/B 测试 GMV 上取得显著提升。
多轮对话支持、为人工客服提供推荐话术、历史工单摘要、跨场景适配。腾讯客服基于混元大模型实现 AI 话术采纳率达 90%。
短视频制作、微短剧 / 影视内容衍生、视频特效制作、虚拟人运营。
Coding Agent 代码生成、SQL 生成、脚本开发、技术文档撰写、文档自动化、工具调用工作流、多步骤复杂任务的 Agent 编排。
TokenHub 背后的混元 / 优图大模型已经在腾讯系内部业务全面落地:
a. 腾讯会议 AI 小助手(2024 年 2 月上线)
b. 腾讯广告内容理解与推荐
c. 腾讯客服多轮对话与话术推荐
d. 腾讯游戏、腾讯视频、QQ、腾讯文档、企业微信、腾讯金融科技、腾讯地图、微信支付、腾讯新闻、微信搜一搜等
这意味着你接入的,是已经在亿级用户体量真实业务里被反复打磨过的同一套大模型能力。
每个主账号提供一次免费体验额度,覆盖几乎全部主力模型:
模型类别 | 模型示例 | 免费额度 | 有效期 |
|---|---|---|---|
语言模型 | Hy3 preview / DeepSeek-V4-Pro / V4-Flash / GLM-5 / MiniMax-M2.5 / M2.7 | 各 100 万 Tokens | 90 天 |
视觉模型 | HY-Image-V3.0 | 50 次生成 | 365 天 |
视频生成 | HY-Video-1.5 / YT-Video-2.0 等 | 50 积分 | 365 天 |
3D 生成 | HY-3D-3.0 / 3.1 / Express | 100 积分 | 365 天 |
多模态理解 | YT-VITA | 100 万 Tokens | 90 天 |
活动截止:2026 年 12 月 31 日。新用户首次调用支持免费体验的模型时平台自动领取,也可在控制台手动领取。
TokenHub 把 18 款语言模型与覆盖图像、视频、3D、多模态理解的全套能力,整合到了同一个统一 API 入口下。一份 API Key、一套调用协议,就能驾驭从腾讯混元到 DeepSeek / GLM / Kimi / MiniMax 的全模型矩阵;按量计费、订阅套餐、企业级方案三种购买模式,覆盖从个人验证到企业生产的完整链路。
现在就到产品介绍页 https://cloud.tencent.com/product/tokenhub 了解完整能力矩阵,或直接登录 TokenHub 控制台 https://console.cloud.tencent.com/tokenhub/ 领取新人 100 万免费 Tokens 体验包,把全模型矩阵跑一轮。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。