概述
大模型服务平台 TokenHub 兼容 OpenAI API、Anthropic API 协议,可直接使用 OpenAI SDK 快速接入。
接口域名
针对不同的地域,平台提供了不同的接入地址,以便于为您提供最稳定的接入。默认接入地址如下:
地域 | 接口地址 |
广州 | https://tokenhub.tencentmaas.com |
新加坡 | https://tokenhub-intl.tencentmaas.com |
同时平台提供了备用接入地址以确保异常情况下用户能顺利接入,当默认地址不可用时,您可以尝试切换为以下接入地址:
地域 | 接口地址 |
广州 | https://tokenhub.tencentmaas.cn |
新加坡 | https://tokenhub-intl.tencentmaas.cn |
鉴权方式
使用 API KEY 通过
Authorization: Bearer Header 鉴权。模型调用方式
模型名称 | model 参数值 | API 调用指引 |
Hy3 preview | hy3-preview | |
HY 2.0 Think | hunyuan-2.0-thinking-20251109 | |
HY 2.0 Instruct | hunyuan-2.0-instruct-20251111 | |
Hunyuan-role | hunyuan-role-latest | |
DeepSeek-V4-Flash | deepseek-v4-flash | |
DeepSeek-V4-Pro | deepseek-v4-pro | |
Deepseek-v3.2 | deepseek-v3.2 | |
Deepseek-v3.1 | deepseek-v3.1-terminus | |
Deepseek-r1-0528 | deepseek-r1-0528 | |
Deepseek-v3-0324 | deepseek-v3-0324 | |
GLM-5.1 | glm-5.1 | |
GLM-5V-Turbo | glm-5v-turbo | |
GLM-5-Turbo | glm-5-turbo | |
GLM-5 | glm-5 | |
Kimi-K2.6 | kimi-k2.6 | |
Kimi-K2.5 | kimi-k2.5 | |
MiniMax-M2.7 | minimax-m2.7 | |
MiniMax-M2.5 | minimax-m2.5 | |
HY-Image-V3.0 | HY-Image-V3.0 | |
HY-Image-Lite | HY-Image-Lite | |
HY-Video-1.5 | HY-Video-1.5 | |
YT-Video-2.0 | YT-Video-2.0 | |
YT-Video-HumanActor | YT-Video-HumanActor | |
YT-Video-FX | YT-Video-FX | |
HY-3D-3.0 | HY-3D-3.0 | |
HY-3D-3.1 | HY-3D-3.1 | |
HY-3D-Express | HY-3D-Express | |
YT-VITA | youtu-vita | |
错误码
错误码 | HTTP 状态码 | 错误原因 | 解决建议 |
400001 | 400 | 请求体格式非法(JSON 格式错误/必填字段缺失) | 检查请求 body 是否为合法 JSON,必填字段是否齐全。 |
400002 | 400 | 参数值非法(字段值超范围/格式错误) | 确保 messages 数组非空,role 和 content 字段是否齐全;检查各参数取值范围。 |
400003 | 400 | 输入超过模型上下文限制 | 减少输入长度或换用上下文更长的模型。 |
400004 | 400 | 模型不存在 | 检查 model 字段拼写,确认模型或者推理站点是否正确。 |
401001 | 401 | 未授权(Authorization 头缺失或格式错误 等) | 检查请求头是否包含 Authorization: Bearer <token>,格式是否正确。 |
401002 | 401 | API Key 无效 | 确认 API Key 是否存在且未被删除/停用。 |
401004 | 401 / 403 | API Key 被封禁/屏蔽 | 联系管理员解除封禁,或申请新的 API Key。 |
401006 | 400 | 接入点无效 | 检查 推理服务的接入点是否正确。 |
401006 | 402 | 接入点欠费停服 | 充值续费,联系计费管理员/或者没有启用后付费。 |
429001 | 429 | 请求频率超限 " rate limit exceeded on dimension: tpm"为每分钟 Token 数超限。" rate limit exceeded on dimension: rpm"为每分钟请求数超限。" rate limit exceeded on dimension: concurrency"为并发请求数超限(HY 模型场景)。 | 控制每分钟 Token 数 / 调用频率 / 并发数。 |
451001 | 451 | 请求内容被安全策略拦截 | 修改请求内容,去除违规词汇/敏感信息。 |
5xxxxxx | 5xx | 服务端错误 |