在线推理场景
语言模型
注意:
MiniMax-M3 模型:输入(包括缓存命中)超过 512k tokens 的能力仍在内测中,预计将于数日后开放,敬请期待。
模型名称 | 条件 (token) | 推理输入 (元/百万 tokens) | 推理输出 (元/百万 tokens) | 缓存命中 (元/百万 tokens) |
Hy3 preview | 输入长度(0, 16k) | 1.2 | 4 | 0.4 |
| 输入长度 [16k, 32k) | 1.6 | 6.4 | 0.6 |
| 输入长度 [32k+) | 2 | 8 | 0.8 |
Hy-MT2-Pro | - | 0.5 | 2 | - |
Hy-MT2-Plus | - | 0.5 | 2 | - |
Hy-MT2-Lite | - | 0.3 | 1.2 | - |
Hy-Role-Latest | - | 2.4 | 9.6 | - |
Hy-Role | - | 2.4 | 9.6 | - |
DeepSeek-V4-Flash 原厂直供 | - | 1 | 2 | 0.02 |
DeepSeek-V4-Pro 原厂直供 | - | 3 | 6 | 0.025 |
DeepSeek-V4-Flash | - | 1 | 2 | 0.2 |
DeepSeek-V4-Pro | - | 12 | 24 | 1 |
Deepseek-v3.2 | - | 2 | 3 | 0.4 |
Deepseek-v3.1 (2026-05-25 下线) | - | 4 | 12 | - |
Deepseek-r1-0528 (2026-05-25 下线) | - | 4 | 16 | - |
Deepseek-v3-0324 (2026-05-25 下线) | - | 2 | 8 | - |
GLM-5.2 | - | 8 | 28 | 2 |
GLM-5.1 | 输入长度(0, 32k] | 6 | 24 | 1.3 |
| 输入长度 32k+ | 8 | 28 | 2 |
GLM-5V-Turbo | 输入长度(0, 32k] | 5 | 22 | 1.2 |
| 输入长度 32k+ | 7 | 26 | 1.8 |
GLM-5-Turbo | 输入长度(0, 32k] | 5 | 22 | 1.2 |
| 输入长度 32k+ | 7 | 26 | 1.8 |
GLM-5 | 输入长度(0, 32k] | 4 | 18 | 1 |
| 输入长度 32k+ | 6 | 22 | 1.5 |
Kimi K2.7 Code HighSpeed | - | 13 | 54 | 2.6 |
Kimi K2.7 Code | - | 6.5 | 27 | 1.3 |
Kimi-K2.6 | - | 6.5 | 27 | 1.1 |
Kimi-K2.5 | - | 4 | 21 | 0.7 |
MiniMax-M3 | 输入长度(0, 512k] | 2.1 | 8.4 | 0.42 |
| 输入长度 512k+ | 4.2 | 16.8 | 0.84 |
MiniMax-M2.7 | - | 2.1 | 8.4 | 0.42 |
MiniMax-M2.5 | - | 2.1 | 8.4 | 0.21 |
Qwen3.5-Flash | 输入长度(0, 128k] | 0.2 | 2 | 0.02 |
| 输入长度(128k, 256k] | 0.8 | 8 | 0.08 |
| 输入长度(256k, 1M] | 1.2 | 12 | 0.12 |
Qwen3.5-Plus | 输入长度(0, 128k] | 0.8 | 4.8 | 0.08 |
| 输入长度(128k, 256k] | 2 | 12 | 0.2 |
| 输入长度(256k, 1M] | 4 | 24 | 0.4 |
模型名称 | 条件 (token) | 推理输入 (元/百万 tokens) | 推理输出 (元/百万 tokens) | 缓存命中 (元/百万 tokens) |
Hy3 preview | 输入长度(0, 16k) | 1.2 | 4 | 0.4 |
| 输入长度 [16k, 32k) | 1.6 | 6.4 | 0.6 |
| 输入长度 [32k+) | 2 | 8 | 0.8 |
Hy-MT2-Plus | - | 0.5 | 2 | - |
DeepSeek-V4-Flash 原厂直供 | - | 1 | 2 | 0.02 |
DeepSeek-V4-Pro 原厂直供 | - | 3 | 6 | 0.025 |
DeepSeek-V4-Flash | - | 1 | 2 | 0.2 |
DeepSeek-V4-Pro | - | 12 | 24 | 1 |
Deepseek-v3.2 | - | 4.272 | 12.815 | 0.854 |
GLM-5.2 | - | 10.254 | 32.2282 | 1.9044 |
GLM-5.1 | - | 10.254 | 32.228 | 1.904 |
GLM-5V-Turbo | - | 8.79 | 29.298 | 1.758 |
GLM-5-Turbo | - | 8.79 | 29.298 | 1.758 |
GLM-5 | - | 7.325 | 23.439 | 1.465 |
Kimi K2.7 Code HighSpeed | - | 13 | 54 | 2.6 |
Kimi K2.7 Code | - | 6.5 | 27 | 1.3 |
Kimi-K2.6 | - | 6.5 | 27 | 1.1 |
Kimi-K2.5 | - | 4.395 | 21.974 | 0.732 |
MiniMax-M3 | 输入长度(0, 512k] | 2.1 | 8.4 | 0.42 |
| 输入长度 512k+ | 4.2 | 16.8 | 0.84 |
MiniMax-M2.7 | - | 2.197 | 8.79 | 0.439 |
MiniMax-M2.5 | - | 2.197 | 8.79 | 0.22 |
Qwen3.5-Plus | 输入长度(0, 128k] | 2.936 | 17.614 | 0.294 |
| 输入长度(128k, 256k] | 2.936 | 17.614 | 0.294 |
| 输入长度(256k, 1M] | 3.67 | 22.018 | 0.367 |
视觉模型
图像生成
模型名称 | 输出单价 (元/张) |
HY-Image-V3.0 | 0.2 |
HY-Image-Lite | 0.099 |
视频生成
模型名称 | 输出消耗 |
HY-Video-1.5 | 按次计算消耗,1.5积分/次。 |
YT-Video-2.0 | 按次计算消耗。 480p:2积分/次 720p/1080p:5积分/次 |
YT-Video-FX | 按次计算消耗,根据模板消耗积分。 |
YT-Video-HumanActor | 按秒计算消耗 720p:1积分/秒 1080p:2积分/秒 |
3D 生成
模型名称 | 输出消耗 |
HY-3D-3.0 | 按次计算消耗,15~60积分/次 |
HY-3D-3.1 | 按次计算消耗,15~60积分/次 |
HY-3D-Express | 按次计算消耗,15~25积分/次 |
多模态理解模型
模型名称 | 推理输入(元/百万 tokens) | 推理输出(元/百万 tokens) |
YT-VITA | 1.2 | 3.5 |
HY-Vision-2.0-Instruct | 7.5 | 17.5 |
HY-Vision-1.5-Thinking | 3 | 9 |
HY-Vision-Video | 3 | 9 |
批量任务场景
模型名称 | 条件 (token) | 推理输入 (元/百万 tokens) | 推理输出 (元/百万 tokens) | 缓存命中 (元/百万 tokens) |
GLM-5 | 输入长度(0, 32k] | 2 | 9 | 0.5 |
| 输入长度 32k+ | 3 | 11 | 0.75 |
GLM-5.1 | 输入长度(0, 32k] | 3 | 12 | 0.65 |
| 输入长度 32k+ | 4 | 14 | 1 |
相关文档