大模型服务平台 TokenHub 模型价格

在线推理场景
语言模型
广州
新加坡
模型名称
条件
（token）
推理输入
（元/百万 tokens）
推理输出
（元/百万 tokens）
缓存命中
（元/百万 tokens）
Hy3
-
1
4
0.25
Hy3 preview
输入长度（0, 16k）
1.2
4
0.4
﻿
输入长度 [16k, 32k）
1.6
6.4
0.6
﻿
输入长度 [32k+）
2
8
0.8
Hy-MT2-Pro
-
0.5
2
-
Hy-MT2-Plus
-
0.5
2
-
Hy-MT2-Lite
-
0.3
1.2
-
Hy-Role-Latest
-
2.4
9.6
-
Hy-Role
-
2.4
9.6
-
DeepSeek-V4-Flash 原厂直供
-
1
2
0.02
DeepSeek-V4-Pro 原厂直供
-
3
6
0.025
DeepSeek-V4-Flash
-
1
2
0.2
DeepSeek-V4-Pro
-
12
24
1
Deepseek-v3.2
-
2
3
0.4
Deepseek-v3.1
（2026-05-25 下线）
-
4
12
-
Deepseek-r1-0528
（2026-05-25 下线）
-
4
16
-
Deepseek-v3-0324
（2026-05-25 下线）
-
2
8
-
GLM-5.2
-
8
28
2
GLM-5.1
输入长度（0, 32k]
6
24
1.3
﻿
输入长度 32k+
8
28
2
GLM-5V-Turbo
输入长度（0, 32k]
5
22
1.2
﻿
输入长度 32k+
7
26
1.8
GLM-5-Turbo
输入长度（0, 32k]
5
22
1.2
﻿
输入长度 32k+
7
26
1.8
GLM-5
输入长度（0, 32k]
4
18
1
﻿
输入长度 32k+
6
22
1.5
Kimi K3
-
20
100
2
Kimi K2.7 Code HighSpeed
-
13
54
2.6
Kimi K2.7 Code
-
6.5
27
1.3
Kimi-K2.6
-
6.5
27
1.1
Kimi-K2.5
-
4
21
0.7
MiniMax-M3
输入长度（0, 512k]
2.1
8.4
0.42
﻿
输入长度 512k+
4.2
16.8
0.84
MiniMax-M2.7
-
2.1
8.4
0.42
MiniMax-M2.5
-
2.1
8.4
0.21
Qwen3.5-Flash
输入长度（0, 128k]
0.2
2
0.02
﻿
输入长度（128k, 256k]
0.8
8
0.08
﻿
输入长度（256k, 1M]
1.2
12
0.12
Qwen3.5-Plus
输入长度（0, 128k]
0.8
4.8
0.08
﻿
输入长度（128k, 256k]
2
12
0.2
﻿
输入长度（256k, 1M]
4
24
0.4
模型名称
条件
（token）
推理输入
（元/百万 tokens）
推理输出
（元/百万 tokens）
缓存命中
（元/百万 tokens）
Hy3 preview
输入长度（0, 16k）
1.2
4
0.4
﻿
输入长度 [16k, 32k）
1.6
6.4
0.6
﻿
输入长度 [32k+）
2
8
0.8
Hy-MT2-Plus
-
0.5
2
-
DeepSeek-V4-Flash 原厂直供
-
1
2
0.02
DeepSeek-V4-Pro 原厂直供
-
3
6
0.025
DeepSeek-V4-Flash
-
1
2
0.2
DeepSeek-V4-Pro
-
12
24
1
Deepseek-v3.2
-
4.272
12.815
0.854
GLM-5.2
-
10.254
32.2282
1.9044
GLM-5.1
-
10.254
32.228
1.904
GLM-5V-Turbo
-
8.79
29.298
1.758
GLM-5-Turbo
-
8.79
29.298
1.758
GLM-5
-
7.325
23.439
1.465
Kimi K3
-
21.974
109.869
2.197
Kimi K2.7 Code HighSpeed
-
13
54
2.6
Kimi K2.7 Code
-
6.5
27
1.3
Kimi-K2.6
-
6.5
27
1.1
Kimi-K2.5
-
4.395
21.974
0.732
MiniMax-M3
输入长度（0, 512k]
2.1
8.4
0.42
﻿
输入长度 512k+
4.2
16.8
0.84
MiniMax-M2.7
-
2.197
8.79
0.439
MiniMax-M2.5
-
2.197
8.79
0.22
Qwen3.5-Plus
输入长度（0, 128k]
2.936
17.614
0.294
﻿
输入长度（128k, 256k]
2.936
17.614
0.294
﻿
输入长度（256k, 1M]
3.67
22.018
0.367
视觉模型
图像生成
模型名称
输出单价
（元/张）
HY-Image-V3.0
0.2
HY-Image-Lite
0.099
视频生成
视频生成按照积分计费，后付费方式下，结算周期为日结。积分单价为“元/积分”，针对不同模型，积分单价不同，具体请见下表：
模型名称
积分单价（元/积分）
输出消耗（不同模型积分单价可能不同，实际费用需结合积分单价与对应模型的输出消耗共同计算）
HY-Video-1.5
1.0
按次计算消耗，1.5 积分/次。
YT-Video-2.0
1.0
按次计算消耗。
480p：2 积分/次
720p/1080p：5 积分/次
YT-Video-FX
1.0
按次计算消耗，根据模板消耗积分。
消耗详情请参见 视频特效模板计费。
YT-Video-HumanActor
1.0
按秒计算消耗
720p：1 积分/秒
1080p：2 积分/秒
Kling-Video-v3
1.0
按秒计算消耗
720P：0.6 积分/秒
720P 有声：0.9 积分/秒
1080P：0.8 积分/秒
1080P 有声：1.2 积分/秒
4K 无声&有声：3 积分/秒
Kling-Video-v2.6
1.0
按秒计算消耗
720P：0.3 积分/秒
1080P：0.5 积分/秒
1080P 有声：1.0 积分/秒
1080P 有声-指定音色：1.2 积分/秒
4K 无声&有声：3 积分/秒
Kling-Video-v2.5-turbo
1.0
按秒计算消耗
720P：0.3 积分/秒
1080P：0.5 积分/秒
Kling-Video-v2.1-master
1.0
按秒计算消耗
2 积分/秒
Kling-Video-v2.1
1.0
按秒计算消耗
720P：0.4 积分/秒
1080P：0.7 积分/秒
Vidu-Video-q3-pro
0.3125
按秒计算消耗
540P：0.9 积分/秒
720P：2 积分/秒
1080P：2.4 积分/秒
Vidu-Video-q3-turbo
0.3125
按秒计算消耗
540P：0.7 积分/秒
720P：1.2 积分/秒
1080P：1.3 积分/秒
计费示例
1. 成功调用 HY-Video-1.5 模型生成一段视频，按照 1.5 积分/次 x 1.0 元/积分 = 实际费用 1.5 元
2. 成功调用 Kling-Video-v3 模型生成一段 1080P 分辨率 5 秒钟视频（无视频声音），按照 5 秒钟 x 0.8 积分/秒（1080P 无声）x 1.0 元/积分 = 实际费用 4.0 元。
计费示例仅供费用计算方式参考，具体计费项、单价、消耗规则及最终费用以控制台展示和费用中心账单为准。
3D 生成
积分说明：后付费方式下，1积分对应0.12元。结算周期为日结。详细计费信息可参见 计费概述（生3D）。
模型名称
输出消耗
HY-3D-3.0
按次计算消耗，15～60积分/次
HY-3D-3.1
按次计算消耗，15～60积分/次
HY-3D-Express
按次计算消耗，15～25积分/次
多模态理解模型
模型名称
推理输入（元/百万 tokens）
推理输出（元/百万 tokens）
YT-VITA
1.2
3.5
HY-Vision-2.0-Instruct
7.5
17.5
HY-Vision-1.5-Thinking
3
9
HY-Vision-Video
3
9
向量模型
模型名称
计费项
价格（元/百万 tokens）
Kinfra-Text-Embedding-0.6b
文本输入
0.5
Kinfra-Text-Embedding-4b
文本输入
0.6
Kinfra-VL-Embedding-2b
文本输入
0.5
﻿
图片输入
0.7
﻿
视频输入
1.5
Kinfra-VL-Embedding-8b
文本输入
0.6
﻿
图片输入
0.9
﻿
视频输入
1.8
说明：
多模态向量模型的文本、图片和视频输入 token 数可通过响应中的 usage.prompt_tokens_details.text_tokens、usage.prompt_tokens_details.image_tokens、usage.prompt_tokens_details.video_tokens 查看。详情请查看 向量模型 文档。
批量任务场景
模型名称
条件
（token）
推理输入
（元/百万 tokens）
推理输出
（元/百万 tokens）
缓存命中
（元/百万 tokens）
GLM-5
输入长度（0, 32k]
2
9
0.5
﻿
输入长度 32k+
3
11
0.75
GLM-5.1
输入长度（0, 32k]
3
12
0.65
﻿
输入长度 32k+
4
14
1
联网搜索
版本
价格 （元/千次）
版本说明
轻量版
7
基础搜索服务
标准版
12
适合对搜索效果要求更高的用户
相关文档
如需了解计费方式及详细计费逻辑，请参见 计费方式。
﻿
﻿

模型名称	条件（token）	推理输入（元/百万 tokens）	推理输出（元/百万 tokens）	缓存命中（元/百万 tokens）
Hy3	-	1	4	0.25
Hy3 preview	输入长度（0, 16k）	1.2	4	0.4
		输入长度 [16k, 32k）	1.6	6.4	0.6
		输入长度 [32k+）	2	8	0.8
Hy-MT2-Pro	-	0.5	2	-
Hy-MT2-Plus	-	0.5	2	-
Hy-MT2-Lite	-	0.3	1.2	-
Hy-Role-Latest	-	2.4	9.6	-
Hy-Role	-	2.4	9.6	-
DeepSeek-V4-Flash 原厂直供	-	1	2	0.02
DeepSeek-V4-Pro 原厂直供	-	3	6	0.025
DeepSeek-V4-Flash	-	1	2	0.2
DeepSeek-V4-Pro	-	12	24	1
Deepseek-v3.2	-	2	3	0.4
Deepseek-v3.1 （2026-05-25 下线）	-	4	12	-
Deepseek-r1-0528 （2026-05-25 下线）	-	4	16	-
Deepseek-v3-0324 （2026-05-25 下线）	-	2	8	-
GLM-5.2	-	8	28	2
GLM-5.1	输入长度（0, 32k]	6	24	1.3
GLM-5.1		输入长度 32k+	8	28	2
GLM-5V-Turbo	输入长度（0, 32k]	5	22	1.2
GLM-5V-Turbo		输入长度 32k+	7	26	1.8
GLM-5-Turbo	输入长度（0, 32k]	5	22	1.2
GLM-5-Turbo		输入长度 32k+	7	26	1.8
GLM-5	输入长度（0, 32k]	4	18	1
GLM-5		输入长度 32k+	6	22	1.5
Kimi K3	-	20	100	2
Kimi K2.7 Code HighSpeed	-	13	54	2.6
Kimi K2.7 Code	-	6.5	27	1.3
Kimi-K2.6	-	6.5	27	1.1
Kimi-K2.5	-	4	21	0.7
MiniMax-M3	输入长度（0, 512k]	2.1	8.4	0.42
MiniMax-M3		输入长度 512k+	4.2	16.8	0.84
MiniMax-M2.7	-	2.1	8.4	0.42
MiniMax-M2.5	-	2.1	8.4	0.21
Qwen3.5-Flash	输入长度（0, 128k]	0.2	2	0.02
		输入长度（128k, 256k]	0.8	8	0.08
		输入长度（256k, 1M]	1.2	12	0.12
Qwen3.5-Plus	输入长度（0, 128k]	0.8	4.8	0.08
		输入长度（128k, 256k]	2	12	0.2
		输入长度（256k, 1M]	4	24	0.4

模型名称	输出单价（元/张）
HY-Image-V3.0	0.2
HY-Image-Lite	0.099

模型名称	积分单价（元/积分）	输出消耗（不同模型积分单价可能不同，实际费用需结合积分单价与对应模型的输出消耗共同计算）
HY-Video-1.5	1.0	按次计算消耗，1.5 积分/次。
YT-Video-2.0	1.0	按次计算消耗。 480p：2 积分/次 720p/1080p：5 积分/次
YT-Video-FX	1.0	按次计算消耗，根据模板消耗积分。消耗详情请参见视频特效模板计费。
YT-Video-HumanActor	1.0	按秒计算消耗 720p：1 积分/秒 1080p：2 积分/秒
Kling-Video-v3	1.0	按秒计算消耗 720P：0.6 积分/秒 720P 有声：0.9 积分/秒 1080P：0.8 积分/秒 1080P 有声：1.2 积分/秒 4K 无声&有声：3 积分/秒
Kling-Video-v2.6	1.0	按秒计算消耗 720P：0.3 积分/秒 1080P：0.5 积分/秒 1080P 有声：1.0 积分/秒 1080P 有声-指定音色：1.2 积分/秒 4K 无声&有声：3 积分/秒
Kling-Video-v2.5-turbo	1.0	按秒计算消耗 720P：0.3 积分/秒 1080P：0.5 积分/秒
Kling-Video-v2.1-master	1.0	按秒计算消耗 2 积分/秒
Kling-Video-v2.1	1.0	按秒计算消耗 720P：0.4 积分/秒 1080P：0.7 积分/秒
Vidu-Video-q3-pro	0.3125	按秒计算消耗 540P：0.9 积分/秒 720P：2 积分/秒 1080P：2.4 积分/秒
Vidu-Video-q3-turbo	0.3125	按秒计算消耗 540P：0.7 积分/秒 720P：1.2 积分/秒 1080P：1.3 积分/秒

模型名称	输出消耗
HY-3D-3.0	按次计算消耗，15～60积分/次
HY-3D-3.1	按次计算消耗，15～60积分/次
HY-3D-Express	按次计算消耗，15～25积分/次

模型名称	推理输入（元/百万 tokens）	推理输出（元/百万 tokens）
YT-VITA	1.2	3.5
HY-Vision-2.0-Instruct	7.5	17.5
HY-Vision-1.5-Thinking	3	9
HY-Vision-Video	3	9

模型名称	计费项	价格（元/百万 tokens）
Kinfra-Text-Embedding-0.6b	文本输入	0.5
Kinfra-Text-Embedding-4b	文本输入	0.6
Kinfra-VL-Embedding-2b	文本输入	0.5
		图片输入	0.7
		视频输入	1.5
Kinfra-VL-Embedding-8b	文本输入	0.6
		图片输入	0.9
		视频输入	1.8

版本	价格（元/千次）	版本说明
轻量版	7	基础搜索服务
标准版	12	适合对搜索效果要求更高的用户

模型价格

本页目录：

在线推理场景

语言模型

视觉模型

图像生成

视频生成

计费示例

3D 生成

多模态理解模型

向量模型

批量任务场景

联网搜索

相关文档