计费方式
腾讯混元大模型提供 API 接入方式,采用后付费日结的计费模式。
开通方式
免费额度
首次开通腾讯混元大模型服务后,混元生文将发放一定量级的免费调用额度,供您测试体验。免费调用额度将以一次性的免费资源包的形式配送,并在计费结算时优先扣减。
产品名 | 免费额度 |
hunyuan-turboS | 共计100万 tokens,共享消耗。资源包有效期为1年,自开通服务之日起1年内若免费资源包次数未使用完,则过期作废。 |
hunyuan-turbo | |
hunyuan-large | |
hunyuan-large-longcontext | |
hunyuan-standard | |
hunyuan-standard-256K | |
hunyuan-translation | |
hunyuan-translation-lite | |
hunyuan-role | |
hunyuan-functioncall | |
hunyuan-code | |
hunyuan-turbo-vision | |
hunyuan-vision | |
hunyuan-embedding | 100万 tokens。资源包有效期为1年,自开通服务之日起1年内若免费资源包次数未使用完,则过期作废。 |
hunyuan-lite | 免费使用 |
注意:
在账单结算时,系统将按照预免费资源包 > 付费资源包 > 按量后付费的顺序进行结算,即免费资源包是优先扣除的。
若您欠费或因违禁原因停服后,将不能继续享受免费额度,只有服务重新开启后才可继续享受免费额度。
hunyuan-turboS、hunyuan-turbo、hunyuan-large、hunyuan-large-longcontext、hunyuan-standard、hunyuan-standard-256K、hunyuan-translation、hunyuan-translation-lite、hunyuan-role、hunyuan-functioncall、hunyuan-code、hunyuan-turbo-vision、hunyuan-vision 等13个模型共用100万 token 免费调用额度。
混元生文价格说明
token 后付费
在免费额度用完后,按如下价格进行后付费计费,每月1 - 3日系统会推送上个月账单并自动完成结算和扣费。


产品名 | 单位 | 刊例价 |
hunyuan-TurboS | 每 百万 token | 输入:0.8元 输出:2元 |
hunyuan-turbo | 每 百万 token | 输入:2.4元 输出:9.6元 |
hunyuan-large | 每 百万 token | 输入:4元 输出:12元 |
hunyuan-large-longcontext | 每 百万 token | 输入:6元 输出:18元 |
hunyuan-standard | 每 百万 token | 输入:0.8元 输出:2元 |
hunyuan-standard-256K | 每 百万 token | 输入:0.5元 输出:2元 |
hunyuan-translation | 每 百万 token | 输入:15元 输出:45元 |
hunyuan-translation-lite | 每 百万 token | 输入:1元 输出:3元 |
hunyuan-role | 每 百万 token | 输入:4元 输出:8元 |
hunyuan-functioncall | 每 百万 token | 输入:4元 输出:8元 |
hunyuan-code | 每 百万 token | 输入:3.5元 输出:7元 |
hunyuan-turbo-vision | 每 百万 token | 输入:80元 输出:80元 |
hunyuan-vision | 每 百万 token | 输入:18元 输出:18元 |
hunyuan-embedding | 每 百万 token | 输入:0.7元 输出:0.7元 |
腾讯元器 | 每 百万 token | 输入:100元 输出:100元 |
预付费
预付费资源包规格与定价
产品名 | 刊例价 |
混元大模型-预付费包-1万点 | 100元 |
混元大模型-预付费包-10万点 | 950元 |
混元大模型-预付费包-100万点 | 9000元 |
混元大模型-预付费包-1000万点 | 85000元 |
混元大模型-预付费包-1亿点 | 800000元 |
抵扣系数
根据抵扣系数抵扣各种资源用量。抵扣系数和点数的换算关系为:
资源包点数用量 = 资源用量 × 抵扣系数
各个资源类型的抵扣系数如下:
模型名称 | 计费项 | 抵扣系数(点/千token) |
hunyuan-turboS | 输入 | 0.08 |
| 输出 | 0.2 |
hunyuan-turbo | 输入 | 0.24 |
| 输出 | 0.96 |
hunyuan-large | 输入 | 0.4 |
| 输出 | 1.2 |
hunyuan-large-longcontext | 输入 | 0.6 |
| 输出 | 1.8 |
hunyuan-standard | 输入 | 0.08 |
| 输出 | 0.2 |
hunyuan-standard-256k | 输入 | 0.05 |
| 输出 | 0.2 |
hunyuan-role | 输入 | 0.4 |
| 输出 | 0.8 |
hunyuan-functioncall | 输入 | 0.4 |
| 输出 | 0.8 |
hunyuan-code | 输入 | 0.35 |
| 输出 | 0.7 |
hunyuan-translation-lite | 输入 | 0.1 |
| 输出 | 0.3 |
hunyuan-translation | 输入 | 1.5 |
| 输出 | 4.5 |
hunyuan-turbo-vision | 输入 | 8 |
| 输出 | 8 |
hunyuan-vision | 输入 | 1.8 |
| 输出 | 1.8 |
说明:
token 为服务输入+服务输出的总额,1token 约等于1.8个中文汉字或3个英文字母;您可以前往 控制台 使用 token 计算器了解一段文本对应的 token 总数;
多模态模型 hunyuan-vision 传入图片时,根据图片大小,每张图消耗256-1280 token 不等,以模型实际计算的 token 为准。
计算公式:图片消耗 token = 256 + n * 64,n为图片包含448*448像素的个数(向上取整)。
进行 API 调试,以及使用 API 3.0 Explorer 在线工具都会消耗对应的 token。
开通腾讯云混元大模型产品,通过云 API 调用元器智能体时,腾讯云账号享有1亿免费额度。
并发增购
接口名称 | 费用 |
hunyuan | 800元/并发/月 |
说明:
并发:是指能同时处理的会话数量。例如接口默认提供 m 个并发数,代表最多能同时处理 m 个已提交的会话,需要等待 m 个会话中的任一个会话处理完毕后才能开始处理下一个会话。
通过购买并发可以在接口默认并发的基础上继续提升并发,例如接口默认提供 m 个并发,购买 n 个并发后,主子账号一共可享受 m + n 个并发。
计费与结算方式
混元生文结算顺序为:赠送的免费资源包 > 付费资源包 > 后付费。
费用计算示例
后付费
用户当月首次使用,累计调用混元生文接口 hunyuan-turbo 模型共105万 token,则在使用达到100万 token 时消耗完免费资源包,剩余5万 token 需通过后付费进行结算,区分输入输出。假设用户使用了1万 token 输入,4万 token 输出,所需支付的费用计算如下:
10000tokens / 1000tokens × 0.015元/千tokens + 40000tokens / 1000token × 0.05元/千tokens = 2.15(元)
并发增购
用户当月有大流量,需要10并发,同时已经消耗完免费资源包,均使用后付费进行结算。当月累积调用混元生文接口 hunyuan-turbo 模型,输入2000万 token ,输出6000万 token ,所需支付的费用计算如下:
预付费:提前增购并发 ( 10 - 5 )并发× 800元/并发 = 4000(元) ,注:混元生文 hunyuan 接口默认限制为5个并发
后付费:消耗 token 费用 2000万tokens / 1000tokens × 0.015元/千tokens + 6000万tokens / 1000tokens × 0.05元/千tokens = 3300(元)
当月合计消费 4000 + 3300 = 7300(元)