文档中心>高性能应用服务 HAI>快速入门>通过 HAI 推理集群快速部署模型服务

通过 HAI 推理集群快速部署模型服务

最近更新时间:2025-11-03 16:31:21

我的收藏

步骤1:注册和充值

1. 注册腾讯云账号,并进行实名认证。
如果您已在腾讯云注册,可忽略此步骤。
2. 在线充值
HAI 推理集群资源以按量计费模式售卖,购买前,需要在账号中进行充值。具体操作请参见 在线充值 文档。
3. 如您是传统账户,需先进行升级。判断账户类型或了解升级方法,可参见 账户类型说明

步骤2:创建 HAI 推理集群


2. 单击新增服务,进入 HAI 推理集群购买页面

服务名称:自定义服务名称,若不填则默认使用服务的实例 ID 替代。
模型:选择您想要部署的模型。单击应用后可预览应用环境配置详情及应用介绍信息。
地域:建议选择靠近目标客户的地域,降低网络延迟、提高您的客户的访问速度。
算力套餐:您可根据自己所需的配置进行选择。算力套餐对应的显存、算力、CPU、内存信息在算力方案卡片进行展示。
副本数:默认单副本。
3. 单击部署服务,并根据页面提示完成支付。
当您付费完成后,即完成了该模型的部署服务。接下来,您可以通过创建资源后生成的调用地址以及您的 token,调用您的模型服务。详情请参见 获取推理集群服务调用信息

步骤3:销毁 HAI 推理集群(可选)

销毁推理集群是一项高风险但必要的管理操作,通常用于释放资源、控制成本或完成项目收尾。在使用结束后,在控制台推理集群管理页中,单击销毁,即可销毁 HAI 推理集群,停止计费,结束使用。