获取推理集群服务调用信息

最近更新时间:2025-11-03 16:31:21

我的收藏

操作场景

本文详细介绍如何在 HAI 高性能应用服务中调用已部署的推理集群服务,涵盖服务访问方式、API 请求格式、请求示例及常见问题,帮助开发者快速集成模型推理能力到自有应用中。

操作步骤

1. 登录 HAI 推理集群控制台,进入推理集群管理页面。

2. 在推理集群管理页面,单击目标集群名称或操作列的详情,即可查看该集群的详细信息。进入详情页面后,会展示出创建资源后生成的 token 及模型调用地址(即外网访问地址),复制 token 及调用地址即可操作调用,推理集群兼容 OpenAI API 协议,只需更换调用信息中的 URL 和 token,即可无缝对接现有应用,支持用户快速迁移和高效集成。