MCP(Model Context Protocol)Gateway 是面向 Kubernetes 环境的反向代理与管理层,专为 会话感知的路由 与 MCP 实例生命周期管理 设计。它兼具 数据平面(流量转发)和 控制平面(部署、运维、监控)功能,为多实例的模型服务提供统一入口,解决了会话粘性、弹性伸缩、企业安全等关键痛点。

能力 | 说明 |
|---|---|
Session‑Aware Stateful Routing | 同一 session_id 的请求始终落到同一 MCP 实例,确保对话上下文不被打断。 |
Enterprise‑Ready Management | 通过 RESTful API 完成 MCP 的部署、更新、查询、日志、状态检查及删除等全生命周期管理。 |
Kubernetes‑Native | 基于 StatefulSet 与 headless Service 实现弹性伸缩、服务发现和高可用。 |
生产特性 | 支持 Bearer Token + RBAC/ACL 鉴权、遥测、可观测性(日志、指标、追踪)。 |
三、概念模型
/adapters 路径下注册的逻辑资源,代表各 MCP 实例,可与其他资源(如 /agents)共存。 方法 | 路径 | 功能 |
|---|---|---|
POST | /adapters | 部署并注册新 MCP |
GET | /adapters | 列出所有 MCP |
GET | /adapters/{name} | 获取适配器元数据 |
GET | /adapters/{name}/status | 查询部署状态 |
GET | /adapters/{name}/logs | 查看运行日志 |
PUT | /adapters/{name} | 更新配置 |
DELETE | /adapters/{name} | 删除实例 |
GET /adapters/{name}/sse – Server‑Sent Events POST /adapters/{name}/messages – 基于会话的消息投递 POST /adapters/{name}/mcp – 流式 HTTP 接口这些接口均通过 Session‑Aware Routing 自动将请求路由到对应的 MCP 实例。
mcp-gateway/
├─ dotnet/ # 主网关服务 (.NET 8)
│ ├─ Microsoft.McpGateway.Service/
│ └─ Microsoft.McpGateway.Management/
├─ mcp-example-server/ # 示例 MCP 服务器
├─ deployment/
│ ├─ infra/azure-deployment.bicep
│ └─ k8s/ # K8s manifests
├─ openapi/ # OpenAPI 3.0 规范
└─ workflows/ # CI/CDMCP Gateway 为构建 可扩展、会话感知、企业级安全 的模型服务平台提供了完整的技术方案。通过 .NET 8 与 Kubernetes 的深度结合,它实现了从 本地开发 到 云端生产 的全链路支持,帮助开发者专注于模型本身,而将路由、管理、监控等基础设施交给 Gateway 统一处理。