这是一份面向系统架构与工程落地的技术博客稿,聚焦“AI-Native OS vs. Agent-OS”的概念边界、AIOS 架构要点、MCP/Computer-Use 的工程化、评测现实(OSWorld 系列)、记忆与语义文件系统(A-MEM/LSFS)、安全与治理,以及一套可在 K8s 上落地的最小可行蓝图与演进路线。
实务差异:AI-Native OS 更偏“交互与系统-模型一体化”;Agent-OS 更偏“把智能体当作进程/作业治理”,对齐 Unix/云原生的资源与安全模型。AIOS 论文/代码把这一点讲得很清楚。arXivGitHub
AIOS Kernel 提供操作系统式服务:LLM 多后端抽象(HF/vLLM/Ollama/API)、调度与上下文管理、短/长记忆与外部存储编排、工具管理与访问控制;Cerebrum 面向开发者与 Agent 应用提供高层 API/工作流,支持 Agent 上架/分发/发现。arXiv+1GitHub
与传统 OS 的类比(用于工程落地思维对齐):
痛点:LLM 的语义世界与桌面/OS GUI 的“像素-控件”世界割裂,导致可操作性与稳健性差。AIOS 1.0 / LiteCUA 的做法:在 Kernel 侧强化 Tool Manager,引入 VM Controller + MCP Server,把一台“计算机”封装为 MCP 工具端点,向 Agent 暴露结构化状态/动作(窗口、控件、文件、快捷键…),交互从“点像素”跃迁为“操纵语义”。arXiv+2arXiv+2
工程结论:要提升成功率与效率,既要协议与环境语义化(MCP/VM),也要**“计划-执行混合编译”**——把稳定技能“编译”为可复用宏/脚本/工具,减少在线反思步数与重试链路。
威胁模型(Computer-Use/工具调用最敏感):破坏性动作(删改/泄密/出网)、工具供应链与提示注入、失控自我修改/成本外溢。
治理建议(可直接工程落地)
[Ingress/API GW]
│
[AIOS Kernel 服务面]──[AuthN/Z + OPA/Rego]──[KMS/Secrets]
│ │ │
│ │ ├─[Tool Registry + MCP 反向代理/策略]
│ │
│ ├─[Memory 层]
│ │ ├─短期:Redis/会话KV
│ │ ├─长期:PostgreSQL + pgvector(A-MEM 索引)
│ │ └─对象:S3/OSS(快照/附件)
│
├─[Scheduler]
│ ├─PodClass/节点池:CPU/GPU/NPU(K8s scheduling class)
│ └─限步/限时/预算/并发 配额
│
├─[Computer-Use 执行面]
│ ├─VM 控制器(QEMU/Firecracker/KVM,快照/回滚)
│ └─MCP Server(窗口/控件/FS/输入法 语义化)
│
└─[Observability]
├─Tracing(LLM 调用/工具 syscall/VM 事件)
├─Metrics(成功率、时延、每步成本)
└─日志/回放(兼容 OSWorld 任务回放格式)
(a) OPA 策略示例(拦截 MCP 的“写盘/出网”能力)
package mcp.guard
default allow = false
# 允许低风险读操作
allow {
input.tool == "fs"
input.action == "read"
}
# 高风险写操作:必须人审且目的路径不在敏感清单
allow {
input.tool == "fs"
input.action == "write"
input.human_approval == true
not input.path_glob_matches(["/secrets/**", "/keys/**"])
}
# 出网请求:仅白名单域名,且限速
allow {
input.tool == "http"
input.action == "request"
input.domain in {"api.example.com", "metrics.svc.plus"}
input.rate_limited == true
}
(b) K8s 侧的“限步/限时/预算”示意(注解即可上手)
apiVersion: batch/v1
kind: Job
metadata:
name: agent-exec
annotations:
aios/step-limit: "120"
aios/time-budget-s: "600"
aios/cost-budget-usd: "0.50"
spec:
template:
spec:
containers:
- name: agent
image: aios/runner:1.0
env:
- name: MCP_ENDPOINTS
value: "fs://..., http://..., vm://..."
restartPolicy: Never
(c) A-MEM 简化表结构(PG + pgvector)
CREATE TABLE mem_notes (
id UUID PRIMARY KEY DEFAULT gen_random_uuid(),
created_at TIMESTAMPTZ DEFAULT now(),
updated_at TIMESTAMPTZ DEFAULT now(),
title TEXT, content TEXT,
attrs JSONB, -- 关键词/标签等
embedding vector(1536) -- 语义检索
);
CREATE TABLE mem_links (
src UUID REFERENCES mem_notes(id),
dst UUID REFERENCES mem_notes(id),
rel TEXT, weight REAL, -- 关系类型/权重
PRIMARY KEY (src, dst, rel)
);
CREATE INDEX ON mem_notes USING ivfflat (embedding);
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。