Shadow:真正的个人助理不应该只是一个“问答机”,而是一个能够操作环境、组合工具、自我进化的数字孪生。正如 Clawdbot的作者所说,代码本身已经不值钱了,真正有价值的是让 AI Agent 找回“创造的魔力”,并通社区协作,推动一个属于每个人的自由、自主的助理时代。

在技术圈,每一次范式转移 ,往往最先由那些“不安分”的灵魂所感知到。
作为一名曾经的景观设计师,我习惯于思考物理空间的营造——如何在混沌的自然中引入秩序,如何规划水流与人群的动线;后来转型程序员、支付宝架构师,再到如今的创业者,我发现构建数字世界的系统与构建物理世界的公园,本质从未改变:
我们都在试图建立一种“结构”,让生命(无论是生物还是数据)在其中自由且有目的地流动。
最近,Peter Steinberger 的回归与他开源的 Maltbot(原名 Clawdbot),让我看到了这种“结构”在 AI 时代的全新形态。这不仅仅是一个 GitHub 上星数飙升的项目,它是一份关于“如何构建本地化、自主化个人 AI 助理”的架构蓝图。
透过 Maltbot 的技术内核,我看到的不仅是代码,而是个人计算主权的回归,以及真数字孪生雏形的显现。

可以形象地把这个架构比作“龙虾”。
在架构图中,Maltbot 展示了一个“硬壳软核”的哲学:
这解决了当前架构的固有思维:目前的 Agent 往往裸奔在浏览器里,脆弱且不可控。而 Maltbot 引入了 网关模式。
它像是一个数字世界的核心,将来自 WhatsApp、Telegram、Discord 的异构消息,统一“归一化”为标准的 JSON 事件流。Maltbot 引入了“网关模式”,将 WhatsApp、Telegram 等异构消息统一归一化为标准的 JSON 事件流。这使得 Agent 能够脱离复杂的 API 文档,进入纯粹的逻辑处理层。

这种“解耦”,像极了景观设计中的“雨水花园”系统:先过滤沉积,再让纯净的水源流入生态核心。
Peter 在访谈中提到的“马拉喀什时刻”:他在旅途中发语音给 AI,AI 自主通过 FFmpeg 转码,并通过 OpenAI API 识别内容。随后,他在马拉喀什开玩笑担心 MacBook Pro 被盗,AI 自动通过 Tailscale 远程连接到他位于伦敦的电脑并进行了自我迁移。
这种架构被称为 “分布式具身”,彻底打破了 Chatbot 的固有模式。

在 Maltbot 的设计中,网关(大脑)通过 WebSocket 长连接,控制着分布在各处的节点(Nodes):
这就是“真数字孪生”的基础设施。 你的 AI 助理不再漂浮在 OpenAI 的服务器上,而是栖息在你的设备集群中。它能听懂你的语音,然后指挥你书房里的电脑截屏,或者让你云端的服务器部署代码。
大公司的 SaaS 模式是“数据孤岛”,你的记忆被锁在云端,只能租赁,无法拥有。
Maltbot 提出了一个极具 Unix 哲学的观点:Files over Databases(文件优于数据库)。
在 ~/.clawdbot/ 目录下,记忆被透明地存储为 Markdown 文件:
memory/2024-01-29.md(每日流水账);MEMORY.md(核心事实与偏好)。这种设计极其优雅。它意味着“可解释性”与“可掌控权”。你可以随时打开文件,修正 AI 对你的认知。这种“透明化的记忆机制”,加上本地密钥管理 ,构成了“数据主权”的基石。
“构建信任的前提,是用户物理上拥有智能体的‘大脑’和‘记忆’。”

如果 Agent 只能在你说话时才回复,那它只是一个工具,而非生命。
Maltbot 引入了 System Pulse(系统脉冲) 机制:

“智能体不应是唤醒式的工具,而应是与你共时演化的数字生命。” 这句话让我深受触动。它让 Agent 从“被动响应”进化为“主动代理”。
但主动性意味着风险。作为前支付架构师,我非常关注安全。Maltbot 设计了“四层防御体系”:
这种“沙箱+断点审批”的机制,确保了 AI 是你的得力助手,而不是失控的破坏者。

从景观设计到代码架构,我一直在寻找一种工具,能填平“想象”与“实现”之间的鸿沟。
Clawdbot/Maltbot 并不是一个单纯的开源项目,它是一场“个人 AI 操作系统”的预演。
什么是 AI 时代的黑客精神?不是破坏,而是夺回。
夺回对数据的控制权,夺回对计算资源的调度权,夺回定义“我是谁”的权利。
未来的个人 AI 助理,不应是巨头 App 里的一个功能,而应是:

正如 Mixlab 一直倡导的无边界探索,当工具脱离了围墙花园,人人皆可构建如 Maltbot 般的数字分身。这不仅是技术的进步,更是人类在 AI 时代保持独立性与创造力的唯一路径。
别只做使用者,去构建属于你的智能
