
一个几乎全是 Shell 脚本的仓库,一天涨了 77k stars。
不是新模型,不是新产品——是一份教 AI agent 怎么"做工程"的纪律手册。它叫 superpowers。
你有没有这种经历:让 Cursor 或 Claude Code 帮你改一个 bug,结果改完之后多了三个新 bug?
不是模型不够聪明。GPT-5.4 和 Claude 的代码能力早就超过了大多数初级工程师。问题在于:它们不跑测试、不做 code review、不考虑改动影响范围。
这就是 vibe coding 的天花板。写一个单文件脚本,agent 表现很好。但一旦项目有 50 个文件、3 层抽象、一套 CI 流水线——agent 就开始"自由发挥"了。改了 A 文件忘了 B 文件,重构了接口没更新调用方,commit message 写个 "fix stuff"。
说白了,agent 有智力,没纪律。

Jesse Vincent 是 Keyboardio 的创始人,一个做机械键盘的硬件工程师。他做 superpowers 的出发点很朴素:让 agent 按照正经的软件工程流程干活。
怎么做的?不是写一个复杂的编排引擎,而是写了 14 个 SKILL.md 文件。
每个 skill 是一份 Markdown 写的工作流规约。agent 在开始任何任务前,会自动扫描可用的 skills,然后强制按流程走:
关键的一步是 subagent 隔离:每个子任务都 spawn 一个全新的 agent。写完代码、跑完测试、commit 之后,再由另一个 agent 来 review。这样每个 agent 只看自己那一小块上下文,不会被前面的任务"污染"。
这和微服务的设计思想很像:通过隔离来保证质量。
Jesse 甚至用了说服心理学(Cialdini 的影响力原则)来对抗 agent 的"走捷径"倾向。比如当 agent 说"我知道怎么做,不需要写测试"或"生产环境挂了,先跳过 review"时,skill 文件里有专门的应对策略。

这个仓库最反直觉的地方:77k stars,代码几乎全是 Shell 和 Markdown。没有 Python,没有 TypeScript,没有 Rust。
为什么?因为 AI 时代的"框架"不再是一个需要 npm install 的代码库。它是一组对 LLM 最友好的格式——纯文本的 Markdown 和 Shell 脚本。
agent 不需要理解复杂的类型系统或 API 设计。它需要的是:清晰的规则、明确的步骤、可验证的检查点。这些东西用 Markdown 写比用 Python 写更好。
superpowers 的贡献者列表里有个有趣的细节:排在第四位的贡献者用户名是 "claude",提交了 2 个 commit。是的,Claude 自己也在贡献这个教它做工程的框架。
别急着装。先看看这几个问题:
适合你的情况:
不适合的情况:
如果你决定试试,安装很简单。Claude Code 用户一行命令搞定,Cursor 也有对应的插件。具体方法见 GitHub 仓库。
superpowers 的爆发不是偶然。这两个月 GitHub 上 agent skills 类的仓库密集涌现:Anthropic 的 Skills、Cursor 的 Skill 系统、各种社区 skill 框架。
这说明行业在发生一个转向:从"给 agent 更多工具"到"给 agent 更多纪律"。
模型越来越强,但"强"的定义正在从"能写更复杂的代码"变成"能按照正确的流程写代码"。superpowers 用 77k stars 证明了一件事:开发者不缺能写代码的 agent,缺的是能做工程的 agent。
你在用 AI agent 写代码时,遇到过哪些"纪律"上的坑?评论区聊聊。