首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI 写代码越来越快,为什么你的项目反而越来越乱?

AI 写代码越来越快,为什么你的项目反而越来越乱?

作者头像
随机比特
发布2026-03-30 16:25:57
发布2026-03-30 16:25:57
1430
举报

一个几乎全是 Shell 脚本的仓库,一天涨了 77k stars。

不是新模型,不是新产品——是一份教 AI agent 怎么"做工程"的纪律手册。它叫 superpowers。

agent 能写代码,但不会做工程

你有没有这种经历:让 Cursor 或 Claude Code 帮你改一个 bug,结果改完之后多了三个新 bug?

不是模型不够聪明。GPT-5.4 和 Claude 的代码能力早就超过了大多数初级工程师。问题在于:它们不跑测试、不做 code review、不考虑改动影响范围

这就是 vibe coding 的天花板。写一个单文件脚本,agent 表现很好。但一旦项目有 50 个文件、3 层抽象、一套 CI 流水线——agent 就开始"自由发挥"了。改了 A 文件忘了 B 文件,重构了接口没更新调用方,commit message 写个 "fix stuff"。

说白了,agent 有智力,没纪律。

vibe-coding-gap
vibe-coding-gap

superpowers 做了一件反直觉的事

Jesse Vincent 是 Keyboardio 的创始人,一个做机械键盘的硬件工程师。他做 superpowers 的出发点很朴素:让 agent 按照正经的软件工程流程干活

怎么做的?不是写一个复杂的编排引擎,而是写了 14 个 SKILL.md 文件。

每个 skill 是一份 Markdown 写的工作流规约。agent 在开始任何任务前,会自动扫描可用的 skills,然后强制按流程走:

  1. Brainstorm — 用苏格拉底式提问厘清需求,不允许直接动手
  2. Plan — 拆成 2-5 分钟的小任务,每个任务写明精确的文件路径和验证步骤
  3. Implement — 严格 TDD:先写测试、再写代码、最后重构
  4. Review — 两轮 review:一轮检查是否符合 spec,一轮检查代码质量
  5. Finish — merge、PR 或丢弃,清理 worktree

关键的一步是 subagent 隔离:每个子任务都 spawn 一个全新的 agent。写完代码、跑完测试、commit 之后,再由另一个 agent 来 review。这样每个 agent 只看自己那一小块上下文,不会被前面的任务"污染"。

这和微服务的设计思想很像:通过隔离来保证质量

Jesse 甚至用了说服心理学(Cialdini 的影响力原则)来对抗 agent 的"走捷径"倾向。比如当 agent 说"我知道怎么做,不需要写测试"或"生产环境挂了,先跳过 review"时,skill 文件里有专门的应对策略。

superpowers-workflow
superpowers-workflow

为什么全是 Shell 脚本?

这个仓库最反直觉的地方:77k stars,代码几乎全是 Shell 和 Markdown。没有 Python,没有 TypeScript,没有 Rust。

为什么?因为 AI 时代的"框架"不再是一个需要 npm install 的代码库。它是一组对 LLM 最友好的格式——纯文本的 Markdown 和 Shell 脚本。

agent 不需要理解复杂的类型系统或 API 设计。它需要的是:清晰的规则、明确的步骤、可验证的检查点。这些东西用 Markdown 写比用 Python 写更好。

superpowers 的贡献者列表里有个有趣的细节:排在第四位的贡献者用户名是 "claude",提交了 2 个 commit。是的,Claude 自己也在贡献这个教它做工程的框架。

你该不该用?

别急着装。先看看这几个问题:

适合你的情况:

  • 项目超过 20 个文件,有模块分层
  • 团队协作,需要 agent 输出可审计
  • 已经被 agent 的"自由发挥"坑过不止一次

不适合的情况:

  • 快速原型、一次性脚本
  • 不需要测试的探索性代码
  • 项目太小,引入流程反而拖慢速度

如果你决定试试,安装很简单。Claude Code 用户一行命令搞定,Cursor 也有对应的插件。具体方法见 GitHub 仓库。

一个有意思的趋势

superpowers 的爆发不是偶然。这两个月 GitHub 上 agent skills 类的仓库密集涌现:Anthropic 的 Skills、Cursor 的 Skill 系统、各种社区 skill 框架。

这说明行业在发生一个转向:从"给 agent 更多工具"到"给 agent 更多纪律"

模型越来越强,但"强"的定义正在从"能写更复杂的代码"变成"能按照正确的流程写代码"。superpowers 用 77k stars 证明了一件事:开发者不缺能写代码的 agent,缺的是能做工程的 agent。

你在用 AI agent 写代码时,遇到过哪些"纪律"上的坑?评论区聊聊。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-03-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 随机比特 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • agent 能写代码,但不会做工程
  • superpowers 做了一件反直觉的事
  • 为什么全是 Shell 脚本?
  • 你该不该用?
  • 一个有意思的趋势
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档