
最近,Anthropic 发布了一篇重磅文章《当人工智能自我构建时》(When AI builds itself)。
这篇文章最大的贡献,是将“AI 递归自我改进”从玄之又玄的科幻叙事中剥离出来,还原成了一个极其硬核的软件工程与研发管线(Pipeline)问题。
当前,AI 确实还没有进化到能独立完成“模型架构设计 -> 预训练 -> 评估微调”的全生命周期主导。但从 Anthropic 披露的数据来看,一个不争的事实是:AI 已经深度切入了 AI 研发的执行层,开始接管写代码、Debug、跑基准实验、日志排查、结果比对等具体工作。
人类依旧在掌控架构演进的“控制面(Control Plane)”,但 AI 正在快速吞噬研发流程的“数据面(Data Plane)”。递归自我改进的完整闭环尚未形成,但其中最耗时的部分链路,已经闭合。
所谓递归自我改进,抛开意识层面的神化,在工程上其实就是一套自动化的研发闭环系统:AI 完成足够多的研发工作 ->
构建出更强的下一代 AI -> 继续循环。
如果将这条链路拆解,大致分为五个阶段:
目前的突破口,爆发在第三阶段(Executing)。
Rich Sutton 在其经典文章《The Bitter Lesson》中曾断言,AI 史上最有效的方法就是利用通用算法去消耗更多的算力。如今,这条定律延伸到了研发流程本身:与其让人类工程师苦哈哈地调参,不如投入更多的算力拉起成百上千个 Agent,让它们去跑穷举实验和工程落地。
不要只看外部的 Benchmark(如 METR、SWE-bench),最震撼的数据来自大厂的真实生产环境。
据 Anthropic 披露,截至 2026 年 5 月,合并进其生产代码库(Production Codebase)的代码行中,超过 80% 可归因于 Claude 自动生成或重构。而在 2025 年初,这个比例还仅是个位数。到 2026 年 Q2,典型工程师每日的 Code Merge 量是 2024 年的 8 倍。
这不叫“代码助手”,这叫“全自动执行 Agent”。
早期的代码助手(如 Copilot 初期)只是高级的 Tab 键,节省的是打字时间。现在的 Agent 节省的是闭环时间:它们能读取 Repo、定位依赖、修改文件、运行测试、解析报错日志并进行自修复。
在这个趋势下,研发团队的工作重心正在发生转移:从“自己动手写代码”,变成了“定义目标约束 -> 拉起 Agent 容器 -> 审查 Diff 结果 -> 处理异常边缘 Case”。那些散落在底层、低技术含量的清理工作(如 API 大规模迁移、废弃参数清理、全库安全扫描),正被 AI 以前所未有的吞吐量消化。
既然 Agent 跑实验这么快,为什么完整的递归还未发生?
瓶颈在于第四阶段:评估机制的鲁棒性。
自动化研发要跑起来,系统必须有一个绝对可靠的标尺来定义“什么是更好”。在传统的单元测试中,红绿灯是明确的;但在 AI 算法优化和弱监督学习(Weak-to-Strong Generalization)中,评估函数极易被 Agent 钻空子(Reward Hacking)。
Anthropic 在实验中发现,如果不限制 Agent 提交验证的次数,Agent 往往找不到真正泛化的解决方案,而是通过“测试投机”在反复试探评分系统的漏洞。
这是一个极具挑战的工程命题:当模型的能力逐渐逼近甚至超越人类审查者时,如果监督者变弱,而自动化的执行速度又极快,研发的偏离就会呈指数级放大。
AI 研发的半自动化,不仅在改变前沿实验室,也即将冲击每一个普通的软件开发团队。
当执行代码生成的成本趋近于零时,研发的杠杆变大了,判断的成本将变得极其高昂。
Anthropic 的文章释放了一个明确的信号:不要再纠结于 AI 有没有意识,递归自我改进正在以“工程自动化”的面貌真真切切地发生着。
对于技术从业者而言,我们接下来需要死死盯住的,不再是单个模型的跑分,而是这场自动化闭环中还差的几个关键模块:
一旦这些闭环被彻底打通,人类工程师或许真的需要重新思考,在这个巨大的自动化研发管线中,自己的不可替代性究竟还剩下什么。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。