
2025年,各家模型厂商突然开始在AICoding领域发力,以Anthropic为最,他们开始强调自己的模型在编程领域的评分,似乎这是他们在尝试一条先俘获小众人群(程序员)芳心,来抵抗openAI的普适性模型能力的路线,好似一个在竞争中不得已的策略调整,随后,他们发布了强调编程能力更强的sonnet 3.5模型,紧接着MCP、Claude Code等与编程工具紧密关联的动作出现,十月份Skills功能上线,Claude 4.5模型上线,确定了Anthropic在AICoding领域的一家独大地位。同时,AICoding已经超出了编程本身,成为可扩展至任意工作领域的AI工作范式,随着时机成熟,他们在桌面端Claude软件中上线Cowork,形成了一套以大模型为基础,工作范式创新为内核的AI生产力生态模式。
在这个过程期间,其他模型厂商也突然意识到AICoding的重要性,不断开始跟进,国内的智普对GLM模型在编程领域进行了强化,他们放弃了早期训练的一个独立编程模型codegeex,然后在GLM上强化编程能力的训练,是国内最早洞察Anthropic野心,并迅速跟进的模型厂商,并顺势推出coding plan(编程套餐)。而国内的其他模型团队,例如千问、豆包,也照葫芦画瓢推出code模型,推出编程套餐。MiniMax和Kimi也在2025年的年底相继推出编程套餐。
国外,Gemini最早跟进AICoding领域,虽然他们最早提出了Gemini CLI这样的编程工具方案,但是直到他们推出了Gemini 3 Pro,才真正意义上冲上了AICoding的牌桌,这在当时引来了巨大的震撼。xAI推出grok-fast,针对编程场景,通过自己的算力优势获得很多开发者的青睐。openAI则后来居上,推出codex编程工具,配合gpt-5.2-codex来实现对AICoding领域的狙击。
同时,在原本的编程市场,Idea这类传统厂商也好,微软的vscode也罢,新贵cursor们齐上阵,掀起了AI编程界面化工具的浪潮,一批又一批编程工具涌现。
我们不禁有一个巨大的疑问,如果把时间倒回到2025年的5月,我们会问出这个所有人都存在的疑问:为什么要大力去搞AI编程?
我当时也非常疑惑,我知道程序员是一批高净值人群,针对他们,可以获得绝对的高价值利润和持续的复购。可问题是,程序员行业本身也在受到冲击,而这些模型厂商或者AI基建行业本身,为什么在这个时候死死盯住AI编程的领域呢?
根据当时的一些讨论,当时有几种观点:
1)编程领域的训练数据非常有利,开源代码、编程逻辑本身的确定性、持续的迭代等等,这些特征有利于训练出目标明确,行为精准的模型;2)AI落地会是一个长期的过程,总有一些场景需要先吃螃蟹,而编程这个场景距离技术公司最近,近水楼台,拿自己做实验,在自己最熟悉的领域去验证AI的能力;3)当时大模型训练已经遇到数据瓶颈,AI模型厂商为了维持估值,必须找到在单领域具有支配性竞争力的可能性。
然而随着时间的推移,在摸着石头过河的过程中,AI行业逐渐拨开迷雾,看到了一个越来越清晰的景象:
编程Agent不仅适用于编程场景,也同时适用于非编程场景,Claude Code所探索出来的路径,是成为AI改变生产力的正确路径,人们正在尝试一种普世的AI工作范式。
有很多迹象表明这一点:
这些迹象说明一件事:
大力搞AICoding并非是瓶颈下的无奈选择,而是误打误撞开了天门,是人类走向AI工作范式的第一步。
可以预言,至少在未来的3年内,AI领域的所有发展,都会基于AICoding领域的探索成果来进行发展。AI应用落地本身范式基本已经锁定,而且会向整个社会的各个方面渗透开。
同时,我还观察到3个非常重要的趋势:
所谓Harness,简单讲就是Agent,只不过不包含Agent的大脑(LLM)。Harness 是一个集成的软件层,它包裹在 AI 模型之外,负责管理代理的生命周期、工具交互、状态维护和安全限制。在工程学上,Harness 的存在解决了大模型“不确定性”的问题。一个裸模型(Raw Model)只能聊天,而带上 Harness 的模型才能成为代理(Agent)。它充当了模型与现实开发环境(如文件系统、终端、API)之间的“翻译层”和“约束层”。过去,我们接触了非常多的Harness,Manus、Claude Code,它们本身不局限于使用什么模型,是趴在AI模型上的一层壳,然而,它们的价值,现在越来越重要。
一个现代(2026年标准)的 Harness 通常包含以下四个维度:
在 2026 年,单纯追求模型参数的竞争已趋于平缓。企业和开发者的核心竞争力在于如何构建和优化自己的 Harness。一个优秀的 Harness 能让模型:
简而言之,Harness 决定了 AI 代理从“玩具”进化为“生产力工具”的质量上限。
在新的一年,企业和个人都应该去构建自己的Harness,而且,很可能不止一个。当然,存在通用的Harness,就像Claude Code一样,如果没有特殊的工作场景,通过自己编排和调教,让Claude Code成为自己的得力助手也行,然而,由于模型厂商之间的封闭性,这些会变的越来越难受。而基于已有的Harness,构建符合自己需要的Harness,以让自己快速解决特定领域的问题,会成为你在2026年是否更进一步的关键。比如,你在白天工作中,你是一位财务人员,你可能需要一套基于你工作场景的Harness,而到了晚上,你又是一位视频博主,你可能需要一套符合你自己口味的视频创作Harness。
OpenClaw的出现,催生了一种新的模式。Vibe coding这个概念的发明人Andrej Karpathy,现在要再次发明“Claws”这个概念,他提出“Claws are now a new layer on top of LLM agents, taking the orchestration, scheduling, context, tool calls and a kind of persistence to a next level.”(Claws现已成为LLM代理之上的新层,它将编排、调度、上下文、工具调用以及某种持久性提升到了一个新的层次。)简单讲,就像Agents之于LLM一样,Claws之于Agents是一层更高层级的Harness。
当前的AI生态过于封闭,以Anthropic最为典型,他们禁止在其他产品中使用他们的模型来进行开发,而只能对接他们自己的工具。这种封闭带来的结果,就是在用户端的体验割裂,用户无法在一套工具中完整处理工作,而不得不进行工具切换,以根据模型特征,处理不同工作。
正是因为这个情况的存在,Claw模式将成为2026年的核心话题之一。
Claws是AI生态的下一代技术,它们也是一套Harness,但是它们不完全直接与LLM交互,而是通过综合的操作本地已经安装好的其他Harness类工具来实现更通用的智能体。
Claw模式的好处是,突破各个模型厂商及其发布的工具之间的屏障,在更高的维度,根据用户的需求,智能的去调用不同的工具(或Agents)来使用,而不再局限于单一的AI编程工具内部。
这里,我们必须提到“Harness的性格”这个话题,不同的大模型和工具,呈现了不同的特质,而这些特质决定了它们在处理某些问题时有优势,在另外一些问题上有劣势。例如,claude code和codex对比起来,claude code反应快,更活泼,更激进,更快,但是正是因为这种活泼,导致精准度不够;而codex对比起来,则体现出更沉稳,更简单,更准确的特质,但是缺点就是慢。这种“性格”,会自然而然的让我们有一个想法:根据不同任务选择不同工具。然而,这里又由于切换工具时,上下文不一致,导致任务不连贯。而Claws就要解决这类问题。相信2026年,将会有更多的Claw类工具出现。
以前,普通用户使用豆包、deepseek这类聊天类AI应用来辅助自己工作,tokens几乎是免费的(对于消费者而言)。然而,随着AI使用方式的转变,使用Harness类工具来进行工作时,有非常多的tokens用来进行理解、思考、识别、工具调用等等,这些tokens不直接产生结果,却至关重要。这导致面对同一个问题,在获得相同结果的情况下,消费者必须为tokens支付非常多的费用。
而如果基于Harness类工具进行工作成为AI工作的统治级范式,那么tokens消费将变成不得不的事实。即,如果你在工作时,不花钱购买tokens,那么你可能无法完成自己的工作(或者说无法在预期的时间里完成,毕竟你还可以用传统的方式工作)。
这也就意味着,tokens成为除了水电气网之外的第5元素。
这是一套清晰的能源利用与生产力体系
发电 -> 算力中心 -> 芯片、数据传输 -> 大模型 -> Harness应用
如果人类进入AI时代,那么提供Tokens,就像提供水电气网一样,会成为人类最底层的需求。我想,正是因为这种趋势,马斯克才会如此着急的开始着手部署太空算力中心。
一旦这种新的生产力体系建立,那么很可能会出现新的生产关系。在网络普及之前,人们主要通过纸质文件来进行记录和存档,随着网络成为新的生产力体系基石之后,传统的纸质文件记录工作方式消失了,医院挂号、图书馆借书、学校开学报名等等,人们已经无法退回到原来的工作方式(,即使在某些场景下,纸质记录更方便)。生产关系,具有排他性,同一时间,不可能让两套系统同时运行,否则会导致混乱。一旦由新生产力决定的生产关系系统建成,具有不可逆性,并且不具备兼容性。这意味着,新的生产关系,将迫使人们进入新的工作方式,以实现人类社会的迭代。一旦人们进入AI时代,基于AI生产力的生产关系形成,那么就不可能再退回到没有AI的生产模式,因为整个社会系统已经对旧的生产模式不兼容了。
此外,就像网络有“宽带”单位一样,tokens的提供也不尽相同。根据自身的需要,用不同的tokens来解决,这可能需要有很长的时间来建设,未来2年,仍然会存在大量贩卖(甚至是走私)tokens的公司(或个体)。在法律还没有跟上的时候,这可能是一个好生意,但是,也存在合规性风险。
作为普通消费者,我们要做好像付电费一样,准备一笔tokens费。虽然在2026年的今天,如果有足够的资金和途径用上顶级模型,可以让你占据一定的优势,有钱的程序员能够效率更高,没钱的程序员可能还得排队来等待模型响应,但是,当所有tokens进入付费时代时,这种优势会消失,我们还会站在同一起跑线,真正的竞争力,永远不在tokens本身,(就像互联网产品的竞争,不存在于电的使用一样,)而在于我们大脑中的洞察力、创造力、专注力。
最后,我想再从普通人的机会出发,聊一聊普通人在这个时代的机遇。
虽然,vibe coding兴起后,开发一款App已经很容易,但是真正能够令人眼前一亮的作品并不多,因此,任何人都是有机会的。我们应该避免陷入两种极端:要么觉得AI可以做一切了,自己完蛋了;要么觉得自己有了AI加持,自己可以无所不能了。实际上,真正能够利用好AI完成自我成长的人,在不是AI的时候,他们也能成功。关键的点在于,通过学习好的方法,挖掘有价值的用户需求,并帮助他们解决,同时,自己又热爱。
让我们敬畏又积极地拥抱吧!