AI时代的“水电气”，Tokens正在成为人类社会的新基建

www.tangshuang.net

发布于 2026-03-03 16:57:31

5460

2025年，各家模型厂商突然开始在AICoding领域发力，以Anthropic为最，他们开始强调自己的模型在编程领域的评分，似乎这是他们在尝试一条先俘获小众人群（程序员）芳心，来抵抗openAI的普适性模型能力的路线，好似一个在竞争中不得已的策略调整，随后，他们发布了强调编程能力更强的sonnet 3.5模型，紧接着MCP、Claude Code等与编程工具紧密关联的动作出现，十月份Skills功能上线，Claude 4.5模型上线，确定了Anthropic在AICoding领域的一家独大地位。同时，AICoding已经超出了编程本身，成为可扩展至任意工作领域的AI工作范式，随着时机成熟，他们在桌面端Claude软件中上线Cowork，形成了一套以大模型为基础，工作范式创新为内核的AI生产力生态模式。

在这个过程期间，其他模型厂商也突然意识到AICoding的重要性，不断开始跟进，国内的智普对GLM模型在编程领域进行了强化，他们放弃了早期训练的一个独立编程模型codegeex，然后在GLM上强化编程能力的训练，是国内最早洞察Anthropic野心，并迅速跟进的模型厂商，并顺势推出coding plan（编程套餐）。而国内的其他模型团队，例如千问、豆包，也照葫芦画瓢推出code模型，推出编程套餐。MiniMax和Kimi也在2025年的年底相继推出编程套餐。

国外，Gemini最早跟进AICoding领域，虽然他们最早提出了Gemini CLI这样的编程工具方案，但是直到他们推出了Gemini 3 Pro，才真正意义上冲上了AICoding的牌桌，这在当时引来了巨大的震撼。xAI推出grok-fast，针对编程场景，通过自己的算力优势获得很多开发者的青睐。openAI则后来居上，推出codex编程工具，配合gpt-5.2-codex来实现对AICoding领域的狙击。

同时，在原本的编程市场，Idea这类传统厂商也好，微软的vscode也罢，新贵cursor们齐上阵，掀起了AI编程界面化工具的浪潮，一批又一批编程工具涌现。

我们不禁有一个巨大的疑问，如果把时间倒回到2025年的5月，我们会问出这个所有人都存在的疑问：为什么要大力去搞AI编程？

我当时也非常疑惑，我知道程序员是一批高净值人群，针对他们，可以获得绝对的高价值利润和持续的复购。可问题是，程序员行业本身也在受到冲击，而这些模型厂商或者AI基建行业本身，为什么在这个时候死死盯住AI编程的领域呢？

根据当时的一些讨论，当时有几种观点：

1）编程领域的训练数据非常有利，开源代码、编程逻辑本身的确定性、持续的迭代等等，这些特征有利于训练出目标明确，行为精准的模型；2）AI落地会是一个长期的过程，总有一些场景需要先吃螃蟹，而编程这个场景距离技术公司最近，近水楼台，拿自己做实验，在自己最熟悉的领域去验证AI的能力；3）当时大模型训练已经遇到数据瓶颈，AI模型厂商为了维持估值，必须找到在单领域具有支配性竞争力的可能性。

然而随着时间的推移，在摸着石头过河的过程中，AI行业逐渐拨开迷雾，看到了一个越来越清晰的景象：

编程Agent不仅适用于编程场景，也同时适用于非编程场景，Claude Code所探索出来的路径，是成为AI改变生产力的正确路径，人们正在尝试一种普世的AI工作范式。

有很多迹象表明这一点：

一些非编程人员，例如创作者、财务、法务人员，他们通过自然语言指挥Claude Code干活，而Claude Code基于自身的能力，可以自我编排，自主完成工作，本质上，Claude Code让“自然语言”变成“代码”本身
基于Skills技术的Agent运行时，可以在团队间共享知识，知识和技能的迁移变得极其廉价，经验不再成为稀缺资源
OpenClaw横扫互联网，它所带来的确定性技术框架，将成为一种非常明确的自主运行框架
AI工具开始具备全局记忆，可识别你这个人的行为习惯，为你提供基于你自身背景的定制化工作模式

这些迹象说明一件事：

大力搞AICoding并非是瓶颈下的无奈选择，而是误打误撞开了天门，是人类走向AI工作范式的第一步。

可以预言，至少在未来的3年内，AI领域的所有发展，都会基于AICoding领域的探索成果来进行发展。AI应用落地本身范式基本已经锁定，而且会向整个社会的各个方面渗透开。

同时，我还观察到3个非常重要的趋势：

1. Harness的兴盛

所谓Harness，简单讲就是Agent，只不过不包含Agent的大脑（LLM）。Harness 是一个集成的软件层，它包裹在 AI 模型之外，负责管理代理的生命周期、工具交互、状态维护和安全限制。在工程学上，Harness 的存在解决了大模型“不确定性”的问题。一个裸模型（Raw Model）只能聊天，而带上 Harness 的模型才能成为代理（Agent）。它充当了模型与现实开发环境（如文件系统、终端、API）之间的“翻译层”和“约束层”。过去，我们接触了非常多的Harness，Manus、Claude Code，它们本身不局限于使用什么模型，是趴在AI模型上的一层壳，然而，它们的价值，现在越来越重要。

一个现代（2026年标准）的 Harness 通常包含以下四个维度：

系统提示词（System Prompt）与校准：这是“灵魂”所在。Harness 通过精密的指令集定义代理的性格和行为模式。例如，它会强制模型在修改代码前必须先运行 ls 查看目录，或在提交 PR 前强制进行 lint 检查。
状态管理与长效记忆： Harness 负责维护会话状态。它不仅仅是把对话历史塞给模型，还会进行上下文压缩（Compaction），将冗余信息蒸馏为精简的进度报告，确保长达数日的开发任务不会因为 Context 爆炸而导致“失控”。
工具链适配器（MCP/API）：代理如何使用编译器、搜索工具或数据库？Harness 提供了标准化的接口（如 Model Context Protocol, MCP），让模型能安全地调用外部工具。
安全沙盒（Execution Sandbox）：为了防止 AI 代理执行危险操作（如误删生产库），Harness 提供了一个隔离的运行环境，并设置了“人工确认钩子”。

在 2026 年，单纯追求模型参数的竞争已趋于平缓。企业和开发者的核心竞争力在于如何构建和优化自己的 Harness。一个优秀的 Harness 能让模型：

少犯错：通过强制的校验指令和工具调用路径降低幻觉。
更专业：通过项目感知的上下文注入（Context Injection）实现定制化。
更省钱：通过精细的上下文管理和状态持久化降低 Token 消耗。

简而言之，Harness 决定了 AI 代理从“玩具”进化为“生产力工具”的质量上限。

在新的一年，企业和个人都应该去构建自己的Harness，而且，很可能不止一个。当然，存在通用的Harness，就像Claude Code一样，如果没有特殊的工作场景，通过自己编排和调教，让Claude Code成为自己的得力助手也行，然而，由于模型厂商之间的封闭性，这些会变的越来越难受。而基于已有的Harness，构建符合自己需要的Harness，以让自己快速解决特定领域的问题，会成为你在2026年是否更进一步的关键。比如，你在白天工作中，你是一位财务人员，你可能需要一套基于你工作场景的Harness，而到了晚上，你又是一位视频博主，你可能需要一套符合你自己口味的视频创作Harness。

2. Claw模式的疯狂入侵

OpenClaw的出现，催生了一种新的模式。Vibe coding这个概念的发明人Andrej Karpathy，现在要再次发明“Claws”这个概念，他提出“Claws are now a new layer on top of LLM agents, taking the orchestration, scheduling, context, tool calls and a kind of persistence to a next level.”（Claws现已成为LLM代理之上的新层，它将编排、调度、上下文、工具调用以及某种持久性提升到了一个新的层次。）简单讲，就像Agents之于LLM一样，Claws之于Agents是一层更高层级的Harness。

当前的AI生态过于封闭，以Anthropic最为典型，他们禁止在其他产品中使用他们的模型来进行开发，而只能对接他们自己的工具。这种封闭带来的结果，就是在用户端的体验割裂，用户无法在一套工具中完整处理工作，而不得不进行工具切换，以根据模型特征，处理不同工作。

正是因为这个情况的存在，Claw模式将成为2026年的核心话题之一。

Claws是AI生态的下一代技术，它们也是一套Harness，但是它们不完全直接与LLM交互，而是通过综合的操作本地已经安装好的其他Harness类工具来实现更通用的智能体。

Claw模式的好处是，突破各个模型厂商及其发布的工具之间的屏障，在更高的维度，根据用户的需求，智能的去调用不同的工具（或Agents）来使用，而不再局限于单一的AI编程工具内部。

这里，我们必须提到“Harness的性格”这个话题，不同的大模型和工具，呈现了不同的特质，而这些特质决定了它们在处理某些问题时有优势，在另外一些问题上有劣势。例如，claude code和codex对比起来，claude code反应快，更活泼，更激进，更快，但是正是因为这种活泼，导致精准度不够；而codex对比起来，则体现出更沉稳，更简单，更准确的特质，但是缺点就是慢。这种“性格”，会自然而然的让我们有一个想法：根据不同任务选择不同工具。然而，这里又由于切换工具时，上下文不一致，导致任务不连贯。而Claws就要解决这类问题。相信2026年，将会有更多的Claw类工具出现。

3. Tokens消费正在狂增

以前，普通用户使用豆包、deepseek这类聊天类AI应用来辅助自己工作，tokens几乎是免费的（对于消费者而言）。然而，随着AI使用方式的转变，使用Harness类工具来进行工作时，有非常多的tokens用来进行理解、思考、识别、工具调用等等，这些tokens不直接产生结果，却至关重要。这导致面对同一个问题，在获得相同结果的情况下，消费者必须为tokens支付非常多的费用。

而如果基于Harness类工具进行工作成为AI工作的统治级范式，那么tokens消费将变成不得不的事实。即，如果你在工作时，不花钱购买tokens，那么你可能无法完成自己的工作（或者说无法在预期的时间里完成，毕竟你还可以用传统的方式工作）。

这也就意味着，tokens成为除了水电气网之外的第5元素。

这是一套清晰的能源利用与生产力体系

发电 -> 算力中心 -> 芯片、数据传输 -> 大模型 -> Harness应用

如果人类进入AI时代，那么提供Tokens，就像提供水电气网一样，会成为人类最底层的需求。我想，正是因为这种趋势，马斯克才会如此着急的开始着手部署太空算力中心。

一旦这种新的生产力体系建立，那么很可能会出现新的生产关系。在网络普及之前，人们主要通过纸质文件来进行记录和存档，随着网络成为新的生产力体系基石之后，传统的纸质文件记录工作方式消失了，医院挂号、图书馆借书、学校开学报名等等，人们已经无法退回到原来的工作方式（，即使在某些场景下，纸质记录更方便）。生产关系，具有排他性，同一时间，不可能让两套系统同时运行，否则会导致混乱。一旦由新生产力决定的生产关系系统建成，具有不可逆性，并且不具备兼容性。这意味着，新的生产关系，将迫使人们进入新的工作方式，以实现人类社会的迭代。一旦人们进入AI时代，基于AI生产力的生产关系形成，那么就不可能再退回到没有AI的生产模式，因为整个社会系统已经对旧的生产模式不兼容了。

此外，就像网络有“宽带”单位一样，tokens的提供也不尽相同。根据自身的需要，用不同的tokens来解决，这可能需要有很长的时间来建设，未来2年，仍然会存在大量贩卖（甚至是走私）tokens的公司（或个体）。在法律还没有跟上的时候，这可能是一个好生意，但是，也存在合规性风险。

作为普通消费者，我们要做好像付电费一样，准备一笔tokens费。虽然在2026年的今天，如果有足够的资金和途径用上顶级模型，可以让你占据一定的优势，有钱的程序员能够效率更高，没钱的程序员可能还得排队来等待模型响应，但是，当所有tokens进入付费时代时，这种优势会消失，我们还会站在同一起跑线，真正的竞争力，永远不在tokens本身，（就像互联网产品的竞争，不存在于电的使用一样，）而在于我们大脑中的洞察力、创造力、专注力。

最后，我想再从普通人的机会出发，聊一聊普通人在这个时代的机遇。

虽然，vibe coding兴起后，开发一款App已经很容易，但是真正能够令人眼前一亮的作品并不多，因此，任何人都是有机会的。我们应该避免陷入两种极端：要么觉得AI可以做一切了，自己完蛋了；要么觉得自己有了AI加持，自己可以无所不能了。实际上，真正能够利用好AI完成自我成长的人，在不是AI的时候，他们也能成功。关键的点在于，通过学习好的方法，挖掘有价值的用户需求，并帮助他们解决，同时，自己又热爱。

让我们敬畏又积极地拥抱吧！

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-02-23，如有侵权请联系 cloudcommunity@tencent.com 删除

工作