
你可能会想:又一个Agent框架?GitHub上的Agent框架比大熊猫还多,凭什么这个能登顶?
因为DeerFlow 2.0不是框架,是底座。
大多数Agent框架给你一堆积木,让你自己拼。DeerFlow 2.0直接给你一台装好的机器——沙盒环境、持久记忆、技能系统、子代理编排、消息网关,全部开箱即用。
官方给了一个精准的定位:Super Agent Harness(超级智能体底座)。
如果你关注过我之前写的Harness Engineering那篇文章,你会立刻意识到:这不就是Harness Engineering的落地实现吗?
今天这篇文章,把DeerFlow 2.0从定位到架构到源码拆个底朝天。

先说结论:DeerFlow 2.0和1.0共享的代码量是——0。
对,完全重写。不是修修补补的升级,是推倒重来。

Star翻了将近5倍,不是因为字节砸了钱推广,是因为2.0真的解决了痛点。
什么痛点?一句话:单一LLM在面对多步骤、长周期复杂任务时,会上下文爆炸、频繁幻觉、执行到一半就"失忆"。
而很多所谓Agent工具,连一个安全的代码执行环境都没有。你让它帮你写个脚本跑一下,它只能说"抱歉,我无法执行代码"。
DeerFlow 2.0的答案是:给Agent一台完整的电脑。

DeerFlow 2.0的架构分三层,依赖关系严格单向:
┌─────────────────────────────────────────┐
│ App Layer(应用层) │
│ FastAPI + IM集成(微信/飞书/Slack/钉钉) │
│ ↓ 调用 │
├─────────────────────────────────────────┤
│ Harness Package(底座层)deerflow.* │
│ Agent Runtime + 中间件流水线 + 技能系统 │
│ ↓ 调用 │
├─────────────────────────────────────────┤
│ Infrastructure(基础设施层) │
│ LangGraph + LangChain + 沙盒 + 记忆存储 │
└─────────────────────────────────────────┘关键约束:App调用Harness,Harness调用基础设施。反过来绝不允许。
这种分层在后端开发里是老生常谈,但在Agent领域,大多数项目的代码还是一锅粥。DeerFlow 2.0把这个工程常识带进了Agent世界。
用人话说:你可以换掉整个App层(比如从Web换成微信机器人),Harness层一行代码不用改。
这是DeerFlow 2.0最核心的能力,也是它跟"ChatBot加了工具调用"的本质区别。
三种隔离模式:

注意Local模式默认禁用bash。 这不是bug,是设计。只有Docker和K8s模式才开放shell——这条线划清了"聊天机器人加了工具"和"能真正干活的Agent"的边界。
在Docker模式下,Agent拥有:
用人话说:Agent不是在"模拟"执行代码,它是真的在一台隔离的机器上跑你的代码。
DeerFlow 2.0引入了四级任务执行模型:
Flash —— 简单问答,直接回答,不调工具
↓
Standard —— 单步任务,调用工具链完成
↓
Pro —— 多步任务,TodoList中间件拆解步骤,顺序执行
↓
Ultra —— 复杂任务,Lead Agent拆任务,Sub-Agent并行执行Ultra模式是杀手锏。 举个例子:
你让DeerFlow写一篇技术调研报告,对比5个框架。
传统Agent的做法:串行搜索5个框架 → 逐个分析 → 汇总。耗时可能30分钟。
DeerFlow Ultra模式:Lead Agent拆成5个子任务 → 5个Sub-Agent并行搜索和分析 → Lead Agent汇总。耗时缩短到原来的1/5。
每个Sub-Agent拥有:
这就是为什么DeerFlow能处理"几小时"级别的任务——不是一个Agent硬扛,是一群Agent协作。

DeerFlow的技能系统设计得非常巧妙——每个技能就是一个Markdown文件。
听起来是不是很熟悉?没错,这和Claude Code的Skill系统思路一模一样。
内置技能包括:
关键设计:技能按需加载,不会一股脑塞进上下文窗口。
这一点太重要了。很多Agent系统把所有工具描述都放进system prompt,一个20工具的Agent光工具描述就吃掉3000 token。DeerFlow只在需要时加载对应技能的描述——上下文窗口的每一个token都花在刀刃上。
自定义技能也很简单:写一个Markdown文件,放到指定目录,重启即生效。不需要改框架源码。
DeerFlow 2.0的记忆系统存储:
跨会话意味着:你关掉浏览器,明天再来,Agent还记得你是谁、上次做到哪了。
而且记忆系统内置了自动去重——如果你反复提到自己是后端工程师,它不会存5条"用户是后端工程师",而是合并成1条。
字节还接入了TIAMAT作为云端记忆后端,这意味着记忆不仅能持久化到本地,还能在云端跨设备同步。这是在为企业级场景铺路。
这是最体现工程功力的部分。DeerFlow 2.0的每次Agent调用,都要经过18个严格有序的中间件:

为什么要18层?因为Agent在生产环境会遇到你想象不到的问题。
工具调用格式偶尔出错?第4层自动修复。LLM偶尔超时?第5层自动重试。Agent在两个工具之间来回跳?第12层检测到循环并强制退出。上下文快爆了?第8层自动压缩历史摘要。
这就是Harness Engineering的精髓:不是让Agent不犯错,而是让每一种错误都有对应的兜底机制。
如果你读过我之前那篇《Prompt Engineering已死,2026年最值钱的技能叫Harness Engineering》,你会发现DeerFlow 2.0简直是那篇文章的教科书级实现。
Martin Fowler把Harness分成Guides(引导)和Sensors(传感器)。我们看DeerFlow怎么落地的:

DeerFlow证明了一件事:Harness Engineering不是空谈理论,而是可以工程化落地的。
Mitchell Hashimoto说的"让Agent永远不犯同样的错误",DeerFlow用18层中间件+持久记忆来实现。
OpenAI用88个AGENTS.md文件来约束Agent,DeerFlow用Markdown Skill文件做同样的事。
思路一脉相承,但DeerFlow把它做成了开箱即用的产品。
DeerFlow 2.0的安装出奇地简单:
# 克隆仓库
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
# Docker一键启动(推荐)
make docker-init # 首次初始化
make docker-start # 启动服务,端口2026或者本地开发模式:
# 环境要求:Python 3.12+, Node.js 22+
make setup # 交互式配置向导,约2分钟
make dev # 启动开发服务模型支持方面,DeerFlow是模型无关的——任何兼容OpenAI API的模型都能用。官方推荐:

消息网关支持微信、飞书、Slack、钉钉、Telegram、Discord——你甚至可以在微信里直接跟DeerFlow对话,让它帮你写代码、做调研、生成PPT。
市场上Agent框架不少,DeerFlow凭什么脱颖而出?

DeerFlow的优势不在于某个单点能力,而在于"全都有"。
LangGraph是DeerFlow的底层依赖——DeerFlow不是在"竞争",是在LangGraph之上搭了一整层Harness。
用盖房子类比:LangGraph是钢筋水泥,DeerFlow是精装交付的公寓。你可以自己买钢筋水泥盖房子,但大多数人更想直接拎包入住。
适合的:
不太适合的:
DeerFlow 2.0的意义不仅仅是"又一个Agent框架"。
它是第一个把Harness Engineering理论完整落地的开源项目——沙盒对应"安全执行环境",记忆对应"持续学习",技能对应"Guides约束",18层中间件对应"Sensors检测"。
理论界喊了半年的东西,字节用代码交了卷。73.8K Star就是市场投票。
当然,DeerFlow也不是银弹。18层中间件带来的复杂度、Python技术栈的限制、对字节云服务的依赖——这些都是需要评估的。
但如果你正在做Agent工程化,不管最终用不用DeerFlow,它的架构设计都值得深入学习:
2026年的Agent竞争,已经不是比谁的模型强了。是比谁的Harness靠谱。
DeerFlow 2.0告诉我们:靠谱的Agent不是训练出来的,是工程化出来的。
我是老周,一个在架构领域摸爬滚打多年的技术人。如果这篇文章对你有帮助,欢迎点赞、在看、转发三连。关注「老周聊架构」,每周深度解读AI和架构的最新趋势。
— 完 —