启动更多 AI Agent 现在很容易。但更多 Agent 在跑,不代表你有更多的"你"可用——你的认知带宽无法并行化。所有真正用来引导它们、合并它们产出的判断力,仍然必须通过唯一的一个串行处理器——也就是你自己。编排税(Orchestration Tax)本质上就是你忘记这一点后付出的代价,而唯一真正的解决方案,是像架构任何并发系统一样,架构你自己的注意力。
我在 Google I/O 上和 Richard Seroter、Aja Hammerly、Ciera Jaspan 一起参加了一个面板讨论,聊的是软件工程的现状和未来演进。快结束时 Richard 问我们:开发者应该带走的一个行动建议是什么。我说了我几个月来一直在琢磨的事:感觉忙碌和真正高效完全不是一回事。你可以跑 20 个 Agent,感到无比忙碌。但那不是 20 个 Agent 的交付量。
Richard 在讨论中给这个问题起了名字。"你说的就是编排税",他说,"你不可能在自己的脑子里同时成功管理二十个 Agent。"他说得完全对。我想好好拆解这个概念,因为这不是一个自律问题,这是一个架构问题。
你就是 GIL
Python 有一个全局解释器锁(GIL)。你可以创建任意多的线程,但同一时刻只有一个线程能执行 Python 字节码,因为它们必须获取这把锁。你就是 AI Agent 的 GIL。它们可以同时运行,但当它们的工作需要真正理解架构,或解决合并冲突时,这些工作必须获取锁。只有一把锁。你持有它。
Amdahl's Law 让这一定义更加精确。并行化带来的加速比,受限于必须串行执行的那部分工作。如果你的流水线中有很大一部分无法并行化,无论投入多少核心,都会撞到一个硬上限。在 Agent 开发中,串行部分就是判断力。启动 8 个 Agent 不会加速你的判断速度,它只是让排在你前面等待处理的工作队列变得更长。
这是一个老牌性能工程事实,至今仍让人惊讶:优化非瓶颈部分不会增加吞吐量。你只是让堆积在瓶颈前方的未完成工作变得更多。
Optimizing the non-bottleneck part doesn't increase throughput. You just grow the pile of unfinished work sitting in front of the bottleneck.上下文切换的真实代价
在面板上我说过,我从未觉得工具让我如此高效,但我也从未如此疲惫。这两半都是真实的,而且它们有同一个原因。
疲惫有一个非常具体的原因:这就是以 100% 利用率运行一个串行处理器且毫无余量时的感受。每次你检查一个离开过一段时间的 Agent,你都要付出上下文切换成本。你清空大脑,从冷启动重新加载一个不同的上下文。CPU 在微秒内完成这件事,架构师们仍然竭力避免它。你在几分钟内完成,而且你永远无法完美重载上下文。
5 个 Agent 不是 1 倍的工作量做 5 遍。它是 5 次冷重载,外加一个后台脑进程不断担忧你应该去检查哪个 Agent。
不能靠更努力来解决
你不能靠"更努力"来修复一个结构性限制。税总是要交的。如果你硬撑,这个限制只会表现为浅层代码审查,或一种审查疲劳——你直接接受 Agent 的代码,因为形成自己的判断所需的注意力你已经没有了。你要么刻意交税,要么让它悄悄摧毁你对自己系统的理解。
五条实战策略
按 review 速率缩放
正确的并行 Agent 数量,是你能真正做好 code review 的数量。对大多数人来说,这是一个低个位数。AI 工具很乐意让你启动 20 个,但那只是一个 UI 功能。
对工作进行分类
保持两堆任务:隔离工作(可委托给后台 Agent)和复杂任务(判断本身就是工作)。最大的错误是试图并行化第二堆。
批量审查
一次坐在那里审查 4 个 Agent,比检查一个、离开做别的、再冷启动回来便宜得多。让工作积累一些,然后批量处理。
只在判断上花锁
让 Agent 写通过测试或生成截图来证明那无聊的 80%,你只花注意力在真正需要人类的 20%。
保护你的串行时间
有时候最高杠杆的举动是完全停止编排,关掉满载 Agent 的笔记本电脑,只想一个问题。编排不是真正的工作,它是工作周围的开销。
真正的结论
启动 Agent 不是技能。任何人都能跑 20 个。真正的技能是围绕那个无法克隆或并行化的唯一串行资源来设计系统。那个资源就是你的注意力。像架构你在生产环境中依赖的任何其他东西一样,架构它。
Spawning agents is not the skill. Anyone can run 20. The real skill is designing the system around the one serial resource that cannot be cloned or parallelized. That resource is your attention.
精选评论
来自 X/Twitter 回复区的高质量讨论。