Claude Code 动态工作流：
当 AI 学会给自己写调度器

Anthropic 的平台化战略跃迁 — 从编码工具到任务编排平台

AI Agent Multi-Agent Orchestration Anthropic Strategy 2026-06-02

15,726

收藏（2.3x 赞）

1.53M

浏览量

编排模式

3-5x

Token 成本乘数

一、发生了什么

2026年6月2日，Anthropic 发布 Claude Code 动态工作流。收藏/赞比率 2.31:1 极为异常——用户在标记"我以后要回来看这个"，这是一份操作指南而非一个观点。

关键互动数据

指标	数值	解读
浏览量	1,529,935	算法放大效应明显
点赞	6,813	中等认可度
收藏	15,726	收藏/赞 = 2.31:1，远超正常的 0.3-0.8
转发	781	传播率 0.051%，适合深度消费
回复	158	讨论活跃度中等

社区情绪分布

35%
兴奋期待

30%
审慎质疑

20%
技术讨论

10%
负面体验

5%
提问

关键观察：乐观派多为 Anthropic 员工或尚未深度使用的用户，审慎派多为有实际 agent 编排经验的开发者。经验与审慎正相关。

二、技术本质

一句话：Claude 在运行时自行编写 JavaScript 编排脚本，生成和协调多个独立子代理，每个拥有独立上下文窗口和可选 worktree 隔离。

三种失败模式（动态工作流要解决的）

失败模式	描述	学术支撑
Goal Drift	多轮交互后目标保真度下降	arXiv 2505.02709 (AAAI/AIES 2025) ICLR 2026 "Inherited Goal Drift"
Agentic Laziness	复杂任务中途宣布完成	与 goal drift 相关，Anthropic 命名
Self-Preferential Bias	倾向于认可自己的输出	与 preference drift 相关

六种编排模式

Fan-out-and-synthesize

任务分解 → 并行执行 → Barrier同步 → 综合结果。对应 MapReduce（2004）。

Tournament

N个代理竞争，成对比较淘汰。数学基础：Bradley-Terry Model (1952)。

Adversarial Verification

生成代理 + 独立验证代理。就像 PR Review：作者不应审查自己的代码。

Classify-and-act

分类器代理路由到专门处理代理。类似 L7 负载均衡器。

Generate-and-filter

生成大量候选 → 过滤标准 → 去重。适合头脑风暴和命名。

Loop until done

循环直到停止条件。需配合 /goal 和 token 预算防死循环。

动态 vs 静态工作流

维度	静态（Agent SDK）	动态工作流
编排定义	人工预写（Python/TS）	模型即时生成（JS）
执行模型	DAG（固定拓扑）	图灵完备脚本
可复现性	高	低（每次 harness 不同）
灵活性	低	高（运行时适应）

核心洞察：这是"编译时多态 vs 运行时多态"的区别。静态 = 编译时决定路径，动态 = 运行时决定路径。

概念系统映射

动态工作流	操作系统	映射关系
工作流	进程组/作业	顶层编排单元
子代理	进程	独立执行单元
上下文窗口	地址空间	隔离的资源容器
Worktree	chroot/namespace	文件系统级隔离
Barrier	wait/notify	并发同步点
模型路由	调度器	资源分配决策

三、Anthropic 的平台战略

从工具到平台的三组件

Skills

提示词+参考文件
→ 用户创建 → 社区分享

Workflows

JS编排脚本
→ 动态生成 → 保存分享

分发机制

SKILL.MD + ~/.claude/workflows
→ 标准化 → 生态锁定

"这类似 npm 之于 Node.js、VS Code Extensions 之于 VS Code。用户积累的工作流就是迁移成本。"

商业模式的微妙平衡

更多子代理 → 更多 token → 更多收入。但 Thariq 反复提醒"谨慎使用"——既是真诚建议也是免责声明。这是一个经典的 SaaS 定价困境。

四、解决了什么，又引入了什么

Token 成本：3-5x 乘数

场景	标准 token	工作流 token	乘数
简单修改	5K-15K	20K-60K	3-4x
中等重构	20K-50K	80K-200K	4-5x
大规模并行	无法完成	200K-1M+	N/A

Max $200/月用户，一次重度工作流可能消耗 1-3 天额度。

耐用性：诚实的局限

Thariq："我们肯定没有在你的终端中发布 Temporal。"
技术现实：没有全局检查点、没有重试机制、没有死信队列。恢复 ≈ /resume 级别。

被忽视的隐患

对抗性验证的对抗性：验证代理本身也可能有偏差——谁来验证验证者？
综合步骤瓶颈：Fan-out 过多时，synthesis barrier 可能溢出上下文
锦标赛复杂度：O(N log N) 场比较，token 成本同阶增长

明确不适合的场景

简单编码任务

不需要 5 名审查员的陪审团

确定性要求

需要可复现结果时不适合非确定性编排

成本敏感

Pro $20/月用户重度工作流会耗尽额度

生产关键路径

耐用性不足以支撑生产级可靠性

五、竞争格局

维度	Claude Code	Cursor	Windsurf	OpenAI Codex	Devin
编排	原生动态多代理	Agent（单代理）	Flow（有限）	单代理	全自主
隔离	worktree	无	无	无	沙箱
平台化	Skills+Workflows	Extensions	有限	API	无
并行	原生 fan-out	有限	有限	有限	有限
定价	$20-200/月	$20/月	$15-25/月	API	$500/月

第四次范式转移

2021 — 代码补全
GitHub Copilot

2022 — 对话式编码
ChatGPT

2024 — Agentic 编码
Cursor Agent, Claude Code

2026 — 自主编排
Claude Code Dynamic Workflows

六、历史回响

MapReduce 的幽灵

概念	MapReduce (2004)	动态工作流 (2026)
任务分解	Map: 分片	Fan-out: 子任务
并行执行	Mapper 并行	子代理并行
结果聚合	Reduce	Synthesize
容错	TaskTracker + 重试	/resume（弱）
调度器	JobTracker	Claude 自编写 JS

核心差异：MapReduce 是确定性的，动态工作流是非确定性的。MapReduce 之后花了 10 年才发展出 Spark、Flink 等生态。AI 编排工具的演进才刚刚开始。

确定性 vs 自主编排的光谱

确定性编排
LangGraph, Temporal
人工定义流程

自主编排
AutoGPT
AI 定义流程

Claude Code 动态工作流 → 中间位置
harness 是 AI 写的，但 JS 代码可读、可审查、可修改

趋势预判

时间	预判	置信度
3个月	Cursor/OpenAI 发布类似动态编排	高
6个月	社区出现工作流市场/目录	中高
12个月	获得耐用性/可观测性提升	高
12个月	工作流可视化编辑器出现	中高

七、事实核查

声明	状态	说明
三种失败模式是真实问题	已确认	arXiv 2505.02709 + ICLR 2026
成对比较比绝对评分可靠	已确认	Bradley-Terry Model (1952)
Bun 用工作流 Zig→Rust	部分确认	无独立验证，细节稀少
"ultracode" 触发词可靠	部分有效	社区报告触发不稳定
Token 预算可通过提示设置	软约束	模型尝试遵守但不保证
恢复能力保证	存争议	Thariq 承认 ≈ /resume
具体 token 成本乘数	无数据	最大信息缺口
最大并行子代理数	未公开	对大型任务规划有影响

八、个性化洞察

洞察 1：Skills 可以内嵌工作流

为什么跟你有关：你的 deep-analysis skill 本质上是 fan-out-and-synthesize 的手动实现。

你可以怎么做：在 SKILL.MD 中引用工作流文件，将多代理编排从 bash 升级为 JS 工作流。

洞察 2：自动化 CLAUDE.md 优化

为什么跟你有关：你维护大量编码规则，手动挖掘修正模式。

你可以怎么做：创建工作流定期挖掘会话历史，聚类修正模式，对抗性验证后写入 CLAUDE.md。与 /loop 配合每周自动运行。

洞察 3：对抗性验证做代码审查

为什么跟你有关：QA 背景使你天然理解"独立验证"的价值。

你可以怎么做：用"快速工作流"做轻量级对抗性审查——一个生成代理 + 一个验证代理，对 tab-home 等项目做 PR 前审查。

洞察 4：模型路由控制 token 成本

为什么跟你有关：deep-analysis 需要 Opus，lint/commit 只需 Sonnet。

你可以怎么做：分类器代理判断任务复杂度，简单任务路由 Sonnet，复杂任务路由 Opus。可降 30-50% token 成本。

洞察 5：三存是天然 fan-out

为什么跟你有关：飞书+Obsidian+Hugo 三路同步就是 fan-out-and-synthesize。

你可以怎么做：三个子代理分别处理飞书、Obsidian、Hugo，一个综合代理确认同步状态。

Claude Code 动态工作流：当 AI 学会给自己写调度器