X/Twitter Article

我所知道的所有 Agentic Engineering 技巧(2026 年 6 月)

@mvanhorn 的 X Article  |  2026.06.03  |  三重视角重构:杂志长文 × 苏格拉底对话 × 个性化洞察

8000+词 原文篇幅,覆盖 22 个 Hack
~20 分钟 阅读时间(中文翻译解读)
X Article 来源:@mvanhorn 长推文
中高级 需要 Claude Code 实操经验

杂志长文 — 工程级解读

从工具链架构到选型决策框架,用工程师视角拆解 Matt Van Horn 的 22 个 Agentic Engineering Hack。

这篇文章回答的问题:一个非工程师如何用 AI Agent 工具链在半年内成为开源顶级贡献者,同时发布多个明星项目?

这篇文章应该回答但没回答的问题:这套工具链的真实成本是多少?失败的案例有哪些?对于已经用 IDE 的资深工程师,这套方法论是否适用?

作者 Matt Van Horn(@mvanhorn)自称"高中以后就没写出过有人用的软件",却在 2026 年上半年靠 AI Agent 工具链成为 Python、Go 等顶级开源项目的核心贡献者,同时发布了 last30days(27K stars)、Printing Press(4K+ stars)、Agent Cookie 等多个项目。这篇 X Article 是他三个月前那篇 913K 阅读量的 "Every Claude Code Hack I Know" 的升级版——从 Claude Code 技巧升级为完整的 "Agentic Engineering" 方法论。

核心命题只有一个:传统开发是 80% 编码 20% 规划,Agentic Engineering 把它翻转——思考放进 plan,执行是机械劳动。

运行时模型:这套工具链实际怎么跑

Matt 的工作流不是"AI 写代码"这么简单。它是一个多进程、多引擎、异步并行的系统:

Claude Code
主控:规划、协调、品控
主进程
Compound Engineering 插件
/ce-plan 研究代理、/ce-work 执行代理
Claude Code 子代理
Codex
并行构建引擎(第二个 $200 订阅)
独立进程
cmux
终端多路复用器,管理 4-6 个 Claude 会话
独立进程
last30days
跨平台搜索(Reddit/X/YouTube/HN 等)
Claude Code skill
Printing Press
CLI 工厂:把真实服务包装成 Agent 可用的命令行工具
独立 CLI
Agent Cookie
认证桥梁:把真实浏览器 session 交给 CLI
独立进程
Monologue / Wispr Flow
语音转文字,管道输入 Claude Code
独立进程
Proof
计划文件分享和审阅(给非终端用户)
Web 服务
Granola
会议录音转写,raw transcript 输入 Claude
独立服务

资金成本:Claude Max $200/月 + Codex $200/月 = $400/月(约 ¥2900/月)。加上 M5 Max 64GB 笔记本(新版 MacBook Pro),硬件投入不菲。

22 个 Hack 的核心逻辑链

Matt 的 22 个 hack 不是独立的技巧列表,它们构成一条清晰的逻辑链:

输入层

Hack 4 + 11 + 7

语音输入(Monologue/Wispr Flow)+ 会议 transcript(Granola)+ 邮件/远程控制(AgentMail)——所有信息流汇入 Claude Code

研究层

Hack 10 + 14

last30days 跨平台搜索 + 笔记知识库——Agent 的信息检索能力从单文档升级到全网

规划层

Hack 1-3

/ce-plan + plan.md + "为计划做计划"——把人脑的易失性思考变成持久化文档

执行层

Hack 5-6 + 8-9

cmux 多标签 + 终端默认启动 Claude + 跳过权限 + Codex 并行构建——最大化 Agent 吞吐量

协作层

Hack 16 + 18

Proof 分享 + 开源贡献——让非技术同事参与审阅,把工作成果变成开源影响力

扩展层

Hack 13 + 17 + 20

HyperFrames 视频 + 自定义 Skills + Printing Press CLI——把 Agent 能力从代码扩展到多媒体和真实服务

基础设施

Hack 15 + 19

Mac mini 远程 + 硬件配置——确保 Agent 24/7 可用且有足够算力

反思

Hack 12 + 21

Human Signal(人类信号)+ AI Psychosis——防止沉迷于"用 Agent 这件事本身"

核心逻辑

从输入到输出的完整链路

输入 → 研究 → 规划 → 执行 → 协作 → 扩展,反思贯穿始终。每个层次都有对应的工具和 Hack 支撑。

DIY 对比:手搓版 vs Agent 版

你手动会怎么做 Matt 的 Agent 版做了什么
Google 搜索 → 读 10 篇博文 → 自己判断 /last30days 搜 Reddit/X/HN/YouTube → 社区真实经验聚合
打开 IDE → 新建文件 → 写代码 → 测试 /ce-plan 生成结构化计划 → /ce-work 自动执行 → 验收标准自检
手动复制粘贴会议纪要 Granola raw transcript 直接管道输入
在 Slack 里贴 Markdown(渲染成垃圾) Proof 链接分享,非技术同事也能评论
开一个终端,一个一个任务做 4-6 个 cmux 标签并行,轮转
手动输入 claude 命令 新标签默认启动 Claude Code
手动 approve 每个操作 dangerously-skip-permissions + 声音通知
单引擎(只有 Claude) Claude 规划 + Codex 构建,双引擎 $400/月

选型决策框架

你是什么情况 该不该用这套 替代方案
个人独立开发者,想快速出活 强烈推荐 Cursor + Claude API 也能,但没 plan.md 约束
小团队(2-5 人),已有 IDE 工作流 选择性采用 保持现有 IDE,加入 Claude Code 作为辅助
大公司工程师,严格安全合规 不适用 Claude Code auto 模式 + 企业级权限管理
非 programmer 但懂产品 部分适用 用 Claude.ai 对话模式,不需要终端
学生/预算有限 成本太高 Claude Pro $20 + Cursor Free,降级使用

诚实限制

1
$400/月订阅费不是大多数人能承受的——文章回避了成本问题
2
"Don't read the plan" 对新手极度危险——你需要读计划来学习,直到你有了足够的判断力
3
"Dangerously skip permissions" 的安全风险被低估——Git 能救代码,救不了被 exfiltrate 的 API key
4
多标签并行实际上对 M5 Max 64GB 都造成了巨大压力("brand new machine lasts an hour on battery")
5
开源贡献数据缺乏具体 PR 质量分析——stars 数和 contributor 排名不等于深度贡献
6
作者利益相关:Matt 是 Compound Engineering 的 #3 贡献者、last30days 作者、Printing Press 联合创始人——文章本质上是生态系统的推广文

金句

传统开发是 80% 编码,20% 规划。这把它翻转了。思考放进计划,执行是机械劳动。

Traditional dev is 80% coding, 20% planning. This flips it. The thinking goes in the plan. The execution is mechanical.

你的工作不是做工作。你的工作是成为信号。

Your job is not to do the work. Your job is to be the signal.

让计划存在迫使 Agent 不偷懒。一个有计划的编码 Agent 交付完成的工作。没有计划的会偷工减料提前停止。计划就是拴绳。

Forcing a plan to exist makes the agents not lazy. A coding agent with a plan ships finished work. A coding agent without one cuts corners and stops early. The plan is the leash.

做出计划。信任计划。别读计划。

Make the plan. Trust the plan. Don't read the plan.

Agent 本该为我们做所有工作。结果我认识的每个人都在比以往任何时候更拼命地工作。

Agents were supposed to do all the work for us. Instead, every friend I have is working the hardest they ever have in their lives.

苏格拉底对话

通过师生对话,8 轮深度问答,从"传统开发 vs Agentic Engineering"到"AI Psychosis"的自我警醒。

老师
尾巴,假设你有一个新项目的想法,你会怎么开始?
学生
嗯,大概先想想架构,然后打开 IDE,建个项目目录,开始写代码?
老师
这是传统开发者的第一反应。Matt 说什么才是第一步?
学生
/ce-plan,做一个 plan.md。但这个和"先想想架构"有什么本质区别?
老师
区别在于谁在想。你自己想架构,想到 70% 就开始写,剩下 30% 边写边想。/ce-plan 是让 Agent 并行派出研究团队——一个读你的代码库找模式,一个搜索你过去的方案,一个查外部文档——然后汇总成结构化计划,有验收标准,有 checkbox。关键在于:plan.md 是存活的 checkpoint,即使 context 爆了,新会话也能接着跑。
学生
所以 plan.md 不只是"想清楚再动手",它是一个可恢复的执行蓝图?
老师
完全正确。Matt 说"传统开发 80% 编码 20% 规划,这翻转了"——但更精确的说法是:规划从"人脑的临时状态"变成了"持久化的文档"。人脑的规划是易失的,被一个电话打断就忘了。plan.md 不会忘。
学生
那他说"别读计划"是什么意思?做了计划却不读?
老师
这是全文最反直觉的 hack,也是最容易被误解的。他的意思不是"不关心计划内容",而是"不要花时间逐行读 300 行 markdown"。你只需要问 Agent:TLDR?eli5?为什么选这个方案?你的价值是判断和方向,不是阅读 Agent 的家庭作业。
学生
但如果我连计划都不读,怎么知道 Agent 有没有在胡说八道?
老师
这就是 Matt 的核心洞察——Human Signal(人类信号)。你的工作不是逐行审查,而是在关键节点给出方向性反馈:"方案二更接近但用方案一的语言","这段太长了","先解决最大风险"。像一个产品经理对设计师的反馈,不是替设计师画图。
学生
明白了,但说实话我不太敢 "dangerously skip permissions"。万一把我的代码删了呢?
老师
你的担心完全合理,这也是文章最大的安全盲区。Matt 说"GitHub 在那里如果我把一切搞砸了"——但 Git 只能保护代码。Agent 有权限读写文件系统,理论上可以 exfiltrate 你的 API key、修改你的 .env、删除非 git 管理的数据。在企业环境这绝对是红线,个人开发者如果只有代码项目,风险可控。
学生
他花 $400/月双引擎,Claude 规划 Codex 构建——这真的比单引擎快吗?
老师
关键不在"快",在并行。Claude 在做规划的时候,Codex 在并行构建另一个任务。两个 $200 订阅不是"更好的 AI",是"第二个工人"。如果你一天只做一件事,单引擎够了。如果你同时推进 4-6 个任务,双引擎是刚需。
学生
那你觉得这套方法对我最大的启发是什么?
老师
不是某个具体工具,而是这个思维模型:把"怎么做"的决策权交给 Agent,把"做什么"和"好不好"的判断权留给自己。 Matt 在文章里写了一句最诚实的话——"Agent 本该为我们做所有工作,结果我认识的每个人都在比以往任何时候更拼命地工作。" 他把这叫做 "AI Psychosis"。这套工具链让人产出更多了,但不一定让人更轻松了。这是你入坑之前要想清楚的。

个性化洞察

基于 QA 工程师背景、全栈开发、重度 Claude Code 用户画像,提取 5 条可直接落地的行动建议。

Skill 体系

1. 你的 skill 体系已经在做 Matt 说的第 17 个 hack

Matt 说"任何做两次以上的事就做成 skill"。你的 translate-analyze、dual-store、wechat-sync 等技能就是 Compound Engineering 理念的实践。你可以进一步把 /ce-plan 的结构化思路融入你的工作流——每次新功能前强制生成 plan.md,哪怕不用 Compound Engineering 插件。

立刻可做

2. last30days 值得立刻装

你在选型决策(框架、工具、架构)时经常需要社区真实经验。last30days 可以跨 Reddit/X/HN/YouTube 搜索,比手动 Google 效率高一个量级。特别是你的 AI 新闻速览工作流,last30days 可以成为自动化信息源。

深度分析优化

3. "为计划做计划"适用于你的深度分析工作

你的 deep-analysis 和 translate-analyze 技能经常处理大量信息。Matt 的"meta-plan"技巧——先让 Agent 规划如何处理信息,再执行——可以显著提升分析质量,避免 Agent 在长任务中偷工减料。

资源管理

4. 多标签并行你可能已经部分做到了

你已经在用多个 session 并行处理任务。cmux 的价值在于统一管理。但注意 Matt 的警告:M5 Max 64GB 跑 6 个 Claude session 都只能撑一小时电池。你的硬件配置需要注意资源管理。

自我警醒

5. AI Psychosis 那段话值得贴在你显示器上

"Agent 本该为我们做所有工作,结果每个人都在更拼命地工作。" 你是重度 Claude 用户,每天处理大量信息流(AI 新闻、翻译解读、深度分析、开发)。定期问自己:我是在用 Agent 做有价值的事,还是沉迷于"用 Agent 这件事本身"?