这篇文章回答的问题:OpenAI Codex 不只是写代码——它如何变成一个全面的计算机工作系统?如何最大化利用它?
这篇文章应该回答但没回答的问题:Codex 的 agent 能力在实际场景中的可靠性和成本如何?与 Claude Code、Cursor 等竞品相比,差异化到底在哪里?
大多数开发者最初使用编程 agent 就是写代码:检查仓库、做 diff、跑测试、开 PR。这仍然是 Codex 的核心引力场。但计算机上的大量工作已经通过代码来中介——执行 shell 命令、浏览网页、调用 API、导出文档、响应事件、触发自动化。随着这些操作面逐渐对 Codex 可用,它开始感觉不再是一个狭义上的编程助手,而更像是一个完成计算机工作的系统。
Thread(会话线程)让这种转变具体化。一个 thread 可以保持上下文、使用工具、展示产物、跨 prompt 继续工作,而不是每次交互后重置。
大多数开发者最初使用编程 agent 就是写代码:检查仓库、做 diff、跑测试、开 PR。这仍然是 Codex 的核心引力场。
Most developers first use coding agents for code: inspect a repository, make a diff, run tests, and open a pull request. That's still the center of gravity for Codex.持久线程(Durable Threads)
Pinned threads 是保持持久线程的一种方式,适合反复出现的工作流:Chief of Staff 线程、发布线程、文档审查线程、外部监控线程。这些不是短暂对话,而是持久工作空间。Codex 可以随时间重新访问它们,保留决策、偏好和工作上下文——否则这些上下文需要从零重建。Command-1 到 Command-9 直接跳转。
语音输入(Voice Input)
语音输入捕获想法在被打磨成文字之前的粗糙版本。Codex 内置语音,特别适合那些"说出来自然但打出来别扭"的模糊起点:
我觉得一个叫 Ben 的人在 Slack 里提过这个。我不记得细节了。请去查一下。
I think someone named Ben mentioned this in Slack. I do not remember the details. Please go look.对于一个能搜索、收集上下文并回报的 agent 来说,这通常就够了。转录也是一样——原始会议转录往往比简短总结提供更好的素材,因为它保留了不确定性和未完成的想法。
操控与排队(Steering & Queuing)
Steering 在 agent 走错方向时打断当前任务,注入新方向。Queuing 不打断,而是把下一个任务排到队列里。Steering 改变"现在在做什么",Queuing 改变"接下来做什么"。两者让用户在工作进行时保持参与。
浏览器与桌面操控
Codex 可以逐层向外扩展:侧面板内的应用内浏览器 → 已登录的 Chrome 浏览器状态 → 只能通过桌面 GUI 完成的工作。MCP 服务器和连接器将同样的理念扩展到工作流的其余部分——Slack、email、calendar。许多重要任务最初以消息、收件箱项目或日程问题的形式出现,然后才变成代码。
线程自动化(Thread Automations)
这是整篇文章最激进的想法。Pinned threads 仍在等用户回来,而 thread automation 可以每隔几分钟或几小时主动检查,持续到满足条件,并随时间调整频率。
每 30 分钟,检查 Slack 和 Gmail 中需要我关注的未回复消息。帮我优先处理最重要的事。如果有人问我问题,尽可能深入调研并起草回复,但不要发送。
Every 30 minutes, check Slack and Gmail for unanswered messages that need my attention. Help me prioritize what matters most. If someone asks me a question, research the answer as deeply as you can and draft a reply for me, but do not send it.当用户回来时,收集上下文这个"昂贵"的部分往往已经完成。人仍然决定什么该发出去。
可验证目标(Goals)
Goals 在任务有真正的终点线时最强大。弱目标是"实现这个 Markdown 文件中的计划"。强目标有可衡量的成功标准——比如将内部工具从 Python 迁移到 Rust,新实现直到单元测试通过才算完成。有用的验证器包括测试套件、基准测试、bug 复现、验证矩阵、端到端工作流。
雄心很重要,但没有验证,它只是一个愿望。
Ambition matters, but without verification it's just a wish.侧面板(Side Panel)
侧面板让工作保持在产生它的对话旁边。Web 既是输出也是控制面。Codex 可以构建一个产物,在侧面板中打开它,检查、调试、在原地持续改进。一个 index.html 文件就能成为持久的交互式产物,不需要服务器。
共享记忆(Shared Memory)
一个持久的模式是将持久线程锚定在 Obsidian vault 中——一个由纯文本文件组成的文件夹,易于检查、编辑、移动和长期保存。AGENTS.md 定义 Codex 应如何更新该工作空间。
仓库存代码。vault 存滚动上下文:涉及的人、发生了什么变化、什么被阻塞了、什么需要跟进,以及那些会在 session 之间消失的东西。
Repositories hold code. The vault holds rolling context: the people involved, what changed, what's blocked, what needs follow-up, and what would otherwise disappear between sessions.精选评论
@PaulSolt:Getting the most out of Codex — 引用了全文并补充了自己的 Codex 使用心得。
原文:Paul Solt shared the full article with his own Codex productivity tips.
社区反应:1033 likes, 87 reposts, 24 replies, 74450 views。高 engagement 显示社区对 Codex 产品路线的高度关注。评论区主要讨论 Codex 的 thread automations 概念和与其他 coding agent 的对比。