最大法典

2026-05-19 1 阅读 dnw
Codex-maxxing ¶ 在 Codex 之前我已经经常使用编码代理。不过,大多数情况下,我通过为编码工作构建的界面来使用它们:制作差异、更改存储库和传送代码。十一月左右,我也开始推动他们从事知识工作。我在 Slidev 中进行了演示,使用的代理更像是带有语音输入的笔记记录器,并不断寻找编码代理可以帮助我生成的其他工件:index.html、PDF、电子表格、幻灯片。最新的 Codex 应用程序升级是我使用的第一个让更广泛的模式感觉原生的东西。 Codex 仍然非常适合编码,但更有趣的转变是它为我的工作提供了生存空间。改变我行为的是学习为工作提供一个操作循环:持久的线程、共享内存、可以在我的计算机上运行的工具、引导和恢复任务的方法以及我可以查看工件本身的界面。耐用线程¶ 改变我行为的第一件事是压缩。压缩 压缩 压缩长时间运行的线程,使其能够继续运行,而无需完整携带所有旧消息。我现在为我关心的每一个重要工作流保留一个固定线程:我的参谋长线程 Agents SDK OpenAI CLI Codex 开源一个只是为了监控 Twitter 这些不是简短的聊天。它们是我已经压缩了几个月的巨型线程。他们积累了历史、偏好和旧的决定,我不想每次回来都重新做这些。固定线程快捷方式 您可以使用 Command-1 到 Command-9 直接跳转到固定线程。这里需要权衡。长时间运行的线程不是免费的。如果您稍后重新访问它们,对话可能不再在缓存中,因此您可能会比在新的短线程中产生更多的成本。对于我关心的工作流,连续性是值得的。语音输入 ¶ 语音输入将我更多的实际想法带入 Codex。好处不是速度。代理得到了我未经编辑的想法。 Codex 有内置语音输入,但我也使用 Wispr Flow,因为系统范围的听写也改变了我可以输入到其他所有内容中的上下文量。如果我正在计划一项工作,我可能会说,“我想 Slack 里有一个叫 Ben 的人提到过这个,我不记得具体是什么了,去看看吧。”这句话打字起来太模糊、烦人,但说起来却很自然。同样的情况也适用于成绩单。如果我想写一篇文章,我可以打电话给某人,记录对话,或者用手机上的格兰诺拉麦片与他们面对面交谈,然后使用文字记录作为起始材料。当模型能够访问我所认为的混乱版本而不仅仅是精美版本时,很多计划都会变得更好。转向 与转向相结合时,语音变得更加有用。转向 转向 在 Codex 已经工作时添加更多方向,而不是等待当前步骤完成。通过转向,您可以在工具调用后注入下一条消息。如果我正在审查一个网站,我可以一边看一边继续说话:把这个变小这个副本是错误的一旦完成,这两件事之间的间距就感觉不舒服,打开一个PR等待预览部署将预览链接发送给需要在Slack上审查它的人我不需要等待每一步完成后再决定下一步。我可以在代理仍在工作时继续添加意图,然后带着已经形成的队列离开。稍后,Heartbeats 可以在我离开后监控 PR 或 Slack 线程。工作单元不再是“一个提示,一个答案”。它变成一个小的操作循环。内存¶ 一旦线程开始持续更长时间,它们就需要在任何一个存储库之外共享内存。重要的举措不仅仅是保存消息历史记录。一个长线程可以记住很多东西,但是这些内存会被困在线程内,除非有用的部分被序列化到持久的地方。内存系统的重点是将线程学到的内容转化为我可以检查、编辑、比较和重用的工件。我的大多数长时间运行的线程都是从黑曜石保险库开始的:保险库/├──TODO.md├──人/├──项目/├──代理/└──笔记/在顶层,我保留了AGENTS.md指令,这些指令说:当你了解更多关于人的信息,在项目上取得进展,或关闭一个开环时,更新保险库中的相关页面。保险库是特工居住的地方,与任何一个项目分开。存储库保存代码。该库保存了我工作的滚动上下文:人员、决策、开环、日常笔记、项目状态以及否则会在线程之间丢失的理解。我还将保管库保留为 GitHub 存储库。这给我带来了两件事:它可以在云中工作,差异成为内存的审查表面当代理更新保管库时,我可以阅读差异并查看它认为重要到足以记住的内容。该审查步骤很重要。我不希望长青的线索在对话历史中悄悄积累共鸣。我希望他们写下发生了什么变化:这个人更喜欢这个