奥特曼亲推！400万周活Codex杀入移动端，码农不用再死守电脑了

新智元报道编辑：元宇【新智元导读】 400万周活的Codex，被OpenAI装进手机了！OpenAI官宣，Codex进入ChatGPT手机App，开发者离开电脑，也可以用手机随时审批命令、调整方向，指挥智能体继续跑活。程序员把任务扔给Codex，自己就可以出门喝咖啡了？刚刚，OpenAI把Codex装进了手机：Codex已进入ChatGPT手机App预览版，面向iOS和Android全量开放，覆盖所有套餐，包括免费版和Go用户。 OpenAI官方预告语说，用户期待这项功能已经很久了。奥特曼也发帖亲推：这是ChatGPT移动应用中的Codex！从此，开发者变身24小时AI监工：离开电脑，也可以通过手机看进度、审diff （代码变更对比）、批命令，智能体在电脑、devbox或远程环境里继续跑。 https://openai.com/index/work-with-codex-from-anywhere/ 正如OpenAI官方博客所言，「你可以随时随地和Codex一起工作」：移动端Codex的推出，呼应了AI编程长时任务带来的需求。过去，写代码是人坐在机器前输入指令的过程。现在，Codex每周有超过400万名开发者在使用， Codex 处理的已经是长达数小时乃至数天的任务。智能体在跑，人在别处，异步审批正逐渐成为常态。当智能体跑到岔路口，需要一个判断，而你在咖啡馆、在通勤、在开会，这正是Codex移动端要解决的问题：让你在任何地方都能给智能体一个指令，让它能继续跑任务。手机是遥控器开发环境一直在电脑里很多人看到「Codex进手机」，第一反应是：以后可以在手机上写代码了？并非如此。 OpenAI的产品逻辑是这样的：Codex继续运行在你的电脑、Mac mini、公司devbox，或者公司远程开发环境里。文件、凭证、权限、本地配置，这些东西并不会搬到手机上。 ChatGPT手机端菜单已出现Codex入口手机端能做的，是作为控制面板：查看所有活跃线程、审查智能体的输出、批准它申请执行的命令、切换使用的模型、开启一个新任务。与此同时，智能体的实时状态会推送到手机上，包括截图、终端输出、diff、测试结果，以及需要人工介入的审批请求。底层是一套安全中继层（secure relay layer）。它让你的主机可以跨设备被访问，但不直接暴露在公网上。设置流程也相对直接：在macOS Codex App里开启远程访问，扫二维码，ChatGPT手机App完成连接。咖啡店、地铁、午餐桌、多任务监督四个正在被改写的场景场景一，咖啡店里审diff 。早上派下去的几个任务，到点查一下进度，diff一目了然。某段改动方向不对，在手机上敲两句注释回过去，智能体收到就接着调整。开发者人不在工位，代码却没停下来。一杯咖啡的时间，三个PR的进展全部回顾完，必要的反馈都已经发出去。场景二，通勤路上改方向。智能体跑到一半卡在某个不熟的API上，主动给开发者发问询。地铁里看一眼，回复「用X库的Y方法」，智能体拿到答案继续跑。决策的颗粒度变细了：开发者不再亲自写代码，但持续在校准方向。一段30分钟的通勤，原来是无法转化成产出的纯消耗时间，现在能消化掉两到三个智能体的关键决策点。场景三，午餐时塞个新想法。吃饭刷动态时冒出一个产品idea，掏出手机派给智能体「先做个原型出来」。等下午回工位，已经有可看的提交记录在等着。从想法到代码的转化路径被压短了，原来需要一个晚上，现在压缩到一顿饭。场景四，多任务并行监督。同时三四个智能体在不同任务上跑，开发者用手机切换审阅。工作方式从「一次写一个项目」换成了「一次监督一组工程」。一个人手里同时挂着四五条线，每条线都在推进。每个智能体独立工作，开发者只在关键节点出现。四个场景指向同一件事：开发者的输入从「代码」换成了「判断」。手机够用，是因为输入的内容本来就不需要键盘和大屏。两句注释、一个方法名、一个「继续」或「重做」，这些是手机最擅长的输入形态。手机批代码，风险也需知道在手机上审批智能体任务，也可能带来更高的错误风险。小屏幕、多任务场景下，注意力质量很难匹配开发决策的要求。这并非小题大做。Codex在手机上等待批准的，往往并非普通的操作：shell命令要不要执行、两条重构路径走哪一条、一个权限申请批不批。这些判断在桌面IDE前可以放大窗口、对照上下文、反复确认。在通勤途中，很可能就是瞥一眼、划一下。 OpenAI在安全设计上做了一些应对：Hooks支持扫描提示词中的敏感信息、运行命令验证器；企业用户有权限管理和审计日志；Codex默认沙箱运行，需要更高权限时会主动申请。但工具的设计再完善，移动端审批本质上也是在把关键决策点搬进了碎片化注意力的场景。如何平衡便利性和严谨性之间的矛盾，仍是一个有待解决的问题。开发者从踢球的人变成了场边教练手机审批只是表象。 OpenAI在2月的Codex App发布中写过一句话：核心挑战已经从「智能体能做什么」，转变成「人如何在更大规模上指挥和监督智能体」。手机端是这句话的一个落地，背后是整套工作流的重塑，有三层东西同时在被解构。第一层，时间。过去，开发者的产出很大程度上受限于在场时间：人离开键盘，代码推进也往往随之暂停。现在，Codex可以在主机、devbox或远程开发环境中持续运行，开发者不必始终守在屏幕前，只需要在关键节点介入判断、审批和纠偏。当一个开发者手里同时挂着多个智能体任务时，工作流的瓶颈会从「亲自敲代码」转向「拆解任务、判断方向、审查质量」。这并不等于线性获得数倍人工编码时长，但确实会把原本容易空转的等待时间利用起来，也让单个开发者能够管理更多并行任务。产能的天花板，正在被重新定义。第二层，空间。决策可以发生在任何有4G信号的地方，但空间被解构并不等于「程序员变自由了」，决策密度反而在上升：原来一天写6小时代码，现在每隔半小时就要回应一次智能体的问询。开发者不被工位绑住，却被智能体的进度条绑住。智能体越能干、跑得越快，开发者要做判断的频次就越高。第三层，注意力结构。过去写代码要进入flow状态，连续输出几十分钟乃至几小时。现在的模式是碎片化决策：给智能体一段方向，等结果，再校准，再派下一步。开发者从「亲自下场踢球的球员」，变成了「场边的教练」。球员靠训练量堆能力，教练靠判断、经验、阅读比赛。两件事的核心能力并不相同。这套新工作流里，受益最大的是三类人。独立开发者：一个人也能并行四五个项目，资源杠杆被放到极致。精力上限的瓶颈被智能体打开，新的瓶颈转移到判断力和方向感。小团队：把智能体当低成本的「虚拟工程师」，三五个人加上一组智能体，能撑起的业务量级在过去需要约20人的团队。大厂工程师：从重复编码里抽出的精力，转去做架构设计、跨团队对齐、码审查这些智能体还不太擅长的事。资深工程师的价值被放大，初级工程师面临的挑战会更现实。开发者的能力门槛没有变低，只是技能权重换了。「写代码」在工作占比里的权重在下降，「定义任务、监督质量、判断方向」的权重在上升。能拿这套工作流跑出5倍产能的人，会比只会埋头写代码的人值钱很多。这一步棋