智能AI morning

奥特曼亲推!400万周活Codex杀入移动端,码农不用再死守电脑了

2026-05-16 1 阅读 新智元
新智元报道 编辑:元宇 【新智元导读】 400万周活的Codex,被OpenAI装进手机了!OpenAI官宣,Codex进入ChatGPT手机App,开发者离开电脑,也可以用手机随时审批命令、调整方向,指挥智能体继续跑活。 程序员把任务扔给Codex,自己就可以出门喝咖啡了? 刚刚,OpenAI把Codex装进了手机:Codex已进入ChatGPT手机App预览版, 面向iOS和Android全量开放,覆盖所有套餐,包括免费版和Go用户。 OpenAI官方预告语说,用户期待这项功能已经很久了。奥特曼也发帖亲推:这是ChatGPT移动应用中的Codex! 从此,开发者变身24小时AI监工: 离开电脑,也可以通过手机看进度、审diff (代码变更对比) 、批命令,智能体在电脑、devbox或远程环境里继续跑。 https://openai.com/index/work-with-codex-from-anywhere/ 正如OpenAI官方博客所言,「你可以随时随地和Codex一起工作」:移动端Codex的推出,呼应了AI编程长时任务带来的需求。 过去,写代码是人坐在机器前输入指令的过程。现在,Codex每周有超过400万名开发者在使用, Codex 处理的已经是长达数小时乃至数天的任务。 智能体在跑,人在别处,异步审批正逐渐成为常态。 当智能体跑到岔路口,需要一个判断,而你在咖啡馆、在通勤、在开会,这正是Codex移动端要解决的问题:让你在任何地方都能给智能体一个指令,让它能继续跑任务。 手机是遥控器 开发环境一直在电脑里 很多人看到「Codex进手机」,第一反应是:以后可以在手机上写代码了? 并非如此。 OpenAI的产品逻辑是这样的:Codex继续运行在你的电脑、Mac mini、公司devbox,或者公司远程开发环境里。文件、凭证、权限、本地配置,这些东西并不会搬到手机上。 ChatGPT手机端菜单已出现Codex入口 手机端能做的,是作为控制面板:查看所有活跃线程、审查智能体的输出、批准它申请执行的命令、切换使用的模型、开启一个新任务。 与此同时,智能体的实时状态会推送到手机上,包括截图、终端输出、diff、测试结果,以及需要人工介入的审批请求。 底层是一套安全中继层(secure relay layer)。它让你的主机可以跨设备被访问,但不直接暴露在公网上。 设置流程也相对直接:在macOS Codex App里开启远程访问,扫二维码,ChatGPT手机App完成连接。 咖啡店、地铁、午餐桌、多任务监督 四个正在被改写的场景 场景一, 咖啡店里审diff 。 早上派下去的几个任务,到点查一下进度,diff一目了然。某段改动方向不对,在手机上敲两句注释回过去,智能体收到就接着调整。 开发者人不在工位,代码却没停下来。 一杯咖啡的时间,三个PR的进展全部回顾完,必要的反馈都已经发出去。 场景二, 通勤路上改方向 。 智能体跑到一半卡在某个不熟的API上,主动给开发者发问询。地铁里看一眼,回复「用X库的Y方法」,智能体拿到答案继续跑。 决策的颗粒度变细了:开发者不再亲自写代码,但持续在校准方向。一段30分钟的通勤,原来是无法转化成产出的纯消耗时间,现在能消化掉两到三个智能体的关键决策点。 场景三, 午餐时塞个新想法 。 吃饭刷动态时冒出一个产品idea,掏出手机派给智能体「先做个原型出来」。等下午回工位,已经有可看的提交记录在等着。从想法到代码的转化路径被压短了,原来需要一个晚上,现在压缩到一顿饭。 场景四, 多任务并行监督 。 同时三四个智能体在不同任务上跑,开发者用手机切换审阅。工作方式从「一次写一个项目」换成了「一次监督一组工程」。一个人手里同时挂着四五条线,每条线都在推进。每个智能体独立工作,开发者只在关键节点出现。 四个场景指向同一件事:开发者的输入从「代码」换成了「判断」。 手机够用,是因为输入的内容本来就不需要键盘和大屏。两句注释、一个方法名、一个「继续」或「重做」,这些是手机最擅长的输入形态。 手机批代码,风险也需知道 在手机上审批智能体任务,也可能带来更高的错误风险。 小屏幕、多任务场景下, 注意力质量很难匹配开发决策的要求。 这并非小题大做。Codex在手机上等待批准的,往往并非普通的操作:shell命令要不要执行、两条重构路径走哪一条、一个权限申请批不批。 这些判断在桌面IDE前可以放大窗口、对照上下文、反复确认。在通勤途中,很可能就是瞥一眼、划一下。 OpenAI在安全设计上做了一些应对:Hooks支持扫描提示词中的敏感信息、运行命令验证器;企业用户有权限管理和审计日志;Codex默认沙箱运行,需要更高权限时会主动申请。 但工具的设计再完善,移动端审批本质上也是在把关键决策点搬进了碎片化注意力的场景。 如何平衡便利性和严谨性之间的矛盾,仍是一个有待解决的问题。 开发者从踢球的人变成了场边教练 手机审批只是表象。 OpenAI在2月的Codex App发布中写过一句话:核心挑战已经 从「智能体能做什么」,转变成「人如何在更大规模上指挥和监督智能体」 。 手机端是这句话的一个落地,背后是整套工作流的重塑,有三层东西同时在被解构。 第一层,时间。 过去,开发者的产出很大程度上受限于在场时间:人离开键盘,代码推进也往往随之暂停。现在,Codex可以在主机、devbox或远程开发环境中持续运行,开发者不必始终守在屏幕前,只需要在关键节点介入判断、审批和纠偏。 当一个开发者手里同时挂着多个智能体任务时,工作流的瓶颈会从「亲自敲代码」转向「拆解任务、判断方向、审查质量」。 这并不等于线性获得数倍人工编码时长,但确实会把原本容易空转的等待时间利用起来,也让单个开发者能够管理更多并行任务。 产能的天花板,正在被重新定义。 第二层,空间。 决策可以发生在任何有4G信号的地方,但空间被解构并不等于「程序员变自由了」,决策密度反而在上升:原来一天写6小时代码,现在每隔半小时就要回应一次智能体的问询。 开发者不被工位绑住,却被智能体的进度条绑住。智能体越能干、跑得越快,开发者要做判断的频次就越高。 第三层,注意力结构。 过去写代码要进入flow状态,连续输出几十分钟乃至几小时。现在的模式是碎片化决策:给智能体一段方向,等结果,再校准,再派下一步。 开发者从「亲自下场踢球的球员」,变成了「场边的教练」。球员靠训练量堆能力,教练靠判断、经验、阅读比赛。两件事的核心能力并不相同。 这套新工作流里,受益最大的是三类人。 独立开发者:一个人也能并行四五个项目,资源杠杆被放到极致。精力上限的瓶颈被智能体打开,新的瓶颈转移到判断力和方向感。 小团队:把智能体当低成本的「虚拟工程师」,三五个人加上一组智能体,能撑起的业务量级在过去需要约20人的团队。 大厂工程师:从重复编码里抽出的精力,转去做架构设计、跨团队对齐、码审查这些智能体还不太擅长的事。资深工程师的价值被放大,初级工程师面临的挑战会更现实。 开发者的能力门槛没有变低,只是技能权重换了。 「写代码」在工作占比里的权重在下降,「定义任务、监督质量、判断方向」的权重在上升。 能拿这套工作流跑出5倍产能的人,会比只会埋头写代码的人值钱很多。 这一步棋