智能AI morning

Codex跑了22小时,真赚16.88美元:奥特曼预言的「AI打工人」来了

2026-05-12 1 阅读 新智元
新智元报道 编辑:元宇 【新智元导读】 一条「去GitHub上赚5美元」的指令,Codex跑了22小时,几天后带回16.88美元。钱不多,但如果Chris的复盘属实,AI第一次独立走完了找活、写代码、提PR、收款的完整闭环:AI会替你赚钱,这可能是第1单。 这个故事看起来,像是Codex第一次摸到「工资单」。 本周末,一位名叫Chris的开发者在X上发了一条帖子: 他只给Codex丢下一条「去挣5美元」的指令,接下来的22小时,Codex自己找到了一个开源安全审计的赏金路径,完成并提交了PR,跟进了维护者。 几天后,16.88美元到账。 Chris随即算了一笔账:如果每天重复,月化收入506.40美元。 帖子发出后,开发者圈炸锅了。 有人说「AI打工人的第一单来了」, Chris本人在帖子里激动宣称,这让他「看到了奥特曼关于AI替你赚钱的愿景开始成真」。 奥特曼曾在个人博客中预言,2025年可能看到第一批AI智能体「加入劳动力大军」,并实质性改变公司产出。 Chris这次实验,被他本人视作这一预言的早期验证。 它是怎么挣到这16.88美元的 根据Chris在X平台公布的流程,整个时间线应该是这样的: 起点是一道极简指令,Chris对Codex说:去GitHub上找活赚钱,目标5美元。 收到这条极简指令之后, Codex 定位到一个bounty(赏金)平台,但它具体如何定位任务、是否借助额外工具或人工配置,目前没有公开日志可核验。 接了活后是做活:读代码、改代码、提交拉取请求(PR)。 这是 Codex 过去几年最被验证的能力,也是它最擅长的。 然后是沟通:和维护者来回回复评论,这是过去AI智能体最容易翻车的环节。Codex这一轮也完成了,最终PR被合并。 按Chris的复盘,PR合并和验证流程完成几天后,他收到了16.88美元付款。 虽然Chris公开了收款截图和部分对话记录截图,整个流程的细节,仍缺乏第三方独立验证,但这并不影响这个故事的主线。 Codex的能力边界,OpenAI官方已经写清楚了,将它 定义为「基于云端的软件工程智能体」。 用户输入任务指令后,Codex在后台并行处理多项任务,每条对应一个代码改动或PR。https://openai.com/zh-Hans-CN/index/introducing-codex/ 它可以读取和编辑文件,运行测试框架、代码检查工具和类型校验器,提交代码改动,并开启GitHub的拉取请求供审查。 也就是说,「写代码→运行测试→提PR→留日志」这条链路,Codex官方层面已经打通。 Chris说Codex「找到了一个开源安全审计赏金路径」, OpenAI推出了Codex Security功能,专门面向工程和安全团队,可以逐次提交扫描连接的GitHub仓库,在隔离环境中验证高可信度的安全漏洞。 Chris所称的「安全审计赏金路径」,和这条产品线的能力描述方向完全吻合。 但这里有一个关键前提被很多人忽略了。 Codex在agent执行阶段,默认关闭互联网访问。Codex云端文档明确写道: 默认情况下,Codex在智能体执行阶段阻断互联网访问。安装脚本阶段仍有网络权限,以便安装依赖;用户可以按需为每个环境手动开启agent互联网访问。 这是一个核心约束。 开启之后呢?OpenAI列出了一串风险:来自不可信网络内容的提示词注入(prompt injection)、代码或密钥外泄、下载恶意依赖、拉取含有许可限制的内容。 所以如果Chris描述的事情真的发生了,Codex能「找到bounty路径」,可能是他主动开启了互联网访问,或是是Codex通过GitHub、浏览器、MCP或其他工具组合完成了这个动作。 这是「模型+工具+权限+网络」的组合产物,并非模型的裸能力。这也说明,Codex在特定条件下,具备「找漏洞→提PR→跟进审查」这条链路的技术能力。 这笔账没那么好算 再来算一笔账。 Chris说,这次总共跑了约10-15个安全审计项目,消耗了22M tokens。16.88美元,是第一个「亮绿灯」并到账的项目。后面还有多个pending audits等待确认。 OpenAI API公开定价页面显示,GPT-5.5的输出定价是每100万tokens 30美元,输入是每100万tokens 5美元。Chris本人也在跟帖中引用了这个 tokens 价格,并用它来推算未来的利润空间。 但Codex作为产品本身,有基于ChatGPT Pro、Team、Enterprise等订阅计划的任务额度限制,实际消耗逻辑跟API裸计费完全不同。 Chris没有公开22M tokens里输入和输出各占多少,也没说他是通过订阅配额用的、还是直接走API。任务失败率、重试成本、人工排查时间也没有提到。 他的真正逻辑,不在于核算现有盈利,他押注的是未来 模型成本每年降10倍,这条闭环会越来越便宜地被跑通,他在跟帖里说: 你们为什么要假设我花了很多钱?GPT-5.5现在输出是30美元/百万tokens,明年会降到2美元,那时候双方都会暴赚。 因此,这 16.88美元,目前更像一个「有东西跑通了」的实验信号,而不是一种可以复制的商业模式。 GitHub已经把路修好了 这并非Codex独自的功劳,如果把这一单背后所有的动作拆解来看:找活、做活、沟通、收款,每一步GitHub都悄悄铺好了路。 Agent HQ GitHub给AI开工位 今年2月,GitHub把Claude和OpenAI Codex接入Agent HQ,并以public preview形式向Copilot Pro+和Enterprise用户开放,这好比GitHub给AI开的工位。 GitHub Agent HQ智能体选择界面,Copilot、Claude、Codex及自定义智能体均可被分配编程任务。 GitHub官方对此的描述是: 智能体默认异步运行。你可以实时跟踪进度,也可以事后审查已完成的session,查看详细日志,了解智能体做了什么、为什么这么做。 这意味着,以前你把任务分配给初级工程师,现在这个「初级工程师」的角色,也可以是一个编程智能体,这正是GitHub在系统层面认可并推进的工作流方向。 四个关键接口 把Codex这次走过的流程对应回GitHub已经铺好的能力,会更清楚: 第一,找活的接口。GitHub有现成的issue、PR、仓库上下文和Agents tab;至于bounty任务,则更多依赖Algora、IssueHunt等第三方平台或项目自身机制。智能体不用爬全网,去这几个地方就能找到结构化的「活」。 第二,做活的接口。仓库读写权限、Codespaces沙箱环境:智能体可以在GitHub自己提供的隔离环境里克隆、改、跑测试,不用自己搭基础设施。 第三,沟通的接口。PR review通道、@提及机制、评论线程:智能体收到评论后能精确知道是谁在回它、回的是PR里的哪一段代码。 第四,收款的接口。bounty平台Algora、IssueHunt已经与GitHub issue工作流打通,Algora平台可以实现PR合并自动结算,收款这一步不再是「得另外接Stripe写一堆代码」。 四个接口分别看都不是新东西,但当它