智能AI
morning
30天烧掉60万亿,扎克伯格没进前250:大厂AI沦为KPI游戏
2026-05-25
1 阅读
新智元
新智元报道 【新智元导读】 亚马逊给员工的AI工具装了计量器,官方说不考核,经理盯着排行榜不放。Meta内部榜单30天烧掉60万亿token,扎克伯格没进前250。然而Jellyfish数据打脸:刷10倍token,产出只多了1倍。谁在为这场荒诞游戏推波助澜? 硅谷大厂,开始流行用token摸鱼了? 英国《金融时报》近日报道,亚马逊的一些员工,正坐在工位上让一个叫MeshClaw的内部AI工具,跑那些根本没必要的任务。 他们不是在搞实验,也不是赶项目,而是在刷token。 MeshClaw能发邮件、处理Slack、部署代码,是一个真正可以「代劳」的AI智能体。据报道,亚马逊还给它配了一张内部排行榜,实时追踪每位员工的token消耗量,目标是超过80%的开发者每周都在用AI。 3名知情人士透露,部分员工随即找到了新的生存策略:用MeshClaw跑没有必要的任务,专门为了拉高榜单上的数字。 在硅谷,这个行为有了专属名词:tokenmaxxing(疯狂刷AI用量)。 亚马逊说token数据不用于绩效评估。但据报道,多名员工并不相信,有人直言感受到「很大压力」,而且不只是要用AI,还要用得「最多」。 亚马逊不是唯一一家。Meta内部排行榜「Claudeonomics」 (Claude经济学) 过去一个月烧了60万亿token,扎克伯格本人都没排进前250。 这是2026年5月,全球最有钱的几家公司同时进入了一种新的工作状态。大厂AI开始沦为一种KPI游戏。 Jassy的备忘录 员工读出了另一层意思 MeshClaw是亚马逊给员工的AI入口,它背后接的是Claude。 亚马逊推AI的力度有目共睹。据报道,公司设定了一个内部目标:超过80%的开发者每周必须用上AI工具,并配套上线了内部排行榜,追踪每个人的token消耗量。 初衷 当然是好的,但一到员工手里就变形了。问题也不全在员工这里,token焦虑的源头其实还在公司最高层。 2025年6月,亚马逊CEO Andy Jassy向全体员工发出了一封公开备忘录,直接建议员工「只要有机会,就去使用和实验AI」。他还写道,那些拥抱AI转变的人,将「处于更有利的位置,产生高影响力」。 https://www.aboutamazon.com/news/company-news/amazon-ceo-andy-jassy-on-generative-ai Jassy的 备忘录中,「对AI保持好奇……只要有机会就用AI、试AI」这句话被员工读出了另一层意思: tokenmaxxing 。 Jassy在 备忘录中将「拥抱AI」与「产生高影响力」直接挂钩,让每一个普通员工陷入一种token焦虑:我现在的AI使用量,够不够? 更关键的是,Jassy还在同一封备忘录里写明:未来几年,随着在公司范围内广泛使用AI,亚马逊预计企业员工规模将下降。 亚马逊官方表示token数据不会用于绩效评估,但据员工透露,经理仍然在盯着排行榜。在这种氛围不言而喻:谁的token用得多,谁就更安全。 于是,本来不需要AI的活儿,也要丢给AI跑一遍,为的就是让榜单上的数字好看。 这正是 互联网OKR体系下经典的反向打卡,员工在跟一个量化指标博弈。 Meta 更离谱,CTO 亲自喊「刷」 Meta,在同一周也被《The Information》曝光了内部AI排行榜。 一位叫Ash Bhat的员工独立搭了个名为「Claudeonomics」的工具,该仪表盘追踪约8.5万名员工的token使用量,并以排行榜形式展示,30天累计消耗60万亿token,单个顶级用户烧了2810亿token。 有趣的是,扎克伯格本人没进前250,CTO Andrew Bosworth也没进。 排行榜被媒体报道之后,作者主动把它下线了。但Bosworth随即在Forbes上公开站台:公司最优秀的工程师,花掉相当于自己一年工资的token,效率却提升了5到10倍。「这就像白送钱,继续刷,不设上限。」 无论是员工被迫,还是CTO真心鼓励,亚马逊和Meta这两家全球最有钱的公司,都已经把 tokenmaxxing 变成了一种企业文化。 也不只这些知名大厂, 企业AI平台公司Writer的CEO May Habib在接受《华尔街日报》采访时,坦率承认了三件事:token是可以被「刷」的指标,员工会用公司平台做私人项目,并非每一个token都在创造商业价值。 这些她全知道,但她的态度仍然是要推: 一旦你开始计算单个智能体行为的投资回报率,你就永远不会真正用起来了。 Writer内部排行榜的月度冠军消耗量接近110亿token,亚军超过60亿。Habib公开表示自己在盯着这张榜看。 红杉资本合伙人Sonya Huang更是直言:「我们都应该tokenmaxxing。」 Huang说,排行榜是个不完美的指标,她承认,「但对你的公司来说真正重要的问题是:我的员工有没有彻底转变成AI原住民?要做到这一点,你需要让他们进入这种tokenmaxxing的状态。」 所以争论的本质并非「榜单好不好」,而是在什么规模和阶段、对谁有效。 对Writer这样几十人的初创,CEO亲自盯榜点名表扬,那是文化信号,效果直接。 对Jellyfish追踪的12000名开发者,token榜变成了一个大家都知道在玩、但都不愿明说的游戏。 而亚马逊有数十万名员工,游戏的规模完全不同,副作用也完全不同。 10倍token 只换来2倍产出 很快,就有数据来打脸这种token榜单的刷榜行为。 工程智能公司Jellyfish对12000名开发者、200家企业的Q1 2026数据做了分析。 他们得出一个扎心数据: 最高使用层的开发者在每个PR上消耗的token约为中位数的10倍,但PR吞吐量只达到约2倍左右。 烧了10倍的油,只跑了2倍的路。 Jellyfish数据:token用量最高组产出是最低组的2.8倍,但每PR消耗token相差近千倍。烧更多token,换来的产出远不成比例。 成本数字则更是刺眼。 Jellyfish用Claude API公开定价做了估算:中位数开发者每月在AI编程上花约52美元;到了90百分位的高用量用户,这个数字跳到691美元。 每条PR的token成本,从最低用量层的0.28美元,直接飙升到最高用量层的89.32美元。 同一项工作,有人花了0.28美元完成,有人花了89美元,而且后者做出来的也并没有好多少。 Jellyfish的AI研究负责人Nicholas Arcolano直言:「CFO已经开始追责了。客户愿意为AI花钱,但不能不拿出负责任花费的证明。」 他还举了一个看似高效、实则荒诞的例子: 我让五个AI智能体各自做一个版本,然后挑最好的。大量工作被扔掉。可能整体上还是比人做便宜,但比直接做一次贵多了。 工程分析平台Faros.ai上关于22000名开发者的数据,刚好补上了故事的另一半。 AI工具确实让代码产出提速了:任务完成量上升34%,完整功能模块(epic)交付量上升66%。但同期,每位开发者的bug数量增加了54%,代码审查时间升至约5倍,代码返工率(code churn,即删除行与新增行之比)在高AI采用环境下上升了惊人的861%。 指标