30天烧掉60万亿，扎克伯格没进前250：大厂AI沦为KPI游戏

新智元报道【新智元导读】亚马逊给员工的AI工具装了计量器，官方说不考核，经理盯着排行榜不放。Meta内部榜单30天烧掉60万亿token，扎克伯格没进前250。然而Jellyfish数据打脸：刷10倍token，产出只多了1倍。谁在为这场荒诞游戏推波助澜？硅谷大厂，开始流行用token摸鱼了？英国《金融时报》近日报道，亚马逊的一些员工，正坐在工位上让一个叫MeshClaw的内部AI工具，跑那些根本没必要的任务。他们不是在搞实验，也不是赶项目，而是在刷token。 MeshClaw能发邮件、处理Slack、部署代码，是一个真正可以「代劳」的AI智能体。据报道，亚马逊还给它配了一张内部排行榜，实时追踪每位员工的token消耗量，目标是超过80%的开发者每周都在用AI。 3名知情人士透露，部分员工随即找到了新的生存策略：用MeshClaw跑没有必要的任务，专门为了拉高榜单上的数字。在硅谷，这个行为有了专属名词：tokenmaxxing（疯狂刷AI用量）。亚马逊说token数据不用于绩效评估。但据报道，多名员工并不相信，有人直言感受到「很大压力」，而且不只是要用AI，还要用得「最多」。亚马逊不是唯一一家。Meta内部排行榜「Claudeonomics」（Claude经济学）过去一个月烧了60万亿token，扎克伯格本人都没排进前250。这是2026年5月，全球最有钱的几家公司同时进入了一种新的工作状态。大厂AI开始沦为一种KPI游戏。 Jassy的备忘录员工读出了另一层意思 MeshClaw是亚马逊给员工的AI入口，它背后接的是Claude。亚马逊推AI的力度有目共睹。据报道，公司设定了一个内部目标：超过80%的开发者每周必须用上AI工具，并配套上线了内部排行榜，追踪每个人的token消耗量。初衷当然是好的，但一到员工手里就变形了。问题也不全在员工这里，token焦虑的源头其实还在公司最高层。 2025年6月，亚马逊CEO Andy Jassy向全体员工发出了一封公开备忘录，直接建议员工「只要有机会，就去使用和实验AI」。他还写道，那些拥抱AI转变的人，将「处于更有利的位置，产生高影响力」。 https://www.aboutamazon.com/news/company-news/amazon-ceo-andy-jassy-on-generative-ai Jassy的备忘录中，「对AI保持好奇……只要有机会就用AI、试AI」这句话被员工读出了另一层意思： tokenmaxxing 。 Jassy在备忘录中将「拥抱AI」与「产生高影响力」直接挂钩，让每一个普通员工陷入一种token焦虑：我现在的AI使用量，够不够？更关键的是，Jassy还在同一封备忘录里写明：未来几年，随着在公司范围内广泛使用AI，亚马逊预计企业员工规模将下降。亚马逊官方表示token数据不会用于绩效评估，但据员工透露，经理仍然在盯着排行榜。在这种氛围不言而喻：谁的token用得多，谁就更安全。于是，本来不需要AI的活儿，也要丢给AI跑一遍，为的就是让榜单上的数字好看。这正是互联网OKR体系下经典的反向打卡，员工在跟一个量化指标博弈。 Meta 更离谱，CTO 亲自喊「刷」 Meta，在同一周也被《The Information》曝光了内部AI排行榜。一位叫Ash Bhat的员工独立搭了个名为「Claudeonomics」的工具，该仪表盘追踪约8.5万名员工的token使用量，并以排行榜形式展示，30天累计消耗60万亿token，单个顶级用户烧了2810亿token。有趣的是，扎克伯格本人没进前250，CTO Andrew Bosworth也没进。排行榜被媒体报道之后，作者主动把它下线了。但Bosworth随即在Forbes上公开站台：公司最优秀的工程师，花掉相当于自己一年工资的token，效率却提升了5到10倍。「这就像白送钱，继续刷，不设上限。」无论是员工被迫，还是CTO真心鼓励，亚马逊和Meta这两家全球最有钱的公司，都已经把 tokenmaxxing 变成了一种企业文化。也不只这些知名大厂，企业AI平台公司Writer的CEO May Habib在接受《华尔街日报》采访时，坦率承认了三件事：token是可以被「刷」的指标，员工会用公司平台做私人项目，并非每一个token都在创造商业价值。这些她全知道，但她的态度仍然是要推：一旦你开始计算单个智能体行为的投资回报率，你就永远不会真正用起来了。 Writer内部排行榜的月度冠军消耗量接近110亿token，亚军超过60亿。Habib公开表示自己在盯着这张榜看。红杉资本合伙人Sonya Huang更是直言：「我们都应该tokenmaxxing。」 Huang说，排行榜是个不完美的指标，她承认，「但对你的公司来说真正重要的问题是：我的员工有没有彻底转变成AI原住民？要做到这一点，你需要让他们进入这种tokenmaxxing的状态。」所以争论的本质并非「榜单好不好」，而是在什么规模和阶段、对谁有效。对Writer这样几十人的初创，CEO亲自盯榜点名表扬，那是文化信号，效果直接。对Jellyfish追踪的12000名开发者，token榜变成了一个大家都知道在玩、但都不愿明说的游戏。而亚马逊有数十万名员工，游戏的规模完全不同，副作用也完全不同。 10倍token 只换来2倍产出很快，就有数据来打脸这种token榜单的刷榜行为。工程智能公司Jellyfish对12000名开发者、200家企业的Q1 2026数据做了分析。他们得出一个扎心数据：最高使用层的开发者在每个PR上消耗的token约为中位数的10倍，但PR吞吐量只达到约2倍左右。烧了10倍的油，只跑了2倍的路。 Jellyfish数据：token用量最高组产出是最低组的2.8倍，但每PR消耗token相差近千倍。烧更多token，换来的产出远不成比例。成本数字则更是刺眼。 Jellyfish用Claude API公开定价做了估算：中位数开发者每月在AI编程上花约52美元；到了90百分位的高用量用户，这个数字跳到691美元。每条PR的token成本，从最低用量层的0.28美元，直接飙升到最高用量层的89.32美元。同一项工作，有人花了0.28美元完成，有人花了89美元，而且后者做出来的也并没有好多少。 Jellyfish的AI研究负责人Nicholas Arcolano直言：「CFO已经开始追责了。客户愿意为AI花钱，但不能不拿出负责任花费的证明。」他还举了一个看似高效、实则荒诞的例子：我让五个AI智能体各自做一个版本，然后挑最好的。大量工作被扔掉。可能整体上还是比人做便宜，但比直接做一次贵多了。工程分析平台Faros.ai上关于22000名开发者的数据，刚好补上了故事的另一半。 AI工具确实让代码产出提速了：任务完成量上升34%，完整功能模块（epic）交付量上升66%。但同期，每位开发者的bug数量增加了54%，代码审查时间升至约5倍，代码返工率（code churn，即删除行与新增行之比）在高AI采用环境下上升了惊人的861%。指标

订阅66必读