智能AI morning

Token经济学:AI时代的新货币战争

2026-05-17 1 阅读 硅谷101
文 | 硅谷101 在硅谷,有了一种新的炫富方式——每天烧了多少token。 对于这个炫富方式,现在有一个新词叫:Token-maxxing,意思是“把token用量拉到极限”。它变成了公司内外人们攀比的新方式:你每天消耗多少token、你能同时调度多少个agent运行、你的token throughput(吞吐量)有多高,这些都正在变成衡量一个人“有多AI原生”的新指标。 不过,对于这种新竞赛,全球AI圈的巨头们正在进行着一场激烈的辩论:公司是否应该不设限制地鼓励员工们去使用token? 而在这场辩论的背后,是一场围绕token展开的新军备竞赛。硅谷大厂们为什么在疯狂卷token用量,这背后到底有没有道理?大模型公司是怎么给token定价的?中国模型如何凭借“物美价廉”杀入全球开发者市场,在OpenRouter上霸榜?“Token套利”的新模式,怎么来赚差价?以及在所有这些背后,一个更大的问题:中国的token出海,会不会成为下一个结构性的产业机会?如果上一个时代中国出口的是衬衫,这个时代是电动车,下一个时代会是token吗? Token-maxxing之辩:用得越多就越好吗? 4月初,Meta被爆内部有一个名为“Claudeonomics”排行榜,这个排行榜汇集了超过85000名Meta员工的AI使用数据,列出了token消耗量最高的前250名“超级用户”。 在最近一个月,排行榜上的总使用量突破了60万亿token,如果按照Anthropic Opus 4.6的定价,大约每百万token平均15美元来粗略换算的话,这些token的价值高达约9亿美元。排名第一的那位员工,烧掉的token价值高达数百万美元。 这个消息曝光之后,立马在硅谷引发了一场大辩论。 AI创业公司Writer的CEO May Habib,直接说这是“生死存亡级别的问题”。她自己公司内部也有一个token消耗排行榜,而且她明确告诉员工,她本人在盯这个数据。她认为如果不全力拥抱AI,就会被淘汰。 Uber也很激进。目前Uber后端系统中,11%的新代码更新已经由agent完成,而三个月前这个比例还不到1%。Uber CTO的原话很直白:“我的愿景是把软件工程转型为agent软件工程。” 但反对Token-maxxing的声音同样尖锐。 HubSpot的CEO Yamini Rangan,在LinkedIn上发了一句被广泛转发的话:“Outcome maxxing>>token maxxing”。意思是,比起疯狂消耗token,不如看看你产出了什么结果。她代表了另一种重要观点:纯粹的token使用量,是一个错误的指标。 AI软件工程公司Jellyfish的CEO Andrew Lau,说得更直白:“你可以一天到晚刷token,但得到的结果可能完全不是你想要的。” 这两派的吵得不可开交。但更多的中间派似乎还是形成了共识: 不充分利用AI的公司,会被竞争对手超越并变得过时。 在这种信念下,哪怕排行榜和激励制度不完美,哪怕一些AI使用最终被证明是浪费的,大厂创始人和高层们也被卷起来了,认为必须要这样做才能让公司转型成为更AI-native(AI原生)的公司。 自OpenClaw爆火以来,agent任务烧掉的token量直线上升。科技巨头们可以不顾成本的烧token,但对于创业公司和个人开发者来说,token的成本带来的是焦虑。 Nathan Wang 资深AI Agent开发者 比如像OpenClaw,你可能跑一个任务,稍微复杂一点,几千万的token量都是非常有可能的。 钱宇靖 GMI Cloud工程主管 如果你去跑一个最贵的Claude的模型,你可能让它做一个很小的事情就要花十几二十刀,这是真的有点贵。 Uber的CTO在接受采访时透露,公司2026年的AI预算在开年几个月内就已经全部用完了,主要是因为工程师们对Claude Code的使用量暴增。他的原话是:“我得重新回去做预算了,因为我以为够用一年的钱,已经没了。” 硅谷知名投资人Chamath Palihapitiya最近也公开抱怨,他投资的一家软件公司自从团队开始用AI编程工具后,运营成本在几个月内翻了三倍多,照这个趋势年化AI支出将达到千万美元级别。他半开玩笑地说了一句在社交媒体上广为流传的话:感谢VC们掏钱为这场AI盛宴买单。 可以看到,对于企业来说,特别是软件SaaS行业,AI时代的成本结构跟过去完全不一样了。以前做一个SaaS产品,研发投入是一次性的,用户越多边际成本越低,这是一门越卖越赚的生意。但现在,每个用户的每一次操作背后都有一笔token账单在跑,用户用得越深、功能越智能, 作为产品方,反而要付更多钱给模型厂商。这个成本不会像传统软件那样摊薄到接近零,它是跟着用量线性增长的。 这也是为什么token正在变成AI创业公司最核心的“弹药”,也有风投基金开始尝试直接给被投企业提供token额度,作为投资的一部分。这个逻辑很简单:对很多AI创业项目来说,拿到钱之后第一件事就是去买token,那为什么不直接给token呢? 顺着这个逻辑来讲,是不是token正在变成一种新的货币?那token又到底是如何定价的呢? 拆解Token账单,大模型公司到底怎么算钱? Token的定价是怎么算的?这个问题的答案,远不是“一个单价乘以数量”这么简单。我们以一次最简单的对话交互为例,你的账单上至少有三种不同价格的token在运转: 第一是Input token(输入token) ,也就是你发给模型的内容。 第二是Cached input token(被缓存的输入 token) ,意思是如果某些prompt、上下文或文件内容之前已经被模型系统缓存过,再次调用时,这部分token的价格会更便宜。 第三是Output token(输出token) ,也就是模型生成回答时产生的token。 研究芯片与token efficiency(词元效率)方向的肖志斌在接受硅谷101采访时就说,平均来说,在对话任务上,这三者的价格大概是:1:0.1:6的水平。 肖志斌 ZFLOW AI创始人&CEO、华美半导体协会前主席与董事会顾问 如果是对话类应用,调用就比较简单。你喂给它的input context(输入上下文)、你提供的上下文和文件,这一部分都作为input。如果你提供的prompt已经在缓存里被缓存过,那这个成本基本上就是input token成本的1/10。然后最后输出的成本,就是output token的成本,基本上是input token成本的6倍,这是OpenAI目前的情况。 不同公司根据模型的能力给出的定价是不同的。举个例子,GPT-5的API价格上,Input是每百万token 1.25美元,Cached input是每百万token 0.125美元,Output token是每百万token 10美元。 而OpenAI发布的最新模型GPT-5.5,分了长短上下文两档,长上下文的价格是2倍。短上下文Input是每百万token 5美元,Cached input是每百万token 0.5美元,Output token是每百万token 30美元。 如果直接对比价格的话,是不是