Token经济学：AI时代的新货币战争

文 | 硅谷101 在硅谷，有了一种新的炫富方式——每天烧了多少token。对于这个炫富方式，现在有一个新词叫：Token-maxxing，意思是“把token用量拉到极限”。它变成了公司内外人们攀比的新方式：你每天消耗多少token、你能同时调度多少个agent运行、你的token throughput（吞吐量）有多高，这些都正在变成衡量一个人“有多AI原生”的新指标。不过，对于这种新竞赛，全球AI圈的巨头们正在进行着一场激烈的辩论：公司是否应该不设限制地鼓励员工们去使用token？而在这场辩论的背后，是一场围绕token展开的新军备竞赛。硅谷大厂们为什么在疯狂卷token用量，这背后到底有没有道理？大模型公司是怎么给token定价的？中国模型如何凭借“物美价廉”杀入全球开发者市场，在OpenRouter上霸榜？“Token套利”的新模式，怎么来赚差价？以及在所有这些背后，一个更大的问题：中国的token出海，会不会成为下一个结构性的产业机会？如果上一个时代中国出口的是衬衫，这个时代是电动车，下一个时代会是token吗？ Token-maxxing之辩：用得越多就越好吗？ 4月初，Meta被爆内部有一个名为“Claudeonomics”排行榜，这个排行榜汇集了超过85000名Meta员工的AI使用数据，列出了token消耗量最高的前250名“超级用户”。在最近一个月，排行榜上的总使用量突破了60万亿token，如果按照Anthropic Opus 4.6的定价，大约每百万token平均15美元来粗略换算的话，这些token的价值高达约9亿美元。排名第一的那位员工，烧掉的token价值高达数百万美元。这个消息曝光之后，立马在硅谷引发了一场大辩论。 AI创业公司Writer的CEO May Habib，直接说这是“生死存亡级别的问题”。她自己公司内部也有一个token消耗排行榜，而且她明确告诉员工，她本人在盯这个数据。她认为如果不全力拥抱AI，就会被淘汰。 Uber也很激进。目前Uber后端系统中，11%的新代码更新已经由agent完成，而三个月前这个比例还不到1%。Uber CTO的原话很直白：“我的愿景是把软件工程转型为agent软件工程。” 但反对Token-maxxing的声音同样尖锐。 HubSpot的CEO Yamini Rangan，在LinkedIn上发了一句被广泛转发的话：“Outcome maxxing>>token maxxing”。意思是，比起疯狂消耗token，不如看看你产出了什么结果。她代表了另一种重要观点：纯粹的token使用量，是一个错误的指标。 AI软件工程公司Jellyfish的CEO Andrew Lau，说得更直白：“你可以一天到晚刷token，但得到的结果可能完全不是你想要的。” 这两派的吵得不可开交。但更多的中间派似乎还是形成了共识：不充分利用AI的公司，会被竞争对手超越并变得过时。在这种信念下，哪怕排行榜和激励制度不完美，哪怕一些AI使用最终被证明是浪费的，大厂创始人和高层们也被卷起来了，认为必须要这样做才能让公司转型成为更AI-native（AI原生）的公司。自OpenClaw爆火以来，agent任务烧掉的token量直线上升。科技巨头们可以不顾成本的烧token，但对于创业公司和个人开发者来说，token的成本带来的是焦虑。 Nathan Wang 资深AI Agent开发者比如像OpenClaw，你可能跑一个任务，稍微复杂一点，几千万的token量都是非常有可能的。钱宇靖 GMI Cloud工程主管如果你去跑一个最贵的Claude的模型，你可能让它做一个很小的事情就要花十几二十刀，这是真的有点贵。 Uber的CTO在接受采访时透露，公司2026年的AI预算在开年几个月内就已经全部用完了，主要是因为工程师们对Claude Code的使用量暴增。他的原话是：“我得重新回去做预算了，因为我以为够用一年的钱，已经没了。” 硅谷知名投资人Chamath Palihapitiya最近也公开抱怨，他投资的一家软件公司自从团队开始用AI编程工具后，运营成本在几个月内翻了三倍多，照这个趋势年化AI支出将达到千万美元级别。他半开玩笑地说了一句在社交媒体上广为流传的话：感谢VC们掏钱为这场AI盛宴买单。可以看到，对于企业来说，特别是软件SaaS行业，AI时代的成本结构跟过去完全不一样了。以前做一个SaaS产品，研发投入是一次性的，用户越多边际成本越低，这是一门越卖越赚的生意。但现在，每个用户的每一次操作背后都有一笔token账单在跑，用户用得越深、功能越智能，作为产品方，反而要付更多钱给模型厂商。这个成本不会像传统软件那样摊薄到接近零，它是跟着用量线性增长的。这也是为什么token正在变成AI创业公司最核心的“弹药”，也有风投基金开始尝试直接给被投企业提供token额度，作为投资的一部分。这个逻辑很简单：对很多AI创业项目来说，拿到钱之后第一件事就是去买token，那为什么不直接给token呢？顺着这个逻辑来讲，是不是token正在变成一种新的货币？那token又到底是如何定价的呢？拆解Token账单，大模型公司到底怎么算钱？ Token的定价是怎么算的？这个问题的答案，远不是“一个单价乘以数量”这么简单。我们以一次最简单的对话交互为例，你的账单上至少有三种不同价格的token在运转：第一是Input token（输入token），也就是你发给模型的内容。第二是Cached input token（被缓存的输入 token），意思是如果某些prompt、上下文或文件内容之前已经被模型系统缓存过，再次调用时，这部分token的价格会更便宜。第三是Output token（输出token），也就是模型生成回答时产生的token。研究芯片与token efficiency（词元效率）方向的肖志斌在接受硅谷101采访时就说，平均来说，在对话任务上，这三者的价格大概是：1:0.1:6的水平。肖志斌 ZFLOW AI创始人&CEO、华美半导体协会前主席与董事会顾问如果是对话类应用，调用就比较简单。你喂给它的input context（输入上下文）、你提供的上下文和文件，这一部分都作为input。如果你提供的prompt已经在缓存里被缓存过，那这个成本基本上就是input token成本的1/10。然后最后输出的成本，就是output token的成本，基本上是input token成本的6倍，这是OpenAI目前的情况。不同公司根据模型的能力给出的定价是不同的。举个例子，GPT-5的API价格上，Input是每百万token 1.25美元，Cached input是每百万token 0.125美元，Output token是每百万token 10美元。而OpenAI发布的最新模型GPT-5.5，分了长短上下文两档，长上下文的价格是2倍。短上下文Input是每百万token 5美元，Cached input是每百万token 0.5美元，Output token是每百万token 30美元。如果直接对比价格的话，是不是