OpenAI博通联手发芯片，黄仁勋还能保持松弛吗？

文 | 字母AI 黄仁勋近年来的变化，就是头发比以前白了。有人说白头发是因为基因、岁数，也有一部分人认为，是因为焦虑、压力。 2026年5月，黄仁勋在斯坦福大学面向在校学生的公开演讲中说到，“我90％的工作都是硬撑，但任何工作，我都努力做到最好。” 实际上早在33年前，黄仁勋在采访中就曾表示过他自己的压力，黄仁勋说“英伟达距离倒闭只有30天。” 最近黄仁勋又多了一个头发变白的理由，那就是OpenAI和博通一起发布了Jalapeño芯片。这是OpenAI第一颗自研的推理芯片。从设计到流片只用了九个月，目标部署10GW，而且这颗芯片已经可以跑GPT-5.3了。 OpenAI跟Anthropic不一样，后者又有谷歌的TPU，又有亚马逊的Trainium。OpenAI此前一直是坚定的英伟达用户，现在有了Cerebras还不够，又和博通混到了一起。英伟达还在狂奔，但英伟达有敌人了 5月20日，英伟达公布了最新一个季度的财报。单季营收816亿美元，毛利率是74.9%，自由现金流接近490亿美元。数据中心收入752亿美元，同比增长92%。显然，英伟达仍然在春风得意。但现在的局面就是，英伟达正在被围攻。就拿博通来说吧，他们最近的财报就很亮眼。在最新一个季度里，公司AI半导体业务收入达到108亿美元，同比增长143%。而博通预计，2026财年这块业务的收入将达到约560亿美元，而上一个财年约为200亿美元。博通跟英伟达不一样，博通做的是ASIC，也就是“按客户需求定做的AI芯片”。客户想要什么芯片，它就帮客户专门做什么芯片。现在的AI算力不是一颗芯片在工作，而是几万、几十万颗芯片组成一个集群一起工作。模型训练时，芯片要不断交换参数；推理时，尤其是专家模型和长上下文任务，芯片之间也要频繁传数据。也就是说你芯片算得再快，如果网络跟不上，整个算力集群就会被最慢的通信环节拖住。这就是博通的优势了，博通本质上是一个通信公司。它除了做ASIC以外，还给它的客户做连接这些芯片的高速以太网交换芯片。比如博通最新的Tomahawk 6交换芯片，单颗交换能力达到102.4Tbps，面向的就是超大规模AI集群。OpenAI与博通的10GW合作公告里就明确写到，合作内容也不只包括定制AI加速器，还明确包括配套的Ethernet网络方案。还有一点，博通足够“中立”。这是很多人都会忽略的地方。无论是OpenAI也好，还是Anthropic也好，他们都不希望把自己的核心芯片计划交给另一家也在做大模型、做云服务的公司。而博通刚好不做模型、不卖云，它也不和客户抢最终用户。就是因为这层身份在，所以OpenAI和Anthropic才会都选择它。英伟达现在的对手可不只有博通，还有亚马逊。 AWS虽然不单独披露Trainium的收入，但亚马逊CEO安迪·杰西（Andy Jassy）在今年4月的股东信里表示，包括Trainium、Graviton和Nitro在内，亚马逊的自研芯片业务，年化收入已经突破200亿美元。关键后面他还补了一刀，说如果把这个芯片部门当成独立公司，让亚马逊在2026年生产的所有芯片，按市场价卖给AWS和外部客户，那么年收入大约是500亿美元。其实亚马逊的Trainium芯片，正在成为亚马逊第二大生意。谷歌这边，情况也是一样的。 Anthropic在去年10月拿到了最多100万颗谷歌TPU的使用权，超过1GW的算力容量在2026年上线。今年4月，Anthropic又跟谷歌和博通签了新的协议，锁定了约3.5GW的下一代TPU算力，2027年开始交付。与此同时，谷歌云的单季收入在2026年第一季度首破200亿美元，同比增长63%，谷歌还披露其AI Agent相关收入同比增长了800%。 OpenAI和Anthropic正在脱离英伟达的管控英伟达除了要面对四面八方围过来的友商，还得去应付OpenAI和Anthropic这两个小弟。 OpenAI现在把算力分成了两条路线，一条还是英伟达，另一条线是Cerebras和博通。 Cerebras做的东西跟市面上所有AI芯片都不一样，它用的是晶圆级芯片，一整片晶圆就是一个处理器，上面有几十万个计算核心。这种架构的核心优势是数据移动极少，延迟极低。对推理来说，延迟低意味着模型输出更快。今年1月，OpenAI跟Cerebras签了一份价值超过200亿美元的多年期协议，承诺部署750MW的Cerebras推理算力，交付时间横跨到2028年。基于这笔合同，Cerebras拿到了OpenAI给的10亿美元运营资金贷款，随后在5月完成了64亿美元的IPO。 Cerebras的年收入指引还不到9亿美元，但一份OpenAI的合同就给这家公司带来了超过200亿美元的收入。甚至我可以断言，Cerebras现在就是OpenAI的硬件部门。博通跟Cerebras不同的地方在于，后者签的订单是算力合同。要在规定的时间内，给OpenAI提供一定规模的推理服务。而前者的订单内容，是OpenAI自己主导设计芯片。OpenAI最清楚自家模型推理时，算力、内存、KV Cache、网络通信分别卡在哪里。这就跟买车一样，你只开公路，那就没必要选配越野轮胎、四驱和底盘护板，这些配置只有越野的时候才有用，公路完全用不上。你就能把这钱省下来去升级别的地方。这是OpenAI的第一颗自研推理芯片，从架构设计到流片只用了九个月。博通说这是先进半导体历史上最快的ASIC开发周期。Jalapeño从一张白纸开始，完全围绕ChatGPT的推理进行设计。 GPT-5.3-Codex-Spark已经在实验室里跑在Jalapeño工程样片上，跑的是生产环境的目标频率和功耗。OpenAI的说法是，每瓦性能“远超当前最先进水平”。 Jalapeño的目标部署规模是10GW，相当于10座大型核电站。虽然在训练端，OpenAI仍然离不开英伟达GPU。因为前沿大模型训练对算力密度和互联带宽的要求非常高，目前只有英伟达的GPU能够满足OpenAI的标准。但推理不同。推理是稳定、海量、重复的工作负载。每天几亿人问ChatGPT同样类型的问题，模型结构不变，计算模式高度可预测。这种负载最适合被专用化，把通用GPU里那些用不上的电路全都砍掉，只保留大模型推理需要的部分，便宜而且高效。 Anthropic走的是另一条路。它把推理和训练一起押在了AWS Trainium上。Trainium是AWS自己的AI芯片，兼顾训练和推理。今年4月，亚马逊又向Anthropic投了50亿美元，累计投资达到130亿美元，并保留了追加至多200亿美元的权利。礼尚往来，Anthropic承诺未来十年在AWS上花费超过1000亿美元，锁定5GW的Trainium算力，覆盖Trainium2到Trainium4三代芯片、数千万颗Graviton CPU。围绕这个超级大合同，亚马逊在印第安纳州建了两个巨型数据中心园区，名为“Rainier项目”，规划总容量约4.7GW。我简单算了算，如果OpenAI和Anthropic两个大型园区全天运行，一年要消耗掉1288亿度电，相当于15座大型核电站。这个数字可能看着有点虚，我换成