Cerebras 跑赢英伟达 21 倍，老黄还在北京吃吃吃

文 | AI唱反调 5 月 14 日上午 9 点 30 分，纳斯达克的电子盘上，CBRS 的开盘价第一个跳了出来： 350 美元。这是 Cerebras Systems 上市发行价 185 美元的 1.89 倍，是 3 个月前 Tiger Global 领投 H 轮融资时 230 亿美元估值的 4 倍，也是 18 个月前阿联酋投资方 G42 持股引爆美国外资审查、招股书被迫撤回时账面估值 40 亿美元的 23 倍。盘中股价一度冲到 386 美元，收盘报 311.07 美元，全稀释市值约 950 亿美元，单日涨幅 68.2% ——成为继 2019 年 Uber 之后美国规模最大的科技公司上市事件（CNBC，2026/5/14）。 Andrew Feldman 这天站在纳斯达克现场。11 年前他把上一家公司 SeaMicro 以 3.34 亿美元卖给了 AMD，敲钟的时候做梦也不敢想这次的数字——一夜之间，他个人持股账面市值越过了 10 亿美元。同一时刻，英伟达总部里，似乎没有人召集应急会议。第二天 5 月 15 日，CBRS 高开后一路走低，盘中下探 275 美元，收盘约 280 美元，单日跌 10% （CNBC，2026/5/15）。两个交易日的振幅是 109%，从首日收盘的回吐幅度是 28%。市值 36 小时内从 950 亿美元跌回 850 亿美元区间。媒体的叙事一边倒地从"AI 上市潮复苏"切换到"AI 估值泡沫"。但真正值得追问的不是 Cerebras 的价格，而是英伟达那边为什么没有动静——Cerebras 的旗舰芯片，第三方测试里推理 Llama 3 70B 模型比英伟达旗舰 GPU B200 快 21 倍（Cerebras 官方 vs NextBigFuture 复测，2026），Feldman 的履历漂亮、产品参数惊人。讲真，按"AI 时代的硬件颠覆"剧本，老黄应该至少召集一次内部会议。但他没有。他还在北京吃，吃得不亦乐乎。晶圆的诱惑 Cerebras 卖的是"算力的奇观"。英伟达的 B200 是把多颗芯片用高速互连技术拼起来，每颗芯片 2080 亿个晶体管。Cerebras 反其道—— 把整张 12 英寸晶圆当成一颗芯片用。一张晶圆通常会被切成几百颗 GPU，Cerebras 不切，整张做成单芯片，叫做"晶圆级芯片"（Wafer Scale Engine，简称 WSE）。第三代 WSE-3 单片集成4 万亿个晶体管、90 万个计算核心、44GB 片上高速缓存、5 纳米制程，是地球上现存最大的单芯片。这两条技术路线的差距，集中在内存带宽这一个核心指标上：简单翻译技术语言就是：英伟达的体系最贵的那一段，是显存和芯片之间的数据搬运——一颗 GPU 装不下整个模型，所以需要不停地把权重从外部高带宽显存（HBM3e）搬到计算核心去用，搬运速度越快、推理越快，于是英伟达每年砸最多的钱在显存升级和高速互连上。 Cerebras 直接绕开了这道坎——它把整个模型权重塞进 44GB 的片上缓存，根本不需要搬运，计算核心就在权重旁边。所以在跑 70B 到 405B 量级的模型时，单台 Cerebras 系统的吞吐量比一台装 8 块英伟达 B200 的服务器还高。这是技术意义上的奇观。Feldman 把 11 年前在 SeaMicro 做"高密度微型服务器"的逻辑（同一套人马）放大到了 AI 芯片——SeaMicro 当年以 3.34 亿美元卖给 AMD 时，AMD 给的判断是"微型服务器路线赌错了"，5 年后产品线被关停。Feldman 这次把"集成度极限"的玩法换了个赛道做了一遍。但这里有个关键前提藏在 Cerebras 自家白皮书最末页的但书里： "如果跑的模型装不进单张晶圆，性能会远远差于带高速互连的英伟达 B200 和 B300 系统。"（NextBigFuture 复测原文）总的来说，模型必须能装进一张晶圆才能跑得快。44GB 片上缓存听起来很大，但 GPT-4 量级（1.8 万亿参数）、Llama 3.1-405B、Grok 3 这种参数规模的前沿模型，要么需要切分到多张晶圆上（损失了"全在片上"的优势）、要么需要走晶圆和晶圆之间的链路（损失了"省掉外部显存搬运"的优势）。 Cerebras 的 21 倍速度优势成立的工作负载，集中在 70B 到 405B 的中型模型推理 + 科学超算仿真 ——这是个真实的市场，但不是英伟达在的那个市场。英伟达 2026 财年第四季度单季的数据中心收入是 623 亿美元（计算业务 513 亿 + 网络业务 110 亿），同比增长 58%。Cerebras 2025 年全年总营收是 5.1 亿美元（招股书，Tom's Hardware 转引）。两个数字的倍数关系是 122 倍——而且英伟达这 623 亿里，没有任何一个工作负载是 Cerebras 能完整替代的： • 训练：超大模型训练需要数千卡互联，Cerebras 的晶圆间链路成熟度远远不够； • 推理：Cerebras 只能打中型模型，前沿模型（GPT-5、Claude Opus 4.7、Gemini 3.1 Ultra）跑不进 44GB； • 多模态 / 视频生成：需要高速互连配合大显存； • 客户多样性：B200 装在亚马逊、微软、谷歌、甲骨文四朵公有云里，每家自己的工作负载都不一样。 Cerebras 在中型模型推理这块确实赢了。问题是这块占英伟达数据中心收入的 5%-8%——老黄一个季度的零头。阿布扎比的房间 Cerebras 的招股书中藏着一组比技术更扎眼的数字：表面上 G42 的占比从 85% 降到 24%，但 G42 把订单"分账"给了关联方 MBZUAI——这是 G42 控股的研究型大学，2025 年 62% 营收来自这一家。两者合并仍是 86%，实际上是同一个客户用两个壳付钱。更要命的是MBZUAI 一家占应收账款 77.9%。换句话说，Cerebras 不仅在赚阿联酋的钱，连账期都押在阿联酋身上。美国外资投资委员会 2024 年 9 月之所以让 Cerebras 撤回第一版招股书，就是因为 G42 持有 Cerebras 投票权股份，触发了"国家安全审查"。直到 G42 把持股改为非投票权（2025 年 10 月），Cerebras 才能重新进入上市流程。 Cerebras 的客户和股东曾经是同一家阿布扎比公司 ——这种结构在传统二级市场会被打 30%-40% 估值折扣。英伟达的客户结构是另一个极端：2024-2025 年它的数据中心收入里没有任何单一客户超过 13% （年报披露），微软、Meta、亚马逊、谷歌、甲骨文、特斯拉、xAI、Anthropic（5 月 6 日刚把 Anthropic 加进来，整租了 Musk 在田纳西州孟菲斯建的算力中心）排排坐。 Blackwell GPU 的在手订单是 360 万台，售罄到 2026 年中（Yahoo Finance，2026）。老黄上一次电话会议给出的判断是：Blackwell + Rubin 两个世代累计收入将达到 1 万亿美

订阅66必读