Cerebras 跑赢英伟达 21 倍,老黄还在北京吃吃吃

2026-05-18 1 阅读 AI唱反调
文 | AI唱反调 5 月 14 日上午 9 点 30 分,纳斯达克的电子盘上,CBRS 的开盘价第一个跳了出来: 350 美元 。 这是 Cerebras Systems 上市发行价 185 美元的 1.89 倍,是 3 个月前 Tiger Global 领投 H 轮融资时 230 亿美元估值的 4 倍,也是 18 个月前阿联酋投资方 G42 持股引爆美国外资审查、招股书被迫撤回时账面估值 40 亿美元的 23 倍。 盘中股价一度冲到 386 美元,收盘报 311.07 美元,全稀释市值约 950 亿美元, 单日涨幅 68.2% ——成为继 2019 年 Uber 之后美国规模最大的科技公司上市事件(CNBC,2026/5/14)。 Andrew Feldman 这天站在纳斯达克现场。11 年前他把上一家公司 SeaMicro 以 3.34 亿美元卖给了 AMD,敲钟的时候做梦也不敢想这次的数字——一夜之间,他个人持股账面市值越过了 10 亿美元。 同一时刻,英伟达总部里,似乎没有人召集应急会议。 第二天 5 月 15 日,CBRS 高开后一路走低,盘中下探 275 美元,收盘约 280 美元, 单日跌 10% (CNBC,2026/5/15)。两个交易日的振幅是 109%,从首日收盘的回吐幅度是 28%。市值 36 小时内从 950 亿美元跌回 850 亿美元区间。 媒体的叙事一边倒地从"AI 上市潮复苏"切换到"AI 估值泡沫"。但真正值得追问的不是 Cerebras 的价格,而是英伟达那边为什么没有动静——Cerebras 的旗舰芯片,第三方测试里推理 Llama 3 70B 模型 比英伟达旗舰 GPU B200 快 21 倍 (Cerebras 官方 vs NextBigFuture 复测,2026),Feldman 的履历漂亮、产品参数惊人。 讲真,按"AI 时代的硬件颠覆"剧本,老黄应该至少召集一次内部会议。 但他没有。 他还在北京吃,吃得不亦乐乎。 晶圆的诱惑 Cerebras 卖的是"算力的奇观"。 英伟达的 B200 是把多颗芯片用高速互连技术拼起来,每颗芯片 2080 亿个晶体管。Cerebras 反其道—— 把整张 12 英寸晶圆当成一颗芯片用 。 一张晶圆通常会被切成几百颗 GPU,Cerebras 不切,整张做成单芯片,叫做"晶圆级芯片"(Wafer Scale Engine,简称 WSE)。 第三代 WSE-3 单片集成4 万亿个晶体管、90 万个计算核心、44GB 片上高速缓存、5 纳米制程,是地球上现存最大的单芯片。 这两条技术路线的差距,集中在内存带宽这一个核心指标上: 简单翻译技术语言就是:英伟达的体系最贵的那一段,是显存和芯片之间的数据搬运——一颗 GPU 装不下整个模型,所以需要不停地把权重从外部高带宽显存(HBM3e)搬到计算核心去用,搬运速度越快、推理越快,于是英伟达每年砸最多的钱在显存升级和高速互连上。 Cerebras 直接绕开了这道坎——它把整个模型权重塞进 44GB 的片上缓存, 根本不需要搬运 ,计算核心就在权重旁边。所以在跑 70B 到 405B 量级的模型时,单台 Cerebras 系统的吞吐量比一台装 8 块英伟达 B200 的服务器还高。 这是技术意义上的奇观。Feldman 把 11 年前在 SeaMicro 做"高密度微型服务器"的逻辑(同一套人马)放大到了 AI 芯片——SeaMicro 当年以 3.34 亿美元卖给 AMD 时,AMD 给的判断是"微型服务器路线赌错了",5 年后产品线被关停。Feldman 这次把"集成度极限"的玩法换了个赛道做了一遍。 但这里有个 关键前提 藏在 Cerebras 自家白皮书最末页的但书里: "如果跑的模型装不进单张晶圆,性能会远远差于带高速互连的英伟达 B200 和 B300 系统。"(NextBigFuture 复测原文) 总的来说, 模型必须能装进一张晶圆才能跑得快 。44GB 片上缓存听起来很大,但 GPT-4 量级(1.8 万亿参数)、Llama 3.1-405B、Grok 3 这种参数规模的前沿模型,要么需要切分到多张晶圆上(损失了"全在片上"的优势)、要么需要走晶圆和晶圆之间的链路(损失了"省掉外部显存搬运"的优势)。 Cerebras 的 21 倍速度优势成立的工作负载,集中在 70B 到 405B 的中型模型推理 + 科学超算仿真 ——这是个真实的市场,但不是 英伟达在的那个市场 。 英伟达 2026 财年第四季度单季的数据中心收入是 623 亿美元(计算业务 513 亿 + 网络业务 110 亿),同比增长 58%。Cerebras 2025 年全年总营收是 5.1 亿美元(招股书,Tom's Hardware 转引)。两个数字的倍数关系是 122 倍——而且英伟达这 623 亿里,没有任何一个工作负载是 Cerebras 能完整替代的: • 训练 :超大模型训练需要数千卡互联,Cerebras 的晶圆间链路成熟度远远不够; • 推理 :Cerebras 只能打中型模型,前沿模型(GPT-5、Claude Opus 4.7、Gemini 3.1 Ultra)跑不进 44GB; • 多模态 / 视频生成 :需要高速互连配合大显存; • 客户多样性 :B200 装在亚马逊、微软、谷歌、甲骨文四朵公有云里,每家自己的工作负载都不一样。 Cerebras 在中型模型推理这块 确实赢了 。问题是这块占英伟达数据中心收入的 5%-8%——老黄一个季度的零头。 阿布扎比的房间 Cerebras 的招股书中藏着一组比技术更扎眼的数字: 表面上 G42 的占比从 85% 降到 24%,但 G42 把订单"分账"给了关联方 MBZUAI——这是 G42 控股的研究型大学,2025 年 62% 营收来自这一家。两者合并仍是 86%, 实际上是同一个客户用两个壳付钱 。 更要命的是MBZUAI 一家占应收账款 77.9%。换句话说,Cerebras 不仅在赚阿联酋的钱, 连账期都押在阿联酋身上 。 美国外资投资委员会 2024 年 9 月之所以让 Cerebras 撤回第一版招股书,就是因为 G42 持有 Cerebras 投票权股份,触发了"国家安全审查"。 直到 G42 把持股改为非投票权(2025 年 10 月),Cerebras 才能重新进入上市流程。 Cerebras 的客户和股东曾经是同一家阿布扎比公司 ——这种结构在传统二级市场会被打 30%-40% 估值折扣。 英伟达的客户结构是另一个极端:2024-2025 年它的数据中心收入里 没有任何单一客户超过 13% (年报披露),微软、Meta、亚马逊、谷歌、甲骨文、特斯拉、xAI、Anthropic(5 月 6 日刚把 Anthropic 加进来,整租了 Musk 在田纳西州孟菲斯建的算力中心)排排坐。 Blackwell GPU 的在手订单是 360 万台,售罄到 2026 年中(Yahoo Finance,2026)。老黄上一次电话会议给出的判断是:Blackwell + Rubin 两个世代累计收入将达到 1 万亿美