反杀英伟达!亏损多年却一夜千亿,这家 AI 芯片公司凭什么炸翻美股?

2026-05-17 1 阅读 硅谷Tech news
Cerebras 的 纳斯达克 上市大戏刚刚落幕,但其引发的连锁反应仍在持续发酵。 5 月 14 日上市首日,该股强势冲高, 盘中全稀释市值一度冲破千亿美元关口(收盘约 670 亿美元) ,创下近年美股科技圈罕见的 IPO 盛况。如今行情逐步回归理性,大众也开始静下心来审视这家特殊的算力企业。 谁也不曾想到,这家常年处于亏损状态、早年还因合规问题一度叫停上市的企业,能在资本市场迎来如此亮眼的逆袭。纵观其发展历程,它既没有走主流GPU的研发路线,也没能在大模型训练赛道站稳脚跟,却靠着独特的晶圆级芯片技术,拿下OpenAI百亿级重磅订单,顺利撬动资本市场信心,彻底搅动原本由 英伟达 牢牢把控的AI算力市场格局。 褪去狂热的资本滤镜,诸多现实问题也随之浮出水面。 一边是爆发式增长的营收、巨额积压订单与全新技术路线带来的行业想象空间,另一边是居高不下的估值、客户集中隐患、盈利根基不稳等现实难题。抛开上市首日的行情喧嚣,Cerebras究竟是能真正撼动行业格局的硬核黑马,还是一场被热度推高的资本泡沫? 答案无关一家公司,而是 「AI推理赛道迎来首个公开市场定价锚」 ——200亿美元OpenAI合同、晶圆级芯片的架构突破、英伟达垄断裂缝的首次资本化定价,三股力量交汇,将这家成立十年的创企推上了历史坐标。英伟达的垄断壁垒,正被撕开一道裂缝。 核心论点: 1. Cerebras的IPO不是一家公司上市的故事,而是AI推理赛道获得公开市场定价的里程碑事件。 2. 客户结构从G42一家独大转向OpenAI + AWS多元格局,是其IPO翻盘的关键叙事转变。 3. WSE-3晶圆级芯片在推理场景的性能优势真实存在,但生态护城河与供应链风险同样不容忽视。 4. 200亿美元OpenAI合同重塑了「客户即股东」的商业模式,对OpenAI自身估值和上市进程产生复杂的双向影响。 5. AI芯片行业正式进入「推理细分时代」——巨头垄断格局正被缝隙创新者撕裂。 从撤回到重启:一场合规破局 Cerebras的上市之路远非一帆风顺。2024年首次递交S-1文件后,因最大客户G42(阿联酋人工智能公司)贡献超85%收入,且阿联酋主权资本间接持有美国AI基础设施股权,触发CFIUS(美国外资投资委员会)国家安全审查,于2025年10月撤回申请。 G42曾与华为和中国基因测序公司BGI集团有过业务往来——在AI芯片这一地缘政治敏感领域,「单一客户依赖 + 中东资本」的组合几乎必然触发审查。 2025 年3月31日,CFIUS正式放行 :G42将持股转换为非投票权股份,并签署美国国家安全协议。合规扫清了上市最大障碍。 此后,Cerebras加速客户多元化:OpenAI于2026年1月签署超200亿美元推理算力合同,AWS于同年3月宣布战略合作。客户结构的根本性改善与合规承诺的落地,共同为重新上市铺平了道路。 2026年2月,Cerebras完成10亿美元Series H轮融资,Tiger Global领投,AMD和Fidelity跟投,投后估值约230亿美元。4月17日重新递交S-1,定价区间从115—125美元「10天内三次上调」至最终185美元,IPO超额认购倍数超20倍,映射出市场需求的异常强劲。5月14日正式挂牌,募资55.5亿美元,创下2019年Uber以来美国科技公司最大规模IPO。 上市窗口同样关键。 市场窗口 :美联储降息预期升温,美股IPO市场经历近三年低迷后回暖。 叙事红利 :DeepSeek事件引发全球对AI推理效率的再思考。 竞品真空 :AI推理赛道尚无其他纯芯片上市公司,Groq融资75亿美元但未启动IPO,SambaNova在探索出售而非上市。Cerebras享受了 推理芯片第一股 的稀缺溢价。 这一经历具有行业示范意义——想要在美国资本市场获得认可,不仅需要技术领先和财务增长,还需要在客户结构和资本来源上满足监管合规要求。 晶圆级芯片:推理场景的结构性优势 Cerebras成立于2015年,创始人Andrew Feldman和Sean Lie此前创办的服务器公司被AMD收购。再度创业的核心理念极为激进:GPU本质上不适合深度学习,应从零设计AI专用芯片。Benchmark累计投入约2.7亿美元持有IPO前9.5%股权,按首日收盘价计算价值超40亿美元,回报超15倍。 理解Cerebras,必须理解「晶圆级」三个字。传统芯片制造将一片300毫米硅晶圆切割成数百颗独立Die,分别封装。Cerebras反其道而行——「不切割,直接将整片晶圆封装为单颗芯片」,即WSE(Wafer-Scale Engine,晶圆级引擎)。工程难度极高,Cerebras通过预留约10%备用核心规避缺陷风险,历经多次流片失败,到第三代WSE-3才实现量产级可靠性。 WSE-3的核心优势在于消除了GPU集群中最大的性能瓶颈——「内存墙」 。GPU的运算单元与显存(HBM,高带宽显存)物理分离,数据搬运消耗大量时间和能耗。WSE-3将44GB片上SRAM直接集成,模型权重可完整载入,推理时无需频繁读写外部存储。 图1:WSE-3与英伟达H100/B200芯片面积对比(数据来源:Cerebras S-1,Nvidia官网) WSE-3与英伟达主力芯片关键参数对比 据Cerebras在特定测试环境下的公开数据,WSE-3可实现约50ms的超低响应时间,而GPU方案约为800ms——延迟差距达16倍;推理吞吐量约1,200至2,000 tokens/秒,约为单张H100(100至150 tokens/秒)的10至15倍。与AWS合作的Trainium3 + CS-3组合,预计可实现5倍的token吞吐量提升。 但WSE-3并非万能方案。作为单片架构,它「无法通过NVLink(英伟达高速互连技术)扩展到千卡集群」,在分布式训练场景中完全无法与英伟达GPU集群竞争。Cerebras的定位严格限定在推理这一细分场景。 Cerebras与英伟达的关系,更接近当年SSD对HDD的冲击——SSD并未取代HDD,但在关键性能场景中逐步蚕食市场份额。正如Atlas Peak Research在其分析报告中所指出的: 「Cerebras不是英伟达的全面替代者,而是在延迟敏感型推理这一经济意义重大的细分市场,拥有可信的架构优势。」 WSE-3在推理场景的结构性优势,开始转化为真实的商业成果。 财报拆解:增长之下,风险暗涌 从2022年的2460万美元到2025年的5.1亿美元,Cerebras的营收增长曲线陡峭。2024年跃升至2.9亿美元(同比+268%),但净亏损高达4.816亿美元。2025年的变化是根本性的:「GAAP口径净利润首次转正,达2.378亿美元」,实现扭亏为盈;非GAAP净亏损为7,570万美元(剔除一次性项目影响)。积压订单高达246亿美元,其中OpenAI合同超200亿美元。 图2:Cerebras 2022—2025年营收与利润趋势(数据来源:Cerebras S-1/A招股书) 但营收增长的光环之下,风险同样清晰——而且可能被低估。 客户集中度风险 :2025年前两大客户MBZUAI(62%)和G42(24%)合计贡献 86%营收 ,