反杀英伟达！亏损多年却一夜千亿，这家 AI 芯片公司凭什么炸翻美股？

Cerebras 的纳斯达克上市大戏刚刚落幕，但其引发的连锁反应仍在持续发酵。 5 月 14 日上市首日，该股强势冲高，盘中全稀释市值一度冲破千亿美元关口（收盘约 670 亿美元），创下近年美股科技圈罕见的 IPO 盛况。如今行情逐步回归理性，大众也开始静下心来审视这家特殊的算力企业。谁也不曾想到，这家常年处于亏损状态、早年还因合规问题一度叫停上市的企业，能在资本市场迎来如此亮眼的逆袭。纵观其发展历程，它既没有走主流GPU的研发路线，也没能在大模型训练赛道站稳脚跟，却靠着独特的晶圆级芯片技术，拿下OpenAI百亿级重磅订单，顺利撬动资本市场信心，彻底搅动原本由英伟达牢牢把控的AI算力市场格局。褪去狂热的资本滤镜，诸多现实问题也随之浮出水面。一边是爆发式增长的营收、巨额积压订单与全新技术路线带来的行业想象空间，另一边是居高不下的估值、客户集中隐患、盈利根基不稳等现实难题。抛开上市首日的行情喧嚣，Cerebras究竟是能真正撼动行业格局的硬核黑马，还是一场被热度推高的资本泡沫？答案无关一家公司，而是「AI推理赛道迎来首个公开市场定价锚」 ——200亿美元OpenAI合同、晶圆级芯片的架构突破、英伟达垄断裂缝的首次资本化定价，三股力量交汇，将这家成立十年的创企推上了历史坐标。英伟达的垄断壁垒，正被撕开一道裂缝。核心论点： 1. Cerebras的IPO不是一家公司上市的故事，而是AI推理赛道获得公开市场定价的里程碑事件。 2. 客户结构从G42一家独大转向OpenAI + AWS多元格局，是其IPO翻盘的关键叙事转变。 3. WSE-3晶圆级芯片在推理场景的性能优势真实存在，但生态护城河与供应链风险同样不容忽视。 4. 200亿美元OpenAI合同重塑了「客户即股东」的商业模式，对OpenAI自身估值和上市进程产生复杂的双向影响。 5. AI芯片行业正式进入「推理细分时代」——巨头垄断格局正被缝隙创新者撕裂。从撤回到重启：一场合规破局 Cerebras的上市之路远非一帆风顺。2024年首次递交S-1文件后，因最大客户G42（阿联酋人工智能公司）贡献超85%收入，且阿联酋主权资本间接持有美国AI基础设施股权，触发CFIUS（美国外资投资委员会）国家安全审查，于2025年10月撤回申请。 G42曾与华为和中国基因测序公司BGI集团有过业务往来——在AI芯片这一地缘政治敏感领域，「单一客户依赖 + 中东资本」的组合几乎必然触发审查。 2025 年3月31日，CFIUS正式放行：G42将持股转换为非投票权股份，并签署美国国家安全协议。合规扫清了上市最大障碍。此后，Cerebras加速客户多元化：OpenAI于2026年1月签署超200亿美元推理算力合同，AWS于同年3月宣布战略合作。客户结构的根本性改善与合规承诺的落地，共同为重新上市铺平了道路。 2026年2月，Cerebras完成10亿美元Series H轮融资，Tiger Global领投，AMD和Fidelity跟投，投后估值约230亿美元。4月17日重新递交S-1，定价区间从115—125美元「10天内三次上调」至最终185美元，IPO超额认购倍数超20倍，映射出市场需求的异常强劲。5月14日正式挂牌，募资55.5亿美元，创下2019年Uber以来美国科技公司最大规模IPO。上市窗口同样关键。市场窗口：美联储降息预期升温，美股IPO市场经历近三年低迷后回暖。叙事红利：DeepSeek事件引发全球对AI推理效率的再思考。竞品真空：AI推理赛道尚无其他纯芯片上市公司，Groq融资75亿美元但未启动IPO，SambaNova在探索出售而非上市。Cerebras享受了推理芯片第一股的稀缺溢价。这一经历具有行业示范意义——想要在美国资本市场获得认可，不仅需要技术领先和财务增长，还需要在客户结构和资本来源上满足监管合规要求。晶圆级芯片：推理场景的结构性优势 Cerebras成立于2015年，创始人Andrew Feldman和Sean Lie此前创办的服务器公司被AMD收购。再度创业的核心理念极为激进：GPU本质上不适合深度学习，应从零设计AI专用芯片。Benchmark累计投入约2.7亿美元持有IPO前9.5%股权，按首日收盘价计算价值超40亿美元，回报超15倍。理解Cerebras，必须理解「晶圆级」三个字。传统芯片制造将一片300毫米硅晶圆切割成数百颗独立Die，分别封装。Cerebras反其道而行——「不切割，直接将整片晶圆封装为单颗芯片」，即WSE（Wafer-Scale Engine，晶圆级引擎）。工程难度极高，Cerebras通过预留约10%备用核心规避缺陷风险，历经多次流片失败，到第三代WSE-3才实现量产级可靠性。 WSE-3的核心优势在于消除了GPU集群中最大的性能瓶颈——「内存墙」。GPU的运算单元与显存（HBM，高带宽显存）物理分离，数据搬运消耗大量时间和能耗。WSE-3将44GB片上SRAM直接集成，模型权重可完整载入，推理时无需频繁读写外部存储。图1：WSE-3与英伟达H100/B200芯片面积对比（数据来源：Cerebras S-1，Nvidia官网） WSE-3与英伟达主力芯片关键参数对比据Cerebras在特定测试环境下的公开数据，WSE-3可实现约50ms的超低响应时间，而GPU方案约为800ms——延迟差距达16倍；推理吞吐量约1,200至2,000 tokens/秒，约为单张H100（100至150 tokens/秒）的10至15倍。与AWS合作的Trainium3 + CS-3组合，预计可实现5倍的token吞吐量提升。但WSE-3并非万能方案。作为单片架构，它「无法通过NVLink（英伟达高速互连技术）扩展到千卡集群」，在分布式训练场景中完全无法与英伟达GPU集群竞争。Cerebras的定位严格限定在推理这一细分场景。 Cerebras与英伟达的关系，更接近当年SSD对HDD的冲击——SSD并未取代HDD，但在关键性能场景中逐步蚕食市场份额。正如Atlas Peak Research在其分析报告中所指出的：「Cerebras不是英伟达的全面替代者，而是在延迟敏感型推理这一经济意义重大的细分市场，拥有可信的架构优势。」 WSE-3在推理场景的结构性优势，开始转化为真实的商业成果。财报拆解：增长之下，风险暗涌从2022年的2460万美元到2025年的5.1亿美元，Cerebras的营收增长曲线陡峭。2024年跃升至2.9亿美元（同比+268%），但净亏损高达4.816亿美元。2025年的变化是根本性的：「GAAP口径净利润首次转正，达2.378亿美元」，实现扭亏为盈；非GAAP净亏损为7,570万美元（剔除一次性项目影响）。积压订单高达246亿美元，其中OpenAI合同超200亿美元。图2：Cerebras 2022—2025年营收与利润趋势（数据来源：Cerebras S-1/A招股书）但营收增长的光环之下，风险同样清晰——而且可能被低估。客户集中度风险：2025年前两大客户MBZUAI（62%）和G42（24%）合计贡献 86%营收，

订阅66必读