科技头条
morning
75% 毛利背后:英伟达其实是一家软件公司
2026-05-22
1 阅读
硅谷Tech news
英伟达 刚交出了一份近乎“碾压级”的财报:2027财年第一季度营收816亿美元,同比增长85%;GAAP净利润583亿美元,同比增长211%。这是全球市值最高科技公司交出的最新成绩单。但比数字更值得关注的,是一个反复被提及却很少被严谨验证的问题——英伟达的核心竞争力到底在硬件还是在软件? 有一种观点认为,英伟达本质上是一家软件公司,GPU芯片只是外壳,CUDA软件生态才是它真正的护城河。这个判断是否成立?本文拆解这份最新财报中的毛利率结构、客户采购行为、资产价值逻辑等维度,尝试给出答案。 结论先说在前: “软件定义的硬件平台”正在取代“硬件性能领先”,成为英伟达护城河的主体。不过,CUDA的护城河已经挖好,但城里的商业生态还在建设中。 毛利率:定价权中隐含的软件溢价 Non-GAAP毛利率75%,最近三个季度稳定在73%-75%区间。半导体行业常规毛利率在30%-50%,英伟达高出同行20-30个百分点。CFO Kress在电话会中表示,毛利率波动主要与产品组合和硬件成本变化相关,而非竞争加剧——即便竞争者增多,客户对英伟达平台的支付意愿并未下降。 75%在半导体行业中是个异类。但需要诚实面对一个问题:这个高毛利有多少归因于CUDA生态锁定,又有多少归因于产能供不应求带来的短期定价权? 毛利率的 韧性 提供了额外信息。过去一年间,AMD MI300X在纸面参数上已具备竞争力,Google TPU在内部大规模部署,Groq、Cerebras等专用芯片方案持续分流推理负载。供给端的竞争者在增多,但75%的毛利率纹丝不动。如果高毛利仅仅来自产能稀缺,竞争加剧应当逐步侵蚀这一优势。事实没有发生。这说明供需关系之外,还存在一层 超越硬件参数的定价权 ——客户愿意为CUDA生态带来的效率溢价买单。 图:半导体头部企业Non-GAAP毛利率对比(最新季度) 数据来源:各公司2026年Q1财报 从成本结构看,这个判断也获得间接支撑。HBM4内存和先进封装的采购成本在持续攀升,但英伟达转嫁成本的能力并未减弱。将75%与同行对比,差异更直观: 台积电 作为代工龙头,Q1毛利率66.2%; 英特尔 Non-GAAP毛利率41%。英伟达作为芯片设计公司,在毛利率上大幅超越同行,这在半导体行业中极为罕见。 当然,定价权并非无上限。Kress给出的Q2指引为GAAP 74.9%、Non-GAAP 75.0%,上下浮动50个基点,仍维持高位。HBM4成本上升和3nm工艺爬坡是长期压力,但当前尚未实质侵蚀毛利率,说明软 件溢价足以对冲硬件成本上涨。 客户在买什么:从“采购芯片”到“采购平台” 图:英伟达FY27 Q1分业务营收及同比增速 数据来源:英伟达FY27 Q1财报 数据中心GPU算力营收604亿美元,同比增长77%。但 网络营收148亿美元,同比增长199% ,增速是GPU的2.6倍,占数据中心总营收比例从去年同期的约12%升至约20%。 客户采购的不只是GPU,而是NVLink(芯片间高速互联技术)、InfiniBand和Spectrum-X构成的全栈系统。据多家媒体报道,主要超大规模客户正在以极快的速度部署GB200 NVL72机架——将72颗GPU、NVLink交换机和液冷封装为一体。一旦采用,其数据中心的计算、存储、网络全部纳入英伟达技术体系。据CFO Kress在电话会中披露,Spectrum-X以太网平台“规模已超过所有以太网同类竞争对手的总和”——在开放标准的以太网领域,英伟达凭借CUDA对网络通信的加速优化取得了超越硬件参数的市场地位。 CUDA在网络层面也在发挥作用,而不仅限于GPU计算。 另一个有价值的观察是采购的 承诺周期 在拉长。据电话会披露,截至Q1末供应保障总额(含库存、采购承诺和预付款)增至约 1450亿美元 。GTC 2026上,管理层将Blackwell和Rubin平台累计需求展望上修至2027年底约1万亿美元。客户押注的不只是某一代芯片,而是一个由CUDA统一的全栈平台。 图:英伟达需求可见性与供应保障(亿美元) 数据来源:英伟达FY27 Q1财报、GTC 2026 旧硬件升值:纯硬件逻辑无法解释的现象 电话会中一组数据值得细读: H100租用价格年初至今上涨20%,A100云端定价涨15%。 H100基于2022年Hopper架构,Blackwell已贡献数据中心计算收入约七成,下一代Blackwell Ultra架构样片已开始向客户交付。正常硬件迭代中,新一代上市意味着旧代价格暴跌。英伟达出现了相反趋势。 Kress将此归因于“平台的多样性”和“软件栈带来的持续性能提升”。据MLPerf v6.0官方基准测试结果,Blackwell Ultra在Server场景下DeepSeek-R1推理速度较上一代提升2.77倍。这一性能飞跃来自英伟达所强调的“极致协同设计”——硬件架构、CUDA软件栈与模型的联合优化。 需要考虑的反面解释是:旧硬件升值是否仅仅因为AI算力总需求爆发?这个因素存在,但同一时期其他厂商的旧代GPU并未出现类似升值。H100涨价的特殊性在于,CUDA生态在过去四年中持续为这块硬件扩展新的应用场景和性能空间,使其在折旧期满后仍然具备经济价值。 不妨类比iPhone的旧机型保值逻辑——原因不是硬件折旧更慢,而是iOS生态为旧设备持续提供系统更新,延长了经济生命周期。英伟达正在GPU领域复现同样逻辑。 在纯硬件框架中,折旧期满的资产趋于残值;在CUDA框架中,软件迭代持续为旧硬件注入新价值。这是支持“软件定义”论点的最具说服力的单项证据。 对CUDA锁定效应的一个常见质疑是:它是否主要局限于训练阶段? 本季度信号偏积极但不绝对。推理已成为增长主引擎,Blackwell被定义为“推理环节单位token成本最低的平台”。Dynamo 1.0作为英伟达面向大规模分布式推理的生产级系统,与TensorRT-LLM(推理加速库)等优化工具协同,将Blackwell推理效率大幅提升。Blackwell Ultra在MLPerf推理测评中横扫全部基准。 更重要的是,推理场景对软件优化的敏感度远高于训练:涉及长尾模型部署、延迟敏感型应用和成本效率优化,恰恰是CUDA推理工具链最擅长的领域。TensorRT-LLM对大模型推理的优化深度,以及Triton编译器对自定义算子的支持,构成了短期内难以复制的工程壁垒。 但目前的证据尚不足以得出“客户在推理端无法离开CUDA”的确定性结论。Google TPU在内部推理中运行良好,Groq的SRAM架构在特定场景具备竞争力,自研ASIC(专用芯片)在超大规模厂商中持续扩大部署。CUDA在推理端的优势更像是“当前最优解”而非“唯一解”。不过,本季度边缘计算动态几乎全部围绕CUDA展开:自动驾驶平台DRIVE Hyperion( 比亚迪 、吉利、日产等已采用)、 机器人 框架Isaac GR00T N等。 从云端到物理世界,CUDA正在将推理依赖从单一场景扩展到全场景。 Vera CPU:生态边界的实质测试 本季度英伟达发布了 Vera CPU ——“全球首款专为智能体AI设计的CPU”。据CFO Kress在电话会中披露,管理层预计今年CP