75% 毛利背后：英伟达其实是一家软件公司

英伟达刚交出了一份近乎“碾压级”的财报：2027财年第一季度营收816亿美元，同比增长85%；GAAP净利润583亿美元，同比增长211%。这是全球市值最高科技公司交出的最新成绩单。但比数字更值得关注的，是一个反复被提及却很少被严谨验证的问题——英伟达的核心竞争力到底在硬件还是在软件？有一种观点认为，英伟达本质上是一家软件公司，GPU芯片只是外壳，CUDA软件生态才是它真正的护城河。这个判断是否成立？本文拆解这份最新财报中的毛利率结构、客户采购行为、资产价值逻辑等维度，尝试给出答案。结论先说在前： “软件定义的硬件平台”正在取代“硬件性能领先”，成为英伟达护城河的主体。不过，CUDA的护城河已经挖好，但城里的商业生态还在建设中。毛利率：定价权中隐含的软件溢价 Non-GAAP毛利率75%，最近三个季度稳定在73%-75%区间。半导体行业常规毛利率在30%-50%，英伟达高出同行20-30个百分点。CFO Kress在电话会中表示，毛利率波动主要与产品组合和硬件成本变化相关，而非竞争加剧——即便竞争者增多，客户对英伟达平台的支付意愿并未下降。 75%在半导体行业中是个异类。但需要诚实面对一个问题：这个高毛利有多少归因于CUDA生态锁定，又有多少归因于产能供不应求带来的短期定价权？毛利率的韧性提供了额外信息。过去一年间，AMD MI300X在纸面参数上已具备竞争力，Google TPU在内部大规模部署，Groq、Cerebras等专用芯片方案持续分流推理负载。供给端的竞争者在增多，但75%的毛利率纹丝不动。如果高毛利仅仅来自产能稀缺，竞争加剧应当逐步侵蚀这一优势。事实没有发生。这说明供需关系之外，还存在一层超越硬件参数的定价权 ——客户愿意为CUDA生态带来的效率溢价买单。图：半导体头部企业Non-GAAP毛利率对比（最新季度）数据来源：各公司2026年Q1财报从成本结构看，这个判断也获得间接支撑。HBM4内存和先进封装的采购成本在持续攀升，但英伟达转嫁成本的能力并未减弱。将75%与同行对比，差异更直观：台积电作为代工龙头，Q1毛利率66.2%；英特尔 Non-GAAP毛利率41%。英伟达作为芯片设计公司，在毛利率上大幅超越同行，这在半导体行业中极为罕见。当然，定价权并非无上限。Kress给出的Q2指引为GAAP 74.9%、Non-GAAP 75.0%，上下浮动50个基点，仍维持高位。HBM4成本上升和3nm工艺爬坡是长期压力，但当前尚未实质侵蚀毛利率，说明软件溢价足以对冲硬件成本上涨。客户在买什么：从“采购芯片”到“采购平台” 图：英伟达FY27 Q1分业务营收及同比增速数据来源：英伟达FY27 Q1财报数据中心GPU算力营收604亿美元，同比增长77%。但网络营收148亿美元，同比增长199% ，增速是GPU的2.6倍，占数据中心总营收比例从去年同期的约12%升至约20%。客户采购的不只是GPU，而是NVLink（芯片间高速互联技术）、InfiniBand和Spectrum-X构成的全栈系统。据多家媒体报道，主要超大规模客户正在以极快的速度部署GB200 NVL72机架——将72颗GPU、NVLink交换机和液冷封装为一体。一旦采用，其数据中心的计算、存储、网络全部纳入英伟达技术体系。据CFO Kress在电话会中披露，Spectrum-X以太网平台“规模已超过所有以太网同类竞争对手的总和”——在开放标准的以太网领域，英伟达凭借CUDA对网络通信的加速优化取得了超越硬件参数的市场地位。 CUDA在网络层面也在发挥作用，而不仅限于GPU计算。另一个有价值的观察是采购的承诺周期在拉长。据电话会披露，截至Q1末供应保障总额（含库存、采购承诺和预付款）增至约 1450亿美元。GTC 2026上，管理层将Blackwell和Rubin平台累计需求展望上修至2027年底约1万亿美元。客户押注的不只是某一代芯片，而是一个由CUDA统一的全栈平台。图：英伟达需求可见性与供应保障（亿美元）数据来源：英伟达FY27 Q1财报、GTC 2026 旧硬件升值：纯硬件逻辑无法解释的现象电话会中一组数据值得细读： H100租用价格年初至今上涨20%，A100云端定价涨15%。 H100基于2022年Hopper架构，Blackwell已贡献数据中心计算收入约七成，下一代Blackwell Ultra架构样片已开始向客户交付。正常硬件迭代中，新一代上市意味着旧代价格暴跌。英伟达出现了相反趋势。 Kress将此归因于“平台的多样性”和“软件栈带来的持续性能提升”。据MLPerf v6.0官方基准测试结果，Blackwell Ultra在Server场景下DeepSeek-R1推理速度较上一代提升2.77倍。这一性能飞跃来自英伟达所强调的“极致协同设计”——硬件架构、CUDA软件栈与模型的联合优化。需要考虑的反面解释是：旧硬件升值是否仅仅因为AI算力总需求爆发？这个因素存在，但同一时期其他厂商的旧代GPU并未出现类似升值。H100涨价的特殊性在于，CUDA生态在过去四年中持续为这块硬件扩展新的应用场景和性能空间，使其在折旧期满后仍然具备经济价值。不妨类比iPhone的旧机型保值逻辑——原因不是硬件折旧更慢，而是iOS生态为旧设备持续提供系统更新，延长了经济生命周期。英伟达正在GPU领域复现同样逻辑。在纯硬件框架中，折旧期满的资产趋于残值；在CUDA框架中，软件迭代持续为旧硬件注入新价值。这是支持“软件定义”论点的最具说服力的单项证据。对CUDA锁定效应的一个常见质疑是：它是否主要局限于训练阶段？本季度信号偏积极但不绝对。推理已成为增长主引擎，Blackwell被定义为“推理环节单位token成本最低的平台”。Dynamo 1.0作为英伟达面向大规模分布式推理的生产级系统，与TensorRT-LLM（推理加速库）等优化工具协同，将Blackwell推理效率大幅提升。Blackwell Ultra在MLPerf推理测评中横扫全部基准。更重要的是，推理场景对软件优化的敏感度远高于训练：涉及长尾模型部署、延迟敏感型应用和成本效率优化，恰恰是CUDA推理工具链最擅长的领域。TensorRT-LLM对大模型推理的优化深度，以及Triton编译器对自定义算子的支持，构成了短期内难以复制的工程壁垒。但目前的证据尚不足以得出“客户在推理端无法离开CUDA”的确定性结论。Google TPU在内部推理中运行良好，Groq的SRAM架构在特定场景具备竞争力，自研ASIC（专用芯片）在超大规模厂商中持续扩大部署。CUDA在推理端的优势更像是“当前最优解”而非“唯一解”。不过，本季度边缘计算动态几乎全部围绕CUDA展开：自动驾驶平台DRIVE Hyperion（比亚迪、吉利、日产等已采用）、机器人框架Isaac GR00T N等。从云端到物理世界，CUDA正在将推理依赖从单一场景扩展到全场景。 Vera CPU：生态边界的实质测试本季度英伟达发布了 Vera CPU ——“全球首款专为智能体AI设计的CPU”。据CFO Kress在电话会中披露，管理层预计今年CP

订阅66必读