未来推理将吃掉70%算力，30%留给训练丨硅谷投资人张璐@AIGC2026

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 未来推理将吃掉70%算力，30%留给训练丨硅谷投资人张璐@AIGC2026 允中 2026-05-24 14:14:05 来源：量子位技术创新只是起点，产业整合速度才是AI落地的真正竞争力编辑部整理自 AIGC2026 量子位 | 公众号 QbitAI 从硅谷投资人的视角望出去，AI的叙事正在悄然换轨。在这个新旧周期交替的关键节点， Fusion Fund创始合伙人张璐带来了她一线的判断：过去两年，行业所有的目光都聚焦在模型和算力上，但真正的战场，正在向基础设施的“通信层”和物理世界的“数据层”转移。在本次2026中国AIGC产业峰会上，她将这一轮AI叙事的转向说得很直白—— 推理将超越训练，成为算力消耗的新主角；而数据中心里那个鲜少被提及的通信环节，其耗电量可能是计算本身的百倍以上。至于下一个真正值得押注的方向，在她看来，并非更大的模型，而是更真实、更高质量的数据，以及医疗、太空、纳米机器人这三个AI应用方向。为了完整体现张璐的思考，在不改变原意的基础上，量子位对演讲内容进行了翻译和编辑整理，希望能给你带来更多启发。 2026中国AIGC产业峰会是由量子位主办的行业峰会，近20位产业代表与会讨论。线下参会观众超千人，线上直播观众近400万，获得了主流媒体的广泛关注与报道。核心观点梳理算力需求的重心正在从训练转向推理：训练是一次性的算力投入，推理才是可持续的长期需求；随着智能体交互替代对话交互，推理算力的比重将从现在的50%继续攀升，成为AI基础设施最核心的优化方向；数据中心的真正电老虎是通信：在AI数据中心内，通信消耗的电量可能比计算本身高出百倍，这意味着光学通信等新一代通信技术的价值，远比通常认知的更为关键；物理AI现在卡在数据层：架构和算力都已具备，真正的瓶颈是缺乏足够高质量的真实世界数据；合成数据可以作为补充，但无法替代边缘场景中的真实采集；数据的质量比数量更重要，而医疗恰恰是高质量数据密度最高的行业之一：这是大量AI科技公司在2025年集中入局医疗赛道的底层逻辑，而不只是因为它市场够大；技术创新只是起点，产业整合速度才是AI落地的真正竞争力：当500强企业的AI预算从千万级跃升至数十亿级，采购周期从半年压缩到一两个月，这种加速度本身就是模型和应用持续迭代的燃料。以下为张璐演讲原文： AI叙事的新拐点大家好，我是张璐，我是硅谷Fusion Fund的创始和管理合伙人。在过去的十到十一年的时间里，我们一直专注北美市场早期科技公司的投资，尤其专注在三个领域—— 企业级人工智能、医疗AI以及工业自动化。过去两年，大家可能都关注到了，硅谷经历了快速迭代的创新周期，尤其是以人工智能为驱动的快速的产业创新以及产业植入的进程。所以我们在过去这两年非常辛苦，但也非常兴奋，看到了很多杰出的企业家、创业者快速地成长起来，也看到了产业中从人工智能、基础设施，再到人工智能的应用层面上多重创新的开展和发展。到今年，我觉得已经进入到了一个新时期，可以看到人工智能在整体的叙事上、创新的专注层面上，有了一些新变化。所以今天也非常高兴有机会和大家分享，过去一年我们看到的硅谷新兴的人工智能创新风向的变化，以及一些最新的动态。过去几年，我们在聊到人工智能创新的时候，有几个关键词反复出现，比如大语言模型、生成式AI、训练、算力需求等等。但最近这段时间，我们看到在语境层面上也有一些新的转向，比如，不只是在讨论大语言模型，现在更多在讨论行业专属应用，基于的是小语言模型怎么样可以通过更加低成本、高效的方式，去进行产业垂直人工智能的植入，另外也是模型对象的转变。从语言模型，现在更多讨论的是物理AI ，还有世界模型的调整。同时在计算层面，我们也经常讲到人工智能的算力需求非常巨大，以前算力的大量消耗可能是在训练端。但过去这段时间，大家更多讨论的是推理对于算力的需求会越来越大，甚至超过训练，成为长期可持续的算力需求。在根本层面上，我们也能看到有越来越多对于数据的讨论，从最早我们经常讲规模定律（Scaling Law），认为有越多的数据意味着可以去训练出更好的人工智能模型。到现在大家更多关注数据的质量——怎么样可以拿到高质量的行业数据？怎么可以通过高质量的行业数据去做更好的数据库？我们称之为数据治理（data curation），还有数据图书馆（data library）。再基于这些数据的质量去优化人工智能，无论是模型能力，还是在应用能力上进行迭代。重新定义AI基础设施今天也想根据这些不同的方向，跟大家快速分享几个我们非常看好、而且现在正快速发展的人工智能领域。首先要跟大家分享和聊到的就是人工智能基础设施。如果大家有关注英伟达3月的GTC大会，也能看到英伟达的叙事在改变，以前讲的是一家GPU芯片企业，到现在黄仁勋已经非常明确—— 英伟达是一个人工智能基础设施公司，一个人工智能工厂。从Token经济学来看，未来对人工智能基础设施的需求，可能就像对电力的需求一样常见，这是一场非常巨大的基础层级的产业革命。所以我们看到，对于人工智能基础设施的创新需求非常高。人工智能现在进入了产业部署阶段，大规模的产业部署也需要非常强力的人工智能基础设施来辅助和支持。现在有大量新建的人工智能数据中心，它们面临很多挑战，比如电力的消耗、通信层面上的能量消耗，还有各种各样技术问题。所以怎么样在这个层面上进行更多的技术创新，也带来了很多的创新机会，其中我们聊得比较多的，就是基础设施本身的算力优化。我刚才提到，核心的算力变化在于——以前算力关注更多的是训练本身，但现在我们看到一个非常清晰的转变：训练更多是一次性的算力投入，但是推理是可持续的算力需求。几年前，这两个层面上对算力的需求——训练的算力需求占到70%以上，推理可能只有20%到30%，现在推理已经占到了一半，在未来可能会变成 30:70（训练:推理）。尤其我们现在已经到了新的转变阶段，即从聊天对话这种交互方式，到现在智能体的交互。如果你有一个智能体，你是不是希望这个智能体一直在线，一直响应你？这个过程中对于推理的需求就更加具有可持续性，然后也更加大量，这个过程中推理所消耗的算力也更为核心。因此，怎样进行推理的优化？怎样进行推理算力的优化？是未来人工智能基础设施要去解决的核心问题之一。我们刚才主要专注的是说计算这部分的算力，在人工智能基础设施层面上大家探讨的，更多是在计算过程中消耗了多大的能量。现在全世界都在讨论，人工智能的核心发展瓶颈之一就是耗电量，但是在计算之后，下一步是什么呢？是通信（Communication）。这个通信的过程中有通信能力的需求，有内部通信，还有交换机（switch）的需求，在人工智能的数据中心里，通信环节整体的耗电量可能比计算的耗电量要大几十倍甚至上百倍。我去年有幸在斯坦福

订阅66必读