智能AI
morning
未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026
2026-05-24
1 阅读
允中
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026 允中 2026-05-24 14:14:05 来源: 量子位 技术创新只是起点,产业整合速度才是AI落地的真正竞争力 编辑部 整理自 AIGC2026 量子位 | 公众号 QbitAI 从硅谷投资人的视角望出去,AI的叙事正在悄然换轨。 在这个新旧周期交替的关键节点, Fusion Fund创始合伙人张璐 带来了她一线的判断: 过去两年,行业所有的目光都聚焦在模型和算力上,但真正的战场,正在向基础设施的“通信层”和物理世界的“数据层”转移。 在本次2026中国AIGC产业峰会上,她将这一轮AI叙事的转向说得很直白—— 推理 将超越训练,成为算力消耗的新主角;而数据中心里那个鲜少被提及的通信环节,其耗电量可能是计算本身的 百倍 以上。 至于下一个真正值得押注的方向,在她看来,并非更大的模型,而是 更真实、更高质量的数据 ,以及 医疗、太空、纳米机器人 这三个AI应用方向。 为了完整体现张璐的思考,在不改变原意的基础上,量子位对演讲内容进行了翻译和编辑整理,希望能给你带来更多启发。 2026中国AIGC产业峰会是由量子位主办的行业峰会,近20位产业代表与会讨论。线下参会观众超千人,线上直播观众近400万,获得了主流媒体的广泛关注与报道。 核心观点梳理 算力需求的重心正在从训练转向推理 :训练是一次性的算力投入,推理才是可持续的长期需求;随着智能体交互替代对话交互,推理算力的比重将从现在的50%继续攀升,成为AI基础设施最核心的优化方向; 数据中心的真正电老虎是通信:在AI数据中心内,通信消耗的电量可能比计算本身高出百倍,这意味着光学通信等新一代通信技术的价值,远比通常认知的更为关键; 物理AI现在卡在数据层:架构和算力都已具备,真正的瓶颈是缺乏足够高质量的真实世界数据;合成数据可以作为补充,但无法替代边缘场景中的真实采集; 数据的质量比数量更重要,而医疗恰恰是高质量数据密度最高的行业之一:这是大量AI科技公司在2025年集中入局医疗赛道的底层逻辑,而不只是因为它市场够大; 技术创新只是起点,产业整合速度才是AI落地的真正竞争力:当500强企业的AI预算从千万级跃升至数十亿级,采购周期从半年压缩到一两个月,这种加速度本身就是模型和应用持续迭代的燃料。 以下为张璐演讲原文: AI叙事的新拐点 大家好,我是张璐,我是硅谷Fusion Fund的创始和管理合伙人。 在过去的十到十一年的时间里,我们一直专注北美市场早期科技公司的投资,尤其专注在三个领域—— 企业级人工智能、医疗AI以及工业自动化 。 过去两年,大家可能都关注到了,硅谷经历了快速迭代的创新周期,尤其是以人工智能为驱动的快速的产业创新以及产业植入的进程。 所以我们在过去这两年非常辛苦,但也非常兴奋,看到了很多杰出的企业家、创业者快速地成长起来,也看到了产业中从人工智能、基础设施,再到人工智能的应用层面上多重创新的开展和发展。 到今年,我觉得已经进入到了一个新时期,可以看到人工智能在整体的叙事上、创新的专注层面上,有了一些新变化。 所以今天也非常高兴有机会和大家分享,过去一年我们看到的硅谷新兴的人工智能创新风向的变化,以及一些最新的动态。 过去几年,我们在聊到人工智能创新的时候,有几个关键词反复出现,比如大语言模型、生成式AI、训练、算力需求等等。 但最近这段时间,我们看到在语境层面上也有一些新的转向,比如,不只是在讨论大语言模型,现在更多在讨论 行业专属应用 ,基于的是小语言模型怎么样可以通过更加低成本、高效的方式,去进行产业垂直人工智能的植入,另外也是模型对象的转变。 从语言模型,现在更多讨论的是 物理AI ,还有 世界模型 的调整。 同时在计算层面,我们也经常讲到人工智能的算力需求非常巨大,以前算力的大量消耗可能是在训练端。 但过去这段时间,大家更多讨论的是 推理 对于算力的需求会越来越大,甚至 超过训练 ,成为长期可持续的算力需求。 在根本层面上,我们也能看到有越来越多对于 数据 的讨论,从最早我们经常讲规模定律(Scaling Law),认为有越多的数据意味着可以去训练出更好的人工智能模型。 到现在大家更多关注 数据的质量——怎么样可以拿到高质量的行业数据?怎么可以通过高质量的行业数据去做更好的数据库?我们称之为数据治理(data curation),还有数据图书馆(data library)。 再基于这些数据的质量去优化人工智能,无论是模型能力,还是在应用能力上进行迭代。 重新定义AI基础设施 今天也想根据这些不同的方向,跟大家快速分享几个我们非常看好、而且现在正快速发展的人工智能领域。 首先要跟大家分享和聊到的就是 人工智能基础设施 。 如果大家有关注英伟达3月的GTC大会,也能看到英伟达的叙事在改变,以前讲的是一家GPU芯片企业,到现在黄仁勋已经非常明确—— 英伟达是一个 人工智能基础设施公司 ,一个 人工智能工厂 。 从Token经济学来看,未来对人工智能基础设施的需求,可能就像对电力的需求一样常见,这是一场非常巨大的基础层级的产业革命。 所以我们看到,对于人工智能基础设施的创新需求非常高。人工智能现在进入了 产业部署 阶段,大规模的产业部署也需要非常强力的 人工智能基础设施来辅助和支持 。 现在有大量新建的人工智能数据中心,它们面临很多挑战,比如 电力的消耗、通信层面上的能量消耗 ,还有各种各样技术问题。 所以怎么样在这个层面上进行更多的技术创新,也带来了很多的创新机会,其中我们聊得比较多的,就是 基础设施本身的算力优化 。 我刚才提到,核心的算力变化在于——以前算力关注更多的是训练本身,但现在我们看到一个非常清晰的转变:训练更多是一次性的算力投入,但是 推理是可持续的算力需求 。 几年前,这两个层面上对算力的需求——训练的算力需求占到70%以上,推理可能只有20%到30%,现在推理已经占到了 一半 ,在未来可能会变成 30:70(训练:推理)。 尤其我们现在已经到了新的转变阶段,即从聊天对话这种交互方式,到现在智能体的交互。如果你有一个智能体,你是不是希望这个智能体一直在线,一直响应你? 这个过程中对于推理的需求就更加具有可持续性,然后也更加大量,这个过程中 推理所消耗的算力也更为核心 。 因此,怎样进行推理的优化?怎样进行推理算力的优化? 是未来人工智能基础设施要去解决的核心问题之一。 我们刚才主要专注的是说计算这部分的算力,在人工智能基础设施层面上大家探讨的,更多是在计算过程中消耗了多大的能量。 现在全世界都在讨论,人工智能的核心发展瓶颈之一就是 耗电量 ,但是在计算之后,下一步是什么呢?是通信(Communication)。 这个通信的过程中有通信能力的需求,有内部通信, 还有交换机(switch)的需求,在人工智能的数据中心里,通信环节整体的耗电量可能比计算的耗电量要 大几十倍甚至上百倍 。 我去年有幸在斯坦福