苏姿丰上海开讲：AI正在重新定义计算的每一层

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 苏姿丰上海开讲：AI正在重新定义计算的每一层克雷西 2026-05-20 08:48:27 来源：量子位 AMD持续加码中国开发者生态建设克雷西发自上海量子位 | 公众号 QbitAI “AI正在重新定义计算的每一个层次。” 这是AMD AI开发者大会今天首次落地上海时，AMD董事会主席、首席执行官苏姿丰针对AI行业给出的最新判断。这次应AMD邀请，量子位来到了这场大会现场观摩学习。参加完这一天的活动后可以感受到，从苏姿丰的判断，到整场大会的选题和阵容，都折射出AI行业正在加速转变。竞争的焦点，正在从模型能力转向系统工程与全栈优化能力。推理、训练、微调，开发者在每一个环节上面对的挑战，都在变得更加具体、更加工程化。开发者真正需要的，是一套可以落地、可以优化、可以持续演进的工程体系。这个判断在中国尤其成立。 DeepSeek、Qwen……过去两年全球最活跃的一批AI工程项目，从未缺少过中国的影子。中国开发者从来都不只是AI应用的消费者，更是基础设施的建设者。 AMD今天带来的，正是围绕这一趋势的系统性回应。 AI开发者需要新的工程体系 AI落地的成本问题，正在成为整个行业绕不开的核心议题。图灵奖得主、Google杰出工程师David Patterson在2026年初发出警告，他表示，AI大规模落地，正面临一场成本危机。这场危机乍看有一个颇具反差的面貌，Token一降再降，但同期的企业AI预算却不降反增。背后的原因，是AI的工作范式正在发生根本性转变。 OpenClaw、Hermes等Agent框架在几个月内成为开发者社区最热的基础设施，意味着项目从单次问答切换到Agent工作流。新的工作流下，我们完成一项任务需要多轮规划、多次工具调用、反复验证，每一步都在产生算力消耗。单次成本降低的情况下，总体成本从账单上的单行数字，变成了系统层面更难看清的累积。系统层次的问题，自然需要系统性的解决方案，这标志着AI竞争正在进入一个新的阶段。在这个阶段里，能不能在规模化之下把整套体系跑得稳、跑得省、跑得持续，才是真正的考验。这种考验可以拆解成三个层次。首先是成本层面，使用规模越大，Token消耗的累积效应越明显。一个团队跑十个并发Agent和跑一千个，差异不只是消耗的Token量，整个系统的调度、容错、资源分配都要重新设计，成本结构随之从线性变成指数级。一个对话框里问一个问题，消耗的是单次调用；但Agent工作流要完成一项任务，背后是多轮规划、多次工具调用、反复验证的完整链路，每一步都在产生算力消耗。使用规模越大，这种累积效应越明显，成本结构随之从线性变成指数级。其次，在复杂度层面，工程难度的跃升源于AI应用形态的根本变化。过去的Chat范式下，一个模型对应一种能力，边界清晰；但Agent时代要求AI“能办事”，一套系统里往往同时跑着多个模型、多种模态、分布式计算和工具调用，任何一个环节的延迟或失败都会影响整个链路。工程师面对的，是如何维护一套持续演进、随时可能扩展的生产系统。最后是部署层面，场景碎片化正在成为新的工程负担。云端推理满足不了所有场景，有些场景要求数据不出本地，有些场景对延迟极度敏感，有些场景根本没有稳定网络。这些需求把开发者推向了边缘设备和端侧部署，但每换一个硬件平台，工具链、优化策略、调试环境往往都要重来一遍，碎片化带来的隐性成本在悄悄累积。三层压力叠加，指向同一个结论，开发者真正需要的，是一套可落地、可优化、可持续演进的工程体系。苏姿丰：中国正在领跑开放生态这次AI开发者大会上，AMD董事会主席、首席执行官苏姿丰对这套需求给出了AMD的判断： Agent时代，每个人可以拥有5个、10个甚至100个Agent，算力消耗的结构随之发生根本性变化，单纯堆GPU已经不够，GPU加CPU的完整端到端算力组合才能真正满足需求。 AMD的解决策略，是提供覆盖云端到端侧的全栈算力，以ROCm开源软件平台为核心，让开发者在每一个部署场景里都能找到合适的工具。这些判断，有更长的来路。 AMD在全球战略层面，面对AI工程化大趋势，有着一套一以贯之的战略。今年年初的CES 2026上，苏姿丰已经给出了方向：开放生态是AI下一阶段的基础设施。只有行业围绕开放基础设施和共享标准走到一起，创新才会加速。基础设施意味着它不属于任何一家公司，它是整个行业共同依赖、共同建设、共同受益的底层。 AMD选择把这个词用在开放生态上，就是在表明一种立场：AI的未来，不应该被锁定在某一套封闭的系统里。这个立场，也在推动着AMD对自身定位的重塑。从卖芯片到做平台，AMD的目标是成为开发者可以跨越硬件迭代、长期信赖的软件平台。软硬件协同与开放生态是实现这一目标的路径。软件层面的开放让开发者不被硬件代际绑定，硬件层面的持续迭代为软件生态提供更强的底层支撑。两者互相加持，形成一个庞大开发者群体愿意长期留在其中的体系。具体到中国市场，AMD深耕大中华区超过30年，上海研发中心是AMD全球最大的研发中心之一。在苏姿丰看来，中国不只是AMD的重要市场，更是AMD全球路线图的重要组成部分，从芯片到AI软件，再到平台工程，AMD在中国的投入覆盖了完整的技术栈。同时，在开源生态的判断上，苏姿丰直接点出，中国正在领跑开放生态，这种开放性是推动整个AI生态尽可能快速演进的核心力量，也与AMD的战略方向高度契合。这次在上海举办大会，正是这套战略在中国市场落地和延续的彰显。在中国，这套战略落到实处意味着这几件具体的事：持续投入本地开发者社区建设，让中国开发者在日常工程实践中能真正用起来、用得好；与本地开源生态协同，免去开发者自己去做适配工作的繁冗；最终把AI开发与部署的门槛降下来，让更多团队有能力把想法变成跑在生产环境里的系统。 AI开始进入系统化工程实践 AI工程化的竞争，正在变成整个开发者社区需要共同面对的基础建设问题。这次AMD的AI开发者大会，设置了实战工作坊和技术专题演讲环节，其中的议题分布，就是当下AI工程实践的一个截面。推理方向的议题，集中在Agent时代带来的新挑战上。单轮问答的时代，推理成本可以用单次调用的价格来衡量；Agent工作流完成一个任务要经过多轮规划、工具调用和验证，消耗结构完全变了。如何在新范式下压低Token成本，如何让推理引擎在高并发场景下维持吞吐效率，如何让推理优化本身也能自动化运转，是整个行业正在啃的硬骨头，也是这次推理专题的核心命题。值得注意的是，训练方向的议题，折射出AI应用走向纵深之后的工程压力。 RLHF从研究论文变成各团队的标配流程，怎么在单卡上高效跑通端到端的对齐训练就成了实际问题； MoE架构开始大规模商用，超大规模训练的稳定性和效率，变成了每天都要面对的工程任务。端侧方向，则是变化最明显的一块。完全离线的AI桌面机器人、本地大模型驱动的个人Agent、在本地硬