智能AI
morning
苏姿丰上海开讲:AI正在重新定义计算的每一层
2026-05-20
1 阅读
克雷西
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 苏姿丰上海开讲:AI正在重新定义计算的每一层 克雷西 2026-05-20 08:48:27 来源: 量子位 AMD持续加码中国开发者生态建设 克雷西 发自 上海 量子位 | 公众号 QbitAI “AI正在重新定义计算的每一个层次。” 这是AMD AI开发者大会今天首次落地上海时,AMD董事会主席、首席执行官苏姿丰针对AI行业给出的最新判断。 这次应AMD邀请,量子位来到了这场大会现场观摩学习。 参加完这一天的活动后可以感受到,从苏姿丰的判断,到整场大会的选题和阵容,都折射出AI行业正在加速转变。 竞争的焦点,正在从模型能力转向系统工程与全栈优化能力。 推理、训练、微调,开发者在每一个环节上面对的挑战,都在变得更加具体、更加工程化。 开发者真正需要的,是一套可以落地、可以优化、可以持续演进的工程体系。 这个判断在中国尤其成立。 DeepSeek、Qwen……过去两年全球最活跃的一批AI工程项目,从未缺少过中国的影子。 中国开发者从来都不只是AI应用的消费者,更是基础设施的建设者。 AMD今天带来的,正是围绕这一趋势的系统性回应。 AI开发者需要新的工程体系 AI落地的成本问题,正在成为整个行业绕不开的核心议题。 图灵奖得主、Google杰出工程师David Patterson在2026年初发出警告,他表示,AI大规模落地,正面临一场成本危机。 这场危机乍看有一个颇具反差的面貌,Token一降再降,但同期的企业AI预算却不降反增。 背后的原因,是AI的工作范式正在发生根本性转变。 OpenClaw、Hermes等Agent框架在几个月内成为开发者社区最热的基础设施,意味着项目从单次问答切换到Agent工作流。 新的工作流下,我们完成一项任务需要多轮规划、多次工具调用、反复验证,每一步都在产生算力消耗。 单次成本降低的情况下,总体成本从账单上的单行数字,变成了系统层面更难看清的累积。 系统层次的问题,自然需要系统性的解决方案,这标志着AI竞争正在进入一个新的阶段。 在这个阶段里,能不能在规模化之下把整套体系跑得稳、跑得省、跑得持续,才是真正的考验。 这种考验可以拆解成三个层次。 首先是成本层面,使用规模越大,Token消耗的累积效应越明显。 一个团队跑十个并发Agent和跑一千个, 差异 不只是 消耗的Token量,整个系统的调度、容错、资源分配都要重新设计,成本结构随之从线性变成指数级。 一个对话框里问一个问题,消耗的是单次调用;但Agent工作流要完成一项任务,背后是多轮规划、多次工具调用、反复验证的完整链路,每一步都在产生算力消耗。 使用规模越大,这种累积效应越明显,成本结构随之从线性变成指数级。 其次,在复杂度层面,工程难度的跃升源于AI应用形态的根本变化。 过去的Chat范式下,一个模型对应一种能力,边界清晰;但Agent时代要求AI“能办事”,一套系统里往往同时跑着多个模型、多种模态、分布式计算和工具调用,任何一个环节的延迟或失败都会影响整个链路。 工程师面对的,是如何维护一套持续演进、随时可能扩展的生产系统。 最后是部署层面,场景碎片化正在成为新的工程负担。 云端推理满足不了所有场景,有些场景要求数据不出本地,有些场景对延迟极度敏感,有些场景根本没有稳定网络。 这些需求把开发者推向了边缘设备和端侧部署,但每换一个硬件平台,工具链、优化策略、调试环境往往都要重来一遍,碎片化带来的隐性成本在悄悄累积。 三层压力叠加,指向同一个结论,开发者真正需要的,是一套可落地、可优化、可持续演进的工程体系。 苏姿丰:中国正在领跑开放生态 这次AI开发者大会上,AMD董事会主席、首席执行官苏姿丰对这套需求给出了AMD的判断: Agent时代,每个人可以拥有5个、10个甚至100个Agent,算力消耗的结构随之发生根本性变化,单纯堆GPU已经不够,GPU加CPU的完整端到端算力组合才能真正满足需求。 AMD的解决策略,是提供覆盖云端到端侧的全栈算力,以ROCm开源软件平台为核心,让开发者在每一个部署场景里都能找到合适的工具。 这些判断,有更长的来路。 AMD在全球战略层面,面对AI工程化大趋势,有着一套一以贯之的战略。 今年年初的CES 2026上,苏姿丰已经给出了方向:开放生态是AI下一阶段的基础设施。 只有行业围绕开放基础设施和共享标准走到一起,创新才会加速。 基础设施意味着它不属于任何一家公司,它是整个行业共同依赖、共同建设、共同受益的底层。 AMD选择把这个词用在开放生态上,就是在表明一种立场:AI的未来,不应该被锁定在某一套封闭的系统里。 这个立场,也在推动着AMD对自身定位的重塑。 从卖芯片到做平台,AMD的目标是成为开发者可以跨越硬件迭代、长期信赖的软件平台。 软硬件协同与开放生态是实现这一目标的路径。 软件层面的开放让开发者不被硬件代际绑定,硬件层面的持续迭代为软件生态提供更强的底层支撑。 两者互相加持,形成一个庞大开发者群体愿意长期留在其中的体系。 具体到中国市场,AMD深耕大中华区超过30年,上海研发中心是AMD全球最大的研发中心之一。 在苏姿丰看来,中国不只是AMD的重要市场,更是AMD全球路线图的重要组成部分,从芯片到AI软件,再到平台工程,AMD在中国的投入覆盖了完整的技术栈。 同时,在开源生态的判断上,苏姿丰直接点出,中国正在领跑开放生态,这种开放性是推动整个AI生态尽可能快速演进的核心力量,也与AMD的战略方向高度契合。 这次在上海举办大会,正是这套战略在中国市场落地和延续的彰显。 在中国,这套战略落到实处意味着这几件具体的事: 持续投入本地开发者社区建设,让中国开发者在日常工程实践中能真正用起来、用得好; 与本地开源生态协同,免去开发者自己去做适配工作的繁冗; 最终把AI开发与部署的门槛降下来,让更多团队有能力把想法变成跑在生产环境里的系统。 AI开始进入系统化工程实践 AI工程化的竞争,正在变成整个开发者社区需要共同面对的基础建设问题。 这次AMD的AI开发者大会,设置了实战工作坊和技术专题演讲环节,其中的议题分布,就是当下AI工程实践的一个截面。 推理方向的议题,集中在Agent时代带来的新挑战上。 单轮问答的时代,推理成本可以用单次调用的价格来衡量;Agent工作流完成一个任务要经过多轮规划、工具调用和验证,消耗结构完全变了。 如何在新范式下压低Token成本,如何让推理引擎在高并发场景下维持吞吐效率,如何让推理优化本身也能自动化运转,是整个行业正在啃的硬骨头,也是这次推理专题的核心命题。 值得注意的是,训练方向的议题,折射出AI应用走向纵深之后的工程压力。 RLHF从研究论文变成各团队的标配流程,怎么在单卡上高效跑通端到端的对齐训练就成了实际问题; MoE架构开始大规模商用,超大规模训练的稳定性和效率,变成了每天都要面对的工程任务。 端侧方向,则是变化最明显的一块。 完全离线的AI桌面机器人、本地大模型驱动的个人Agent、在本地硬