科技头条
morning
阿里云峰会的几个隐秘信号
2026-05-22
1 阅读
硅基星芒
文 | 硅基星芒 还记得五月初,AI评测里出现了两款神秘国模A和B吗? 这是开发者toyama nao发布的测试结果。这款极限分数超越了Gemini 3.1 Pro和Claude Opus 4.6的国模A,一时间众说纷纭。 如今,随着2026年阿里云峰会主论坛的开幕,国模A的真实身份也得以浮出水面: 阿里云正式发布了新一代旗舰模型Qwen3.7-Max。 不过,这次峰会与以往最大的区别在于,主角不再是参数规模、上下文长度和聊天体验的炫技,而是一个清晰且激进的方向: All in智能体。 与其称之为一场发布会,不如说这是一场阿里与所有AI用户的一次技术探讨。 CTO李飞飞在主论坛演讲中直言: 云的价值,正在从规模化管理和运营算力,进入规模化管理和运营智力。 3月正式接手林俊旸离职后留下的Qwen的周靖人则更加直白: 大模型已经从“人类价值对齐”转向“任务对齐”。 短短的两句话,对应的是长远的目标规划:阿里的AI战略正在拆除模型、算力、安全、应用之间的边界,将它们重构为Agent体系下的标准化组件。 本文将以一个开发者的视角,来拆解这场峰会透露出来的隐秘信号。 01 一切皆为Agent组件 如果说过去两年,大模型公司的竞争焦点是“谁的模型更强”,那么从这次峰会来看,阿里给出的答案是:模型只是起点,而Agent只是目前能看到的终点。这不是一句口号,而是实打实地反映在了两个方面。 一方面,模型正在被重新定义: 在Agent中,模型不能只是大脑,还要成为智能中枢。 Qwen3.7-Max的定位很清晰,它是面向智能体时代的新一代旗舰模型,官方宣传的核心能力也全部围绕着Agent展开: 长周期自主执行 :模型在长达35小时、超过1000次工具调用的内核优化实验中,能够持续推理且保持能力不退化; 跨框架泛化 :模型无论部署在Claude Code、OpenClaw还是自家的Qwen Code,性能表现相对稳定; 原生工具调用 :模型支持MCP集成和多智能体协作,可以直接操控办公软件、云服务甚至更高形态(具身智能)的物理机器人。 这就是新一代模型最大的转变,不再是孤立的“大脑”,而是被设计成Agent的中央处理器。这也符合Agent设计的核心要求—— 必须能规划、调用工具、反思、纠错并适应各种运行环境。 从官方公布的评测数据来看,Qwen3.7-Max的基准测试结果已经接近Anthropic的上一代旗舰模型Claude Opus 4.6和国内模型顶尖水平。当然,这些多是阿里自报的成绩,且在部分编程基准测试中仍然与Claude Opus 4.6存在几个百分点的差距。 结合Artificial Analysis的第三方测试结果,Qwen3.7-Max智能水平位列全球第五,编程能力位列全球第七,二者均为国内第一。代理能力则略逊于小米和智谱,但差距只在毫厘之间。 另一方面,云基础设施正在被重构: 从AI原生云,演进为Agent原生云。 李飞飞在演讲中提出了两个值得行业关注的关键概念:AI Native Cloud(AI原生云)和Agent Native Cloud(智能体原生云)。这两个概念之间并非是字面意义上的包含关系: AI原生云要做的是生产token,通过预训练、后训练和推理的全链路优化(比如KV Cache命中率超过90%),让token足够便宜和高效。 Agent原生云要做的是把token变成action,为智能体提供运行时沙箱、编排、治理、安全、记忆、数据平面六个方向的支撑。 这两个概念的提出,间接地否定了以DAU、token消耗量、DAA等诸多中间变量作为衡量Agent产出价值唯一标准的观点。 与此同时,这也是一个十分务实的想法。毕竟,与其过早地关注如何评判Agent的价值,不如先搞清楚Agent该如何发挥价值。 更加值得关注的是,李飞飞当场宣布阿里云旗下所有的云产品将在今年完成控制面改造,实现Agent应用所需的“Skill化”、“MCP化”和“CLI化”,智能体将会替代人类成为云产品的第一用户。未来企业调用OSS存储、PolarDB数据库和DataWorks数据平台这些产品,不再需要人工点击控制台或是编写脚本,而是全部由Agent自然语言驱动。 从上述两个方面的变动可以清晰地看出,阿里已经一改往日全面覆盖的策略,转而 完全将Agent作为设计原点,模型、硬件、安全框架和存储都不再是独立的产品线,而是都将成为Agent体系下的插件。 从程序员的角度来看,这完美符合类似操作系统设计开发的哲学:Agent是应用程序,底层基础设施提供标准化的API和运行时。 02 企业级市场明确定为主战场 纵观主论坛的发布内容,尽管没有白纸黑字地写出来,但阿里云的服务中心已经明显偏向企业级客户。若是程序员中的个体户,甚至会在聆听中产生一种陌生感。 这不是个人偏见。李飞飞在峰会上花费大量篇幅讲的“六大挑战”、“六大解决方案”,里面涵盖的沙箱隔离、身份认证(Token Vault)到任务级安全管控,无一例外都是企业IT部门最关心的非功能性问题。 相比于国内外竞争对手往往在发布会上大多提及个人开发者和小型开发团队的重要性,阿里想要做的是快速凭借已有基础抢占企业市场。深层原因有三个: 一是 付费意愿与场景复杂度。 消费级AI助手的付费率有限,这在今年二月的“下千问喝奶茶”的活动中已经得以体现,只有企业才愿意为“节省一个开发团队”或“自动化合规流程”支付高额订阅费,哪怕最终落地结果可能与预想存在一定差距。 在周靖人的演讲中,有一个极其容易被忽视的细节: Qwen3.7深度参与了35小时的自主优化芯片内核过程。 如果其能力足已取代资深工程师的加班时间,商业价值已经不言而喻。 二是 阿里云的既有生态优势。 作为中国最大的云服务商,阿里云已有数百万企业客户作为基础。这些客户数年来持续使用RDS、OSS、MaxCompute等产品,数据和使用习惯的积累早已潜移默化地转变为了极高的迁移成本。 从技术角度看,将Agent无缝嵌入现有的云产品,也比从零打造一个B端App更容易形成商业闭环。 三是 安全和治理才是定价权的来源。 抛开国外几家顶尖模型不谈,将目光放在国内,AI能力投影到智能体上逐渐同质化已经是不争的事实。从OpenRouter的调用量来看,能够决定个体开发者或小型开发团队选择的唯一因素就是价格,限时免费模型的调用量几乎全部能够霸榜一周甚至更久。 然而对于企业来说,真正影响采购决策的问题在于:是否敢让Agent自动操作生产数据库?阿里云推出的Agent安全中心、Agent ID Guard、AI安全护栏2.0等产品,直接把安全问题抬到了明面上,本质上就是在给企业级的冒险行为提供保险。换句话说, 在安全治理上建立标准,等同于现阶段更高的议价能力。 阿里的战略,其实就是用智能体提升效率,加上用安全体系降低风险。李飞飞口中的“六大挑战”,与其说是技术问题,不如说是企业采购清单上的必选项。 03 Vibe Coding的演进形态:Vision Coding 从技术本质上说,Vibe Coding是Agent最早期、最初级的一种形态,但历经几个月的发展和尝试,Vibe Coding成为了最成功、最具备商业化价值也最成熟的形态。 但这种被各大A