5个月MaaS收入增长15倍，阿里云找到了做大Token生意的办法

文｜邓咏仪编辑｜张雨忻 “阿里云MaaS业务的Token收入，在2026年的过去5个月里增长了15倍，月度Token收入已经达到数亿元级别。”这是阿里云在5月20日的发布会上给出的最新数字。而拉动这笔收入的最直接原因指向了一个词：Agent。这一天，阿里云发布了新一代旗舰模型Qwen 3.7 Max等一系列产品，这距离Qwen 3.6 Max的面世仅仅过去了一个月。为什么这么着急？随着今年2月OpenClaw的爆火，各家模型厂商都开始针对Agent做模型在Coding能力上的提升。大模型的Coding能力之争越来越白热化，阿里也必须端出一款在Coding方面能打的模型，保持自身MaaS业务的竞争力。“未来是Agent Cloud的时代。”阿里云公共云总裁刘伟光表示。无独有偶，大洋彼岸的硅谷，Google I/O大会也在同一天举办，主题同样是Agent Cloud，Google新发布的芯片、模型、应用……几乎所有产品也都围绕Agent展开。 Agent Coding，已经成为全球现阶段的AI共识。 △图源：阿里云狠狠做Agent 发布会第一个端上来的新“千问云”官网，这是一个为Agent设计的网页，也是阿里云成立17年以来，第一次为单独业务做的独立官网。 △图源：千问云 “千问云是为Agent设计的，而不是人类。”阿里云公共云事业部负责人刘伟光说，这来自2024年底，阿里云内部的一个判断：未来云计算产品的主要使用对象，也会逐渐从人类工程师变成Agent。在过往，一个开发者或企业想要在云上部署服务，需要打开官网，注册之后，然后面对上百个产品分类，自己选机型、配网络、开实例、装环境、调API——每一步都需要人类工程师做判断，上手门槛不低。但在千问云官网上线背后，动线会发生变化：Agent会先找模型，再找工具和skills，最后才是底层云资源。顺序反过来了。一个例子是，在龙虾上线后，阿里云发现Agent可以在一天之内自动完成云计算资源的开通，这在过去，是人类要干两周的活。“未来不需要人来开通了，Agent自动就在后台把云计算资源激活了。”刘伟光说。官网只是前菜。阿里云从上层的模型到Infra到底层的芯片，都围绕Agent重新完成了一次适配。首先是新一代旗舰模型Qwen 3.7 Max的推出，这距离Qwen 3.6 Max的发布仅一个月时间。尽管一直以来阿里在开源领域建立了不错的影响力和口碑，但相较国内的智谱GLM、Kimi，阿里的旗舰模型并没有享受到小龙虾带来的最大红利。而Qwen 3.7 Max的发布，则阿里在Coding领域试图扳回一城的动作。在目前业界最权威的代码能力测试中，Qwen 3.7 Max已经追平了DeepSeek的最强版本，在难度更高的复杂工程任务测试中，Qwen 3.7 Max也排到了第一的位置。 △Qwen3.7-Max可独立执行长达35小时的长程复杂任务，工具调用数量也在各大模型中位于前列，图源：阿里云相较上一代Qwen 3.6 Max Preview，Qwen 3.7 Max最大的升级是长周期任务能力的大幅强化——Agent可以自主执行跨越数十小时、上千步骤的复杂任务，而不需要人类中途介入。长程任务能力越强，意味着Agent能够独立完成的任务复杂度越高、人类介入越少。这也是Claude Code、Gemini Deep Research等当下最强Agent产品的核心竞争维度。阿里云CTO周靖人举的一个例子是：在平头哥的新芯片平台上，Qwen3.7-Max通过自主编程和超1000次工具调用，实现了平台关键内核的自我进化，推理速度较原版本提升10倍。这意味着，模型能够像成熟的工程师一样，独立解决代码中间缺陷的问题，也可以帮助工程师开发复杂的功能。而这些任务能够完成，也离不开芯片和Infra的适配：在芯片层，阿里云的新一代训推一体AI芯片真武M890，以及自研互联芯片ICN Switch 1.0，都搭载在超节点服务器上，主打的就是Agent的大规模并发场景。而现在，阿里平头哥PPU芯片出货已经超过54万片，并且在悟空、秒悟等AI应用中已经开始提供推理服务。怎么把Token生意越做越大 Agent爆发带来了Token消耗的爆发——Agent本质是代码生成，一次任务调用的Token量，是普通对话场景的十倍甚至百倍。所以，Agent共识也直接演变成了模型市场的一场明牌战争：谁的模型在Agent场景下被调用得多，谁就能够迅速获得收入——当今市场的最大赢家无疑就是Anthropic，据华尔街日报，Anthropic的营收预计将在第二季度增长一倍以上，达到109亿美元。 △图源：华尔街日报阿里云也受益于此。2025年，阿里云自然年全年营收超1466亿元，当年营收增速28.6%，后者主要得益于AI产品的贡献。阿里巴巴CEO吴泳铭在上周的财报电话会上透露，6月份季度，包含百炼MaaS平台在内的AI模型与应用服务年化经常性收入（ARR）将突破100亿元，年底突破300亿元。不过，在这场Token战争中，阿里和字节选择了两种不一样的打法。 “Token带来的收入主要来自两端，一端是以Coding为代表的大语言模型，另一端是视频模型。但在过去一段时间，很多人会把两个市场的Token增量混为一谈，这是不合适的。”刘伟光强调。字节占住了视频模型市场——有研究机构测算，Seedance 2.0爆火后，字节在视频模型市场的Token日均消耗已占整个市场的80%。2025年底火山曾立下目标——2026年MaaS服务收入超过100亿，但在Seedance 2.0爆火之后，这个目标已经再度上调。相较之下，阿里云则在大语言模型上占据优势。“有开发者的公司，才会需要云，所以阿里云的存量客户（肯定有开发者）几乎都是Coding的潜在用户。”刘伟光说。 2025年底，阿里云曾喊出“2026拿下AI云市场增量的80%”的业务目标。阿里云将当下的业务火力，集中在了Coding领域。“今年前5个月，我们可以说，阿里云已经拿到了LLM模型市场增量的80%。” 为了配合这一目标，阿里云对销售的考核方式也在变—— 不是看谁卖出去的Token量最大，而是比谁卖出去的Token最值钱。简单来说，阿里云现在追求的，并不是简单聊天产生的Token消耗，因为这类模型的价格已经到了地板价。相反，阿里云如今的一个核心指标是：模型接入客户的核心业务系统数量。这意味着，阿里云希望卖出去的Token，是被客户用来写代码、做决策、跑流程。而一旦进入企业的核心生产流程，Token消耗量是指数级上升的，单价更高，复购更稳定，对应的也是更高质量的收入。这源于Coding的Token消耗逻辑和视频并不一样。视频模型的Token消耗是一次性的——生成一段视频，任务结束。代码场景则更像一个自我进化的过程：模型写出代码，代码变成应用，应用部署到云上，应用运行起来后又需要调用模型，模型再生成更多代码。如今的大模型竞赛，已经完全是一种系统工程的较量——芯片、Infra与大模型的耦合，已经成为影响模型训练、提供推理服务系效率的最重要因素；商业竞争也在加速，则是迅速验证场景价值，为模型反哺智能。 “芯片、模型和云

订阅66必读