5个月MaaS收入增长15倍,阿里云找到了做大Token生意的办法

2026-05-22 1 阅读 36kr
文|邓咏仪 编辑|张雨忻 “阿里云MaaS业务的Token收入,在2026年的过去5个月里增长了15倍,月度Token收入已经达到数亿元级别。”这是阿里云在5月20日的发布会上给出的最新数字。而拉动这笔收入的最直接原因指向了一个词:Agent。 这一天,阿里云发布了新一代旗舰模型Qwen 3.7 Max等一系列产品,这距离Qwen 3.6 Max的面世仅仅过去了一个月。 为什么这么着急?随着今年2月OpenClaw的爆火,各家模型厂商都开始针对Agent做模型在Coding能力上的提升。大模型的Coding能力之争越来越白热化,阿里也必须端出一款在Coding方面能打的模型,保持自身MaaS业务的竞争力。“未来是Agent Cloud的时代。”阿里云公共云总裁刘伟光表示。 无独有偶,大洋彼岸的硅谷,Google I/O大会也在同一天举办,主题同样是Agent Cloud,Google新发布的芯片、模型、应用……几乎所有产品也都围绕Agent展开。 Agent Coding,已经成为全球现阶段的AI共识。 △图源:阿里云 狠狠做Agent 发布会第一个端上来的新“千问云”官网,这是一个为Agent设计的网页,也是阿里云成立17年以来,第一次为单独业务做的独立官网。 △图源:千问云 “千问云是为Agent设计的,而不是人类。”阿里云公共云事业部负责人刘伟光说,这来自2024年底,阿里云内部的一个判断:未来云计算产品的主要使用对象,也会逐渐从人类工程师变成Agent。 在过往,一个开发者或企业想要在云上部署服务,需要打开官网,注册之后,然后面对上百个产品分类,自己选机型、配网络、开实例、装环境、调API——每一步都需要人类工程师做判断,上手门槛不低。 但在千问云官网上线背后,动线会发生变化:Agent会先找模型,再找工具和skills,最后才是底层云资源。顺序反过来了。 一个例子是,在龙虾上线后,阿里云发现Agent可以在一天之内自动完成云计算资源的开通,这在过去,是人类要干两周的活。“未来不需要人来开通了,Agent自动就在后台把云计算资源激活了。”刘伟光说。 官网只是前菜。阿里云从上层的模型到Infra到底层的芯片,都围绕Agent重新完成了一次适配。 首先是新一代旗舰模型Qwen 3.7 Max的推出,这距离Qwen 3.6 Max的发布仅一个月时间。 尽管一直以来阿里在开源领域建立了不错的影响力和口碑,但相较国内的智谱GLM、Kimi,阿里的旗舰模型并没有享受到小龙虾带来的最大红利。 而Qwen 3.7 Max的发布,则阿里在Coding领域试图扳回一城的动作。 在目前业界最权威的代码能力测试中,Qwen 3.7 Max已经追平了DeepSeek的最强版本,在难度更高的复杂工程任务测试中,Qwen 3.7 Max也排到了第一的位置。 △Qwen3.7-Max可独立执行长达35小时的长程复杂任务,工具调用数量也在各大模型中位于前列,图源:阿里云 相较上一代Qwen 3.6 Max Preview,Qwen 3.7 Max最大的升级是长周期任务能力的大幅强化——Agent可以自主执行跨越数十小时、上千步骤的复杂任务,而不需要人类中途介入。 长程任务能力越强,意味着Agent能够独立完成的任务复杂度越高、人类介入越少。这也是Claude Code、Gemini Deep Research等当下最强Agent产品的核心竞争维度。 阿里云CTO周靖人举的一个例子是:在平头哥的新芯片平台上,Qwen3.7-Max通过自主编程和超1000次工具调用,实现了平台关键内核的自我进化,推理速度较原版本提升10倍。 这意味着,模型能够像成熟的工程师一样,独立解决代码中间缺陷的问题,也可以帮助工程师开发复杂的功能。 而这些任务能够完成,也离不开芯片和Infra的适配:在芯片层,阿里云的新一代训推一体AI芯片真武M890,以及自研互联芯片ICN Switch 1.0,都搭载在超节点服务器上,主打的就是Agent的大规模并发场景。 而现在,阿里平头哥PPU芯片出货已经超过54万片,并且在悟空、秒悟等AI应用中已经开始提供推理服务。 怎么把Token生意越做越大 Agent爆发带来了Token消耗的爆发——Agent本质是代码生成,一次任务调用的Token量,是普通对话场景的十倍甚至百倍。 所以,Agent共识也直接演变成了模型市场的一场明牌战争:谁的模型在Agent场景下被调用得多,谁就能够迅速获得收入——当今市场的最大赢家无疑就是Anthropic,据华尔街日报,Anthropic的营收预计将在第二季度增长一倍以上,达到109亿美元。 △图源:华尔街日报 阿里云也受益于此。2025年,阿里云自然年全年营收超1466亿元,当年营收增速28.6%,后者主要得益于AI产品的贡献。 阿里巴巴CEO吴泳铭在上周的财报电话会上透露,6月份季度,包含百炼MaaS平台在内的AI模型与应用服务年化经常性收入(ARR)将突破100亿元,年底突破300亿元。 不过,在这场Token战争中,阿里和字节选择了两种不一样的打法。 “Token带来的收入主要来自两端,一端是以Coding为代表的大语言模型,另一端是视频模型。但在过去一段时间,很多人会把两个市场的Token增量混为一谈,这是不合适的。”刘伟光强调。 字节占住了视频模型市场——有研究机构测算,Seedance 2.0爆火后,字节在视频模型市场的Token日均消耗已占整个市场的80%。2025年底火山曾立下目标——2026年MaaS服务收入超过100亿,但在Seedance 2.0爆火之后,这个目标已经再度上调。 相较之下,阿里云则在大语言模型上占据优势。“有开发者的公司,才会需要云,所以阿里云的存量客户(肯定有开发者)几乎都是Coding的潜在用户。”刘伟光说。 2025年底,阿里云曾喊出“2026拿下AI云市场增量的80%”的业务目标。阿里云将当下的业务火力,集中在了Coding领域。“今年前5个月,我们可以说,阿里云已经拿到了LLM模型市场增量的80%。” 为了配合这一目标,阿里云对销售的考核方式也在变—— 不是看谁卖出去的Token量最大,而是比谁卖出去的Token最值钱。 简单来说,阿里云现在追求的,并不是简单聊天产生的Token消耗,因为这类模型的价格已经到了地板价。 相反,阿里云如今的一个核心指标是:模型接入客户的核心业务系统数量。这意味着,阿里云希望卖出去的Token,是被客户用来写代码、做决策、跑流程。而一旦进入企业的核心生产流程,Token消耗量是指数级上升的,单价更高,复购更稳定,对应的也是更高质量的收入。 这源于Coding的Token消耗逻辑和视频并不一样。视频模型的Token消耗是一次性的——生成一段视频,任务结束。 代码场景则更像一个自我进化的过程:模型写出代码,代码变成应用,应用部署到云上,应用运行起来后又需要调用模型,模型再生成更多代码。 如今的大模型竞赛,已经完全是一种系统工程的较量——芯片、Infra与大模型的耦合,已经成为影响模型训练、提供推理服务系效率的最重要因素;商业竞争也在加速,则是迅速验证场景价值,为模型反哺智能。 “芯片、模型和云