不卷Token总体,华为云改卷Token生产力:Agent基础设施落后,AI云竞争进入下半场

2026-06-08 1 阅读 褚杏娟
6月5日,在华为云INSPIRE创想者大会上,华为云提出Agentic Infra基础设施范式,并发布通智一体化基础设施、新一代模型训推平台、企业级智能体平台等一系列Agentic AI产品。同时,华为云发布“行业AI梦工厂”智慧医疗、具身智能、智能制造、科学计算四大专区,试图将AI能力进一步引入具体行业场景。 可以看出,华为云正在将Agentic AI的竞争重点从单一模型能力,延伸到算力集群、存储、调度、训推平台、安全机制、智能体工程平台和行业场景。对于企业客户而言,Agentic AI是否能够真正落地,关键不只在于模型本身,也取决于底层基础设施能否支撑长程任务、稳定运行、成本控制和安全可控。 搭建Agentic Infra:从算力供给走向智能体运行底座 华为公司董事、华为云CEO周跃峰在会上表示,Agentic AI正在推动计算范式变化。过去,AI基础设施主要围绕大模型训练和推理展开;但进入智能体时代后,企业需要的不再只是“把模型跑起来”,而是让智能体能够长期执行任务、持续调用工具、管理上下文记忆,并在复杂业务环境中安全运行。 因此,Agentic AI对基础设施提出了四类新要求:一是更高效的Token生成能力,支撑大规模智能体并发调用;二是更长程的记忆能力,让智能体能够处理跨小时、跨天级任务;三是更灵活的算力调度能力,在训练、推理和智能体运行之间动态分配资源;四是更强的安全自治能力,保障智能体在企业环境中的可控运行。 基于这一判断,华为云将Agentic Infra定义为“高效Token工厂、持续学习、通智一体化调度、安全自治”四个方向,并围绕这四个方向发布了对应的基础设施产品。 首先,在算力层面,华为云发布AICS灵衢智算集群。该集群基于灵衢网络,支持10万卡级集群规模,总算力最高可达200 EFLOPS。华为云称,AICS可将Token生成时延降低到10毫秒以内,千卡每秒吞吐达到500万Tokens,在线服务可用性达到99.95%。这对应的是Agentic Infra中的“高效Token工厂”能力。 其次,在记忆与上下文管理层面,华为云发布AMS Agentic记忆存储解决方案。该方案面向智能体长程任务中的记忆瓶颈,通过NPU直通CMS(上下文记忆存储)硬件,提供PB级记忆空间,并支持KV Cache分层池化。其目标是在降低推理成本的同时,支撑天级长程任务,让智能体具备更强的持续学习和上下文保持能力。 第三,在资源调度层面,CCE Volcano Next通智一体化调度引擎主要解决训练、推理和智能体负载之间的资源协同问题。该引擎通过“训推共池”和“碎片整合”,支持通用计算与智能计算混合负载调度。华为云称,该方案可将资源利用率提升30%以上。 第四,在智能体运行环境层面,AgentSphere面向智能体规模化运行,提供弹性扩展、主动防护和沙箱隔离能力。其羽量级沙箱技术可实现100毫秒级启动,并支持每分钟十万级批量创建,用于支撑智能体在云上的安全、高效运行。 在底层基础设施之外,华为云还发布了新一代ModelArts Next模型训推平台,面向模型开发、部署和企业场景适配。该平台重点建设四类能力:RL强化学习服务、机密推理、模型路由和模型矩阵。 其中,MaaS模型路由支持成本优先、效果优先和均衡模式三种策略,可根据请求特征动态选择模型。华为云披露,目前该平台已提供15余款SOTA模型服务,模型调度精准率超过95%,调用成本平均降低20%。企业级RLaaS服务则面向行业场景中的模型持续优化,支持一分钟创建任务、训练过程可视化观测,以及训推一致性保障,降低企业使用强化学习优化模型的门槛。 华为云还联合智谱、DeepSeek、Minimax、Kimi、阶跃星辰、百度、美团LongCat、讯飞星火、爱诗科技、生数科技等20余家TOP模型厂商,发布“百模千态,云聚共赢”生态合作计划,共建系统化商业生态,打造多方共赢的产业发展新模式。 在智能体平台层面,华为云宣布智果AgentArts企业级智能体平台进入公测。该平台面向生产级长程任务、企业级安全、行业知识深度和全链路可观测等需求,主打智能体的工程化落地。与此同时,华为云上线了智果开源版openJiuwen。华为云称,openJiuwen内核与AgentArts企业版同源度超过了90%。 此外,华为云还发布了新的Agentic云入口“智果园”。该入口聚合华为云全栈Agentic云服务、智能体和大模型能力,并将云服务能力Skill化、CLI化,覆盖意图理解、功能开发、资源发放和应用部署等流程。华为云希望将云服务本身进一步智能体化,让用户通过自然语言或智能体工作流调用云上资源和能力。 安全方面,华为云发布了一套覆盖AI全链路的安全方案,主要面向Agent安全、模型安全和Agentic Infra安全。在数据安全层面,华为云发布数据安全专区,涉及硬件专属加密与HYOK技术、数据胶囊技术,以及Agentic基础设施多维度隔离等能力,目标是帮助企业在上云过程中保持数据控制权。 同时,华为云还发布AI机密计算方案,包含机密虚机、云端远程证明服务、机密计算密钥管理、机密推理网关、NPU设备PCIPC直通等能力,支持机密推理、机密预训练和机密联邦学习等场景。 华为云方面还披露,截至目前,华为云已连续稳定运行零重大事故1037天。 华为云CEO:不拼Token总量,而是要看背后的生产力提升 本次,周跃峰阐述了公司的AI云战略:相较于单纯追逐Token规模、MaaS收入或互联网流量,华为云更强调AI对国计民生行业的生产力提升,并将通过国产化算力、全栈AI平台、混合云架构和行业AI梦工厂,构建面向企业与行业的智能体生态。 周跃峰表示,当前AI产业已经进入“Tokens经济”时代,但华为云并不把Token总量或收入规模作为最核心指标。华为云更关注的是,每一个Token背后能否真正带来生产力提升:在医疗行业,Token应当对应一条条鲜活生命的守护;在能源和制造行业,Token应当对应一度电一度电的节约;在金融行业,Token应当对应更多风险防范和业务效率提升。 这也构成了华为云与其他云厂商的核心差异。华为云认为,AI不能只停留在个人问答、情绪价值或消费级应用上,而应当深入政府、医疗、金融、制造、科研、具身智能等行业场景,帮助国计民生行业提升生产力,实现“善政、惠民、兴业”。 周跃峰还表示,华为云并不愿意简单用收入总量、Token总量或算力规模与其他厂商比较。 其原因在于,华为云采用的是国产化算力路线。华为云方面表示,在当前国产化算力正在成长的情况下,没有必要拿国产化算力规模与“万国牌”算力规模直接比较。华为云更看重的是发展“第二个算力平面”,让全球IT工作者和AI开发者拥有更多技术路线和生态选择。 在华为云看来,随着中国半导体产业发展,以及华为提出“韬定律”等方向,中国的“硅基黑土地”会越来越厚、越来越肥沃。华为云也将继续围绕鲲鹏通算、昇腾智算、欧拉操作系统、CANN系统、容器火山平台、ModelArts工具链等能力,构建国产化AI基础设施。 落地过程中,随着AI模型和算力技术迭代速度加快。如果企业或机构完全自建算力、自行部署模型,很可能出现“部署完就落后”的尴尬局面。