智能AI morning

Agent时代,华为云开始重新造地基了

2026-06-15 1 阅读 梦晨
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> Agent时代,华为云开始重新造地基了 梦晨 2026-06-15 11:40:26 来源: 量子位 Agentic新基建 林方舟 发自 凹非寺 量子位 | 公众号 QbitAI 许多人抱怨OpenClaw等Agent不够好用。 它反应慢还总失忆,聊着聊着突然不理人,经常施加冷暴力。 这不是调整Prompt、或者换个模型就能解决的。根子在于:底层的基础设施,还没有为Agent时代做好准备。 6月5日,华为云在上海举办INSPIRE创想者大会,会上密集发布了一批Agentic的「铲子」。 它们堪称Agent时代的新基建,瞄准的,都是Agent「干不了的活」背后的具体卡点。 Agent时代的新基建 Agent时代来了,但大多数企业还没准备好。 算力跟不上、记忆撑不住、调度乱成一锅粥、安全更是黑盒——这些问题不解决,Agent就很难进入企业核心业务。 这次,华为云发布了一整套Agentic基础设施。四个新产品,分别对准一个卡脖子的问题。 先来看 AICS灵衢智算集群 ,它负责 「算得快」 。 Agent需要连续推理、多步决策、实时响应,它的算力需求,比大模型高得多,Token的消耗量级也完全不同。 AICS灵衢智算集群要解决的问题是:如何让成千上万张芯片高效协同工作,实现「低时延、高吞吐、高可用」。 它能把推理时延压到10毫秒以内,集群规模拉到10万卡,单集群算力达到200 EFLOPS,千卡每秒吞吐500万Tokens,在线推理服务可用度达到99.95%。 华为云表示,这套AICS灵衢智算集群,是国产智算云的Top 1。 光算得快不够,Agent还得 「记得住」 。 与AI聊过天的人都有体会,在长上下文场景下,聊着聊着,它就忘了你前面说过什么。 如果只是普通聊天,当大模型「健忘」,开启一场新会话就罢了。但企业场景不行。Agent得记住上下文,沉淀经验,理解用户偏好,撑住持续好几天的长任务。 华为云拿出的 AMS Agentic记忆存储 ,给Agent设计了一套分层记忆系统。 它拥有PB级记忆空间,规模比业界大一倍;它的全新盘级存储架构加三合一芯片,达TB级读取速度,整体性能领先业界50%;DRAM内存池化与分层联动,能把记忆缓存命中率做到95%。 有了它,妈妈再也不用担心Agent的学习。 第三个新产品是 CCE Volcano Next ,它是一个算力调度引擎,解决的是Agent 「调得动」 的问题。 在真实企业场景中,训练、推理、Agent执行、存储调用往往同时跑,僧多粥少,经常互相抢有限的CPU、NPU、网络带宽资源。 Volcano Next扮演的就是 「交通指挥员」 ,协同调度通算、智算、存储,确保互不干扰,还能共享资源。 凭借它,典型场景资源利用率提高了30%(省下来的算力,就是省下来的钱)。 最后一个新品 AgentSphere ,是一个 「安全可靠」 的智能体运行环境。 Agent跟聊天机器人最大的区别,就是它真的会动手。这也意味着,如果操作不当,它有越权、泄密、行为无法追溯的安全风险。 AgentSphere给Agent划了一块「安全工作间」:依托内核级沙箱隔离,搭配双向网络防护、会话级权限管控及恶意意图防控,能满足业务场景的安全自治需求。 同时,性能也没掉链子:羽量级沙箱能实现100毫秒级启动,每分钟能创建销毁十万个沙箱,支撑Agent训练与运行不卡壳。 除了以上「地基」四件套,华为云还同步发布了平台层产品——重新定义MaaS的 ModelArts Next 。 传统MaaS是「模型即服务」,企业调用模型的 API;但到了Agent时代,企业需要的是一整套能力。 华为云把四项能力打包进来: 模型矩阵 ,解决「有哪些模型可用」的问题,DeepSeek、Kimi、GLM等主流模型Day 0上架; 模型路由 ,解决「任务派给哪个模型最合适」的问题,三种调度策略自动切,精准率超95%,调用成本平均降低20%以上; 机密推理 ,解决「敏感数据敢不敢用AI」的问题,依托硬件级TEE,数据用完就销毁,连云厂商运维都碰不到; RLaaS ,解决「Agent能不能越用越聪明」的问题,1分钟建任务,支持超10天长稳训练,云南交投拿来跑交通流量预测,精度提升约10%。 最后还有一个有意思的新品: 「智果园」 ,它是一个Agentic云入口。 华为云认为,以后用云平台的,可能不是人,而是Agent。 过去,人通过控制台、API、命令行来购买资源、配置环境、部署应用;但在Agentic AI时代,这些操作有可能被智能体接管。 智果园就是为「硅基用户」提供的入口,用户只需在对话框说出目标,Agent就能自己买云、建云、用云、管云。 换句话说,它把原本分散在云控制台里的产品、资源和流程,重新组织成Agent可以调用的能力。云平台不再只是给人看的操作界面,而开始变成一套可被智能体理解、调用和执行的基础设施。 行业AI梦工厂 基础设施搭好了,Agent能不能真正落地,还要看行业。 去年12月,华为公司董事、华为云CEO周跃峰提出了一个概念: 「行业AI梦工厂」 。 它的核心逻辑是,华为云不只提供算力和平台,还把自己在医疗、自动驾驶、具身智能等领域长期积累的技术能力、工具链和行业实践经验,全部开放,赋能开发者,共同推动行业AI落地。 智慧医疗专区 ,是「行业AI梦工厂」的首个专区。 面向基层医院、医生、产业伙伴、开发者,华为云搭了一套端到端的医疗AI支撑体系,包括智慧病理服务、医疗AI使能平台、医疗AI社区等。 其中,智慧病理服务具备「少样本训练、消费级PC推理」能力。 也就是说,科室医生不需要懂AI,用自己日常办公的电脑,加上云上的能力,就能部署一个专属病理模型,训练数据量只要传统方案的十分之一。 它的底座,是上海瑞金医院的病理临床经验,加上华为自己的ICT、云和AI技术。 目前,这套智慧病理方案已经在全国铺开,覆盖顶级三甲、地市级、县域医院。 本次大会上,另有20多家医院正式入驻。医疗AI使能平台将在6月30日开启公测。 除了医疗,华为云还切入了火热的具身智能赛道。 当前,具身智能开发面临一个普遍问题:数据散、模型杂、工具链不统一,一个机器人团队光搭基建,就要耗掉大量精力。 华为云发布的 CloudRobo ,是全球首个全流程具身智能开发平台,从数据生产、评测、模型训练、仿真强化到真机部署,一条线拉通。 数据侧,它支持PB级并行处理和跨本体映射,还打造了业界首个全国产的Real-Sim数据生产体系。 训练侧,它搞了个「乐高式」可插拔模型引擎,让不同模块可以灵活组合。基于这套引擎打造的双系统VLA,主动预测力控能力已经达到行业SOTA水平。 华为云还举办了首届具身智能大赛,线上仿真初赛,线下真机决赛。以赛代练,推动整个行业拓宽技术边界。 「行业AI梦工厂」的另外两个专区,也值得一提。 科学计算专区 ,面向的是AI4S这条更「硬核」的赛道。 生命科学、材料化学、气象海洋……这些领域