从「自我进化」到「DAA」,百度给出 Agent 时代系统答案

2026-05-13 1 阅读 李文朋
撰稿:文朋 编辑:王玮 进入 2026 年,AI 行业来到一个微妙节点:模型能力持续增强,但真正把 AI 转化为生产力的企业,并没有想象中那么多。 一边是层出不穷的 Demo、榜单和产品发布,另一边是更难回答的问题:当 AI 从聊天助手走向智能体,行业究竟需要怎样的工程系统承载它?又该用什么样的尺度衡量它? 在 Create 2026 上,百度给出了两层答案:第一,把智能体作为新的基础执行主体,围绕它构建从芯片、云、模型到 Agent 的系统能力;第二,承认传统 DAU、Token 消耗等指标不足以完整描述智能体价值,提出 DAA(Daily Active Agents,日活智能体数),用更贴近“任务闭环”的方式重新度量 AI。 这并非一次孤立的大会创意,而是百度过去三年 AI 判断的集中收束。从“AI 内化”为组织能力,到“自我进化”的系统范式,再到 DAA 这把任务尺子,百度正把围绕 AI 应用、智能体、组织变革和基础设施的非共识判断,整合成一套面向 Agent 时代的方法论。 因此,与其说 Create 2026 是一场“最新产品发布会”,不如说它是百度试图完成的一次行业语言对齐:当 AI 不再只是侧边栏里的助手,而是开始具备任务闭环、自主调度、持续优化和深度嵌入组织的能力时,行业需要新的表达方式,也需要一整套新的基础设施来托举。 一、百度的“非共识”,如何一步步变成共识 把李彦宏过去三年的公开表达放在一起看,可以看到一条清晰主线:百度并不是每年提出一个彼此割裂的新概念,而是在持续推进同一个问题——AI 的价值究竟在哪里。 2024 年,当行业讨论仍集中在参数规模、榜单排名、上下文长度和多模态能力时,百度已经开始把重心从“模型有多强”转向“应用是否真正有价值”。 李彦宏在与《哈佛商业评论》总编对谈时提到,中国市场更应该关注产品与市场的契合度,也就是 PMF。同一年,百度多次强调,智能体会成为 AI 应用的重要形态。相比追求一个包打天下的“超级应用”,AI 时代更可能出现大量能解决具体问题的垂直应用。 这个判断在当时并非行业共识。但到 2026 年再回头看,行业对 AI 价值的理解已经发生变化:模型能力不是终点,AI 能否进入业务流程、完成真实任务、带来实际收益,才是更关键的标准。 如果说之前的“应用优先”回答的是 AI 应该落到哪里,那么“超级个体”和“AI 内化”回答的,则是谁来使用 AI,以及 AI 如何真正转化为生产力。 早在 2024 年,百度就已经提出与“超级个体”相关的判断。李彦宏曾预判,未来 5 到 10 年,每个会使用自然语言的人,都可能具备过去只有程序员才拥有的部分能力。 到 2025 年,百度进一步提出“AI 内化”。在百度世界 2025 上,李彦宏表示,当 AI 能力被深度嵌入业务逻辑,智能就不再只是企业的成本项,而会成为生产力项。他提出的“倒金字塔”结构和“效果涌现”理论,也把评价 AI 的尺度从“模型能不能回答问题”,推进到“应用能不能交付结果”。 到了 Create 2026,这条认知线索进一步延伸到“自我进化”。 从现场分享来看,智能体正经历一次阶段性变化。最初,AI 产品更多用于展示和体验能力;随后,它们开始成为辅助专业人员和业务人员工作的工具;现在,随着模型和框架能力提升,越来越多 AI 已能执行长程任务,并参与规模化生产;再往后,智能体还会与人形成反馈循环,在任务执行中吸收经验、更新能力,进入持续迭代阶段。 因此,百度这次讲“自我进化”,并不只是提出一个新的传播概念,而是在描述智能体形态本身的变化:AI 不再只是一次性回答问题的工具,而是开始在任务中运行,在反馈中改进,并在组织内部沉淀为可持续使用的能力。 二、一把新尺子,为什么最可能是DAA 如果说“自我进化”是 Create 2026 关于智能体未来形态的判断,那么 DAA(Daily Active Agents,日活智能体数)则是一项更具体的衡量指标。它试图回答一个更落地的问题:每天究竟有多少智能体,正在替人完成真实任务? DAA 的提出,并不是为了创造一个新的缩写,更像是 AI 进入 Agent 阶段后,行业评价方式的一次调整:在继续关注规模和活跃度的同时,把目光进一步投向任务、交付和结果。 这也是它与 DAU、ARR 形成互补的地方。 DAU 更适合衡量传统互联网产品的用户活跃度,回答的是“每天有多少用户打开了产品”;ARR 更适合衡量商业化成熟度,回答的是“一个产品形成了多少可持续收入”。 但对 Agent 来说,仅靠这两类指标,很难完整描述其价值。一个智能体未必需要用户频繁打开,却可能一直在后台执行任务;一个 Agent 产品也可能尚未形成高额收入,却已经承担了大量真实工作。 也就是说,Agent 的价值不一定只体现在“多少人来过”,也不一定马上体现在“赚了多少钱”,更应该看它是否进入流程、完成任务、交付结果,这也正是 DAA 想要衡量的部分。 结合百度过去两年的公开表述看,DAA 的提出并不突兀。从“数百万超级有用的应用”,到“效果涌现”,百度反复强调的并不是单纯的表面数据,而是应用如何解决问题、交付结果。 因此,DAA 在大会上被正式提出,代表的也不只是一次指标更新,而是 AI 价值判断的变化:从看见用户,延伸到看见任务;从评估使用,进一步评估产出。 从行业背景看,提出这样一把“任务尺子”也有现实必要。 过去几年,大模型能力提升很快,例如 GPQA 这类博士级科学推理评测成绩大幅上升;但与此同时,大模型和智能体真正进入企业生产环境的速度,并没有同步加快。 德勤 2026 年调研显示,只有约 25% 使用 AI 的企业真正把 AI 从实验阶段推向生产环境,企业预期的落地周期也从原来的 3 个月延长到 18 个月。 从这个角度看,DAA 想衡量的,正是目前 Agent 是否真正进入了任务流,是否完成任务闭环,并最终产生实际业务价值。 它也可以与当前以 Token 为核心的行业计量方式形成补充。Token 更多衡量资源消耗和结算规模,DAA 则试图把评价视角进一步推向结果交付和业务价值。 AI 正推动全球和中国的 Token 用量、算力需求快速增长。放在一起看,Token 和 DAA 可以被理解为 Agent 时代互补的两把尺子:Token 回答“AI 消耗了多少计算”,DAA 则进一步回答“AI 到底干成了多少事”。 三、自我进化:从智能体,到超级个体与超级组织 如果说 DAA 试图衡量智能体每天完成了多少真实任务,那么「自我进化」回答的则是另一个问题:这些任务能力如何持续增长,又如何沉淀为个人和组织的生产力。 在百度 Create 2026 的语境里,自我进化并不只指智能体自身能力的提升,它至少包含三层含义:智能体的自我进化、人类个体的自我进化,以及企业组织的自我进化。三者共同构成 Agent 时代生产力变化的基本路径。 首先是智能体的自我进化。 过去的 AI 产品更多承担展示、问答和辅助角色,价值主要体现在一次次调用中。进入 Agent 阶段后,智能体开始执行长程任务,参与真实流程,并在任务反馈中积累经验、更新能力。它不再只是一次性回答问题的工具,而是逐渐变成能够运行、协同、复盘