智能AI morning

达尔文移动代理:自我进化路线图

2026-06-23 1 阅读 Daniel Beechey, Derek Yuen, Jianheng Liu, Dezhao Luo, Tiantian He, Weilin Luo, Jun Wang, Kun Shao
arXiv:2606.20622v1 公告类型:新 摘要:人工智能的目标是创建能够在开放环境中执行通用自适应行为的代理。在“惨痛的教训”的指导下,我们认为实现这一目标的最有效途径是系统地消除人类先验,并让智能通过与比智能体本身复杂几个数量级的“大世界”交互而自然出现。我们提出移动图形用户界面(GUI)作为这样一个世界的实用代理,并介绍达尔文移动代理,这是一个开源基础设施,旨在作为该领域自主强化学习的基础。该框架通过使用跨并行云电话实例的异步代理环境循环来解决现实移动交互中的数据收集瓶颈。我们进一步提出了一个概念路线图,以系统地从自我进化代理的三个基本支柱中消除人类先验:任务课程、结果验证和内存管理。我们验证了 Darwin 基础设施提供了本路线图第一阶段所需的稳定性和可扩展性:GUI 域中的策略优化。这项工作为实现真正自主、自我进化的 GUI 代理奠定了必要的实践和理论基础。