寻找开放性的要素：用大型视觉语言模型复制 Picbreeder

摘要

arXiv:2605.23908v1 Announce Type: new Abstract: We are in the midst of large-scale industrial and academic efforts to automate the processes of scientific, technological and creative production throug

the and human their agents

2026-05-26 1 阅读约1分钟阅读 Sam Earle, Kay Arulkumaran, Andrew Dai, Akarsh Kumar, Julian Togelius, Sebastian Risi

arXiv:2605.23908v1 公告类型：新摘要：我们正在进行大规模的工业和学术努力，通过人工智能驱动的助手实现科学、技术和创意生产过程的自动化。从历史上看，这些人类形式的过程的一个基本属性是它们的开放性：它们有能力产生看似无穷无尽的新颖且有意义的新形式。人工智能是否有能力进行如此富有成效的无指导发现？为了回答这个问题，我们转向 Picbreeder，它是人类驱动的开放式搜索的典型范例，其中用户通过小型神经网络的交互进化协作生成多样化的图像库。我们复制了 Picbreeder，用前沿视觉语言模型 (VLM) 取代人类用户。我们观察到我们系统的输出与历史人类基线之间存在明显的定性差异，并尝试使用系统发育复杂性以及视觉和语义显着性和新颖性的指标来表征它们。为了确定造成这些差异的一些因果因素，我们研究了在智能体的选择过程中添加探索性噪音、智能体之间的行为多样性以及以过去行为记忆形式出现的叙事动力。我们在 https://github.com/smearle/picbreeder-vlm 提供我们的代码。

订阅66必读