开发者生态
evening
与 Mythos 合作是什么感觉
2026-06-09
1 阅读
swolpers
与 Mythos Claude Fable 合作的感觉代表了 AI 领域的又一次重大飞跃 Ethan Mollick Jun 09, 2026 405 13 16 分享 我提前接触到了第一个向公众发布的 Mythos 级人工智能模型,Claude 5 Fable。关于 Mythos 的大部分讨论都集中在它对软件安全的影响上,但我对除此之外的所有内容都进行了测试(围绕《神鬼寓言》的护栏基本上阻止了它用于网络安全)。我的结论是,它代表了我之前使用过的每个模型的一个非常真实的飞跃,也许更重要的是,它表明我们与人工智能的关系正在发生巨大的变化。首先,寓言有多好?在我进行的一次又一次的实验中,它的性能基本上远远超过了我使用过的所有其他公共模型。它能够解决许多问题,并产生了一些令人惊讶的结果——它可以在多页规范上执行长达十几个小时。我将很快引导您完成几个更复杂、更严肃的用例,但您可以看到每项任务的全面改进。在帖子中传达这一点的问题是,许多最令人印象深刻的结果只会对我的一小部分读者感兴趣。例如,它通过一次提示和一条反馈就发表了我所见过的人工智能中最复杂的学术社会科学论文。它还创作了一首关于理发的 10 页史诗押韵诗,其中每个单词都以字母 s 开头。因此,作为一个更易于访问和娱乐的示例,我还让它创建了一堆您可以尝试的游戏。所有这些都是克劳德代码中的一个初始提示,《寓言》必须接受我模糊的提示并生成一些可行的东西,然后是一些带有轻微鼓励(“让它变得更好”)或反馈的附加提示。让这些特别令人印象深刻的是 Claude 无法生成图像,因此每件艺术品或 3D 对象都是仅用数学制作的,不使用任何外部资源。你可以尝试其中任何一个:一个关于翻转硬币的游戏(提示:“Balatro,但是为了翻转硬币的游戏”),非常有趣;蛇游戏,蛇有自我意识,疯狂的事情会发生;将一位著名德国浪漫主义诗人的作品翻译成艺术游戏(“杜伊诺挽歌作为游戏。调整好情绪”);或者是一个关于深入到深处看看里面有什么的游戏。所以输出是令人印象深刻的。但是,特别是当我转向更严肃的项目时,我经常觉得使用该工具介于令人愉快和令人不安之间。令人高兴的是因为我只是在事情发生时要求了一些东西。而且也令人不安,因为我只是要求一些东西,它就发生了。地图和方法 要了解原因,有助于理解 Fable 完成工作的方式,为此,我想转向我在许多以前的 AI 模型上测试过的示例:构建等时线图。这是一张显示在给定时间内您可以行驶的距离的地图,第一张地图创建于 1881 年,显示了从伦敦出发的旅行时间。原始地图 以前的模型在尝试创建这样的地图方面都没有做到一半有用,因为它涉及研究数千个潜在的行程距离以及许多小的判断和决策。我决定使用 Claude Code 在《神鬼寓言》中尝试一下,并给出以下提示:我希望你构建一个经过充分研究且漂亮的等时线地图,让我可以选择不同的城市并根据真实数据查看真实的等时线。我希望设计是独一无二的。您应该考虑机场(以及往返机场的旅行时间)、火车、步行、驾车。数据不需要是实时的,但应该是基于您的研究和数据的真实数据。您可以从几个城市开始,但越笼统越好,这应该是一个全新的项目。然后它建议按照原始地图的风格进行此操作。我同意了,然后就开始工作了。值得再看一下人工智能自己经历的多个小时构建会话的记录,因为你可以看到一些不寻常的事情。首先,AI 启动了多个其他 AI(我相信主要是更便宜的 Claude Sonnet)来帮助其对旅行时间进行研究,最终从多篇学术论文中检索了 2,200 多个特定航班、从 TGV 到新干线的火车时刻表以及每个国家的公路速度。当这些代理运行时,它就开始编码。然后,它启动了更多代理和测试来验证其代码,同时记录其进展。结果是一张功能齐全、复杂程度令人印象深刻的地图,看起来很像 1881 年的原版,但这并不意味着它是完美的。我注意到很多偏远地区(比如格陵兰岛)只包含了旅行时间的估计,而不是确切的数字,所以我告诉《神鬼寓言》修复它,包括说明:实际获取到偏远机场和地点的旅行时间。这次人工智能启动了一个工作流程,对抗性的代理组进行研究并测试彼此的资源