后神话网络安全：保持冷静并继续前进

在 Claude Mythos 预览版发布后，我在网络安全领域看到了很多令人苦恼的争论。它被宣布为该领域的游戏规则改变者，远远领先于其联盟，并打开了全自动狩猎和零日漏洞利用的潘多拉魔盒。从那时起，《神话》和它的同等保障措施的《神鬼寓言 5》就被发行了，但不久之后就被拿走了。让我们借此机会思考一下这个模式带来了什么以及它对行业的影响有多大。保持冷静恐惧、不确定性和怀疑助长了网络安全行业 Anthropic 一直喜欢在其公关中使用戏剧性的措辞。每个主要型号的发布都伴随着对其安全性的担忧；呼吁在我们到达不归路之前进行监管或暂停研究。 Mythos 也不例外，并于 4 月份在未公开发布的情况下被披露。相反，Glasswing 项目被宣布，为 50 个组织提供对该模型的访问权限，后来扩展到 150 个实体。其中一些幸运的少数人证实了 Anthropic 的危言耸听的说法。他们宣布通过 Mythos 检测到数百个漏洞。关于该主题最有影响力的文章之一是英国政府人工智能安全研究所的评估。 Mythos 是第一个在“专家级任务”中取得成功的模型。它也是同类中第一个实现“最后一个”的网络靶场，测试从侦察到全面网络接管的整个攻击链。仔细阅读这篇文章，你会发现一幅不那么戏剧化的景象。虽然比以前的模型有所进步，但这一领域的进展非常缓慢。我们可以看到 GPT-5.4，甚至 Opus 4.6，在他们的高级 CTF 挑战赛上也没有落后太多。 Opus 的网络靶场也是如此。这些基准也可能与现实的企业环境相距甚远，至少对于拥有成熟网络安全计划和专用 SOC 的公司来说是这样。正如文章所强调的那样，“它们缺乏经常存在的安全功能，例如主动防御者和防御工具。对于采取会触发安全警报的操作的模型也没有惩罚。”毫无疑问，在尝试执行侦察任务或转向目标信息系统时，此类模型有时会非常嘈杂且笨拙。 “当然，但是模型可以离线发现的所有关键漏洞又如何呢？然后攻击者可能会利用它们作为强大的零日漏洞”，您可能会问？这方面是 Glasswing 项目的主要营销论据，例如“OpenBSD 中已有 27 年历史的漏洞”或“FFmpeg 中已有 16 年历史的漏洞”。安全专业人士在阅读此类声明时可能会傻笑。在 CVE 公告中，突出显示漏洞已经足够老，是一种非常常见的标题诱饵技巧，仅次于经典的“CISA 命令联邦政府修补 X”。在具有数十万行代码的开源产品中，几十年前的漏洞并不罕见。大多数时候，这只是意味着以前没有人有足够的技术来发现它曾经在这个区域看过。旧的错误更有价值，因为它们影响更多版本的支持软件，但这与它们一开始被发现的难度无关。然而，事实是人工智能辅助发现将增加其流行率。神话，只是旧型号的逐步改进？ Mythos 最大的变化是财力雄厚的组织能够承担这些详尽的搜索的可扩展性潜力。 Anthropic red 团队的博客文章更深入地介绍了他们如何实现这样的结果，而且这肯定会付出高昂的代价。该模型在大多数源代码文件上单独运行了多次。他们的脚手架运行了一千次才发现 BSD bug，成本约为 20,000 美元。整个 Glassing 项目分配的代币预算价值一亿美元。是否会带来新的风险？是的，但对于那些可能已经拥有先进网络安全资源的演员来说，而不是对于普通的剧本小子来说。如果早期的模型能够从同样彻底的实验中受益的话，它们可能已经发现了其中的一部分漏洞。很难进行同类比较，因为 Anthropic 给出的有关 Mythos 如何运行（或者每个发现运行了多少次）的细节很少。一些人试图以公平但更具成本效益的替代方案复制这一概念，并取得了一些探索性的结果。简而言之：在没有 Mythos 甚至 Opus 模型的情况下，DeepSeek 在云托管领域表现不错，而 Gemma 4 和 Qwen 3.6 在自托管类别中远远超出了它们的实力，发现了 Mythos 在基准测试中发现的大约一半的漏洞。然而，我不会像艾斯勒那样认为秘密在于安全带，而不是模型。虽然他们也确实设法“检测”了许多最初由 Mythos u 发现的漏洞