Glasswing 项目：初步更新

公告 Project Glasswing：首次更新 2026 年 5 月 22 日上个月，我们启动了 Project Glasswing，这是我们共同努力的目标，旨在确保世界上最关键的软件的安全，防止功能日益强大的人工智能模型对其发起攻击。从那时起，我们和大约 50 个合作伙伴使用 Claude Mythos Preview 在世界上最具系统重要性的软件中发现了超过一万个高严重性或关键严重性漏洞。软件安全的进步过去受到我们发现新漏洞的速度的限制。现在，它受到我们验证、披露和修补人工智能发现的大量漏洞的速度的限制。在这篇文章中，我们将讨论在 Glasswing 项目的最初几周中我们对网络安全这一严峻挑战的了解。我们重点关注 Mythos Preview 性能的早期公开证据、我们扫描数千个开源软件项目的初步结果，以及这一进展对当今网络防御者意味着什么。我们还介绍了 Glasswing 项目的下一步预期，以及我们如何考虑在未来发布 Mythos 级模型。我们的早期结果我们讨论 Mythos Preview 调查结果的方法软件行业的长期惯例是在新漏洞被发现后 90 天披露（或者，如果补丁是在 90 天之前创建的，则在补丁可用后大约 45 天披露）。这使得最终用户有时间在漏洞被攻击者利用之前更新其软件。我们自己的协调漏洞披露政策就采用了这种方法。然而，这意味着所披露的漏洞是人工智能模型网络能力加速前沿的滞后指标：我们还没有达到能够通过 Mythos Preview 充分详细说明合作伙伴的发现而不使最终用户面临风险的程度。相反，我们提供了模型性能的说明性示例，以及迄今为止进展的汇总统计数据。一旦 Mythos Preview 发现的漏洞补丁被广泛部署，我们将提供更多有关我们所了解到的信息的详细信息。来自我们的合作伙伴和外部测试人员的证据 Project Glasswing 的初始合作伙伴构建和维护对于互联网和其他重要基础设施的运行至关重要的软件。修复代码中的缺陷可以降低依赖该代码的许多其他组织的风险，从而降低数十亿最终用户的风险。一个月后，大多数合作伙伴都在其软件中发现了数百个严重或高严重性漏洞。他们总共发现了数万多个。一些人告诉我们，他们发现错误的速度增加了十倍以上。例如，Cloudflare 在其关键路径系统中发现了 2,000 个错误（其中 400 个为高严重性或严重性），Cloudflare 团队认为误报率优于人类测试人员。这与外部测试人员对 Mythos Preview 性能的体验以及最近对该模型的额外评估相符：英国人工智能安全研究所报告称，Mythos Preview 是第一个端到端解决两个网络范围（多步网络攻击的模拟）问题的模型； Mozilla 在测试 Mythos Preview 时发现并修复了 Firefox 150 中的 271 个漏洞，比在 Claude Opus 4.6 的 Firefox 148 中发现的漏洞多十倍以上；独立安全平台 XBOW 报告称，Mythos Preview 在其网络漏洞利用基准测试中“比所有现有模型有了重大进步”，并在代币对代币的基础上提供了“绝对前所未有的精度”； ExploitBench 和 ExploitGym 这两个最近发布的用于衡量模型漏洞开发能力的学术基准，将 Mythos Preview 显示为表现最强的。我们在 Frontier Red Team 博客上更详细地讨论了这些基准测试告诉我们的有关模型的信息。更普遍的是，我们现在看到修补软件的推出速度要快得多。 Palo Alto Networks 最新版本包含的补丁数量是平常的五倍多。微软报告称，他们将发布的新补丁数量“将在一段时间内继续呈增加趋势”。 Oracle 查找和修复其产品和云中的漏洞的速度比以前快了数倍。事实证明，Mythos Preview 对于其他类型的安全工作也很有用。例如，在我们的一家 Glasswing 合作银行中，威胁行为者入侵了客户的电子邮件帐户并拨打了欺骗电话，Mythos Preview 帮助检测并阻止了 150 万美元的欺诈性电汇。开源软件在过去的几个月里，Anthropic 使用 Mythos Preview 扫描了 1,000 多个开源项目，这些项目共同支撑着互联网的大部分以及我们自己的基础设施。到目前为止，Mythos Preview 已发现估计有 6,202 个高严重性或临界严重性漏洞

订阅66必读