关于美国政府指示暂停访问《神鬼寓言 5》和《神话 5》的声明

2026-06-13 1 阅读 Dylan1312
公告 关于美国政府指令暂停访问《神鬼寓言 5》和《神话 5》的声明 2026 年 6 月 12 日 美国政府援引国家安全当局的名义,发布了一项出口管制指令,暂停任何外国人(无论是在美国境内还是境外)访问《神鬼寓言 5》和《神话 5》,包括外籍 Anthropic 员工。该命令的最终影响是,我们必须突然禁用所有客户的《神鬼寓言 5》和《神话 5》,以确保合规性。对所有其他 Anthropic 模型的访问不会受到影响。我们于今天下午 5:21(东部时间)收到了政府的指令。这封信没有提供其国家安全担忧的具体细节。我们的理解是,政府认为它已经意识到一种绕过或“越狱”《神鬼寓言 5》的方法。我们回顾了这种特定技术的演示,该技术用于识别少量先前已知的小漏洞。这些漏洞看起来都相对简单,我们发现其他公开可用的模型也能够发现它们,而无需绕过。正如我们在发布博客文章中所述,Anthropic 对于《神鬼寓言》的保障措施的态度如下:我们制定了强有力的保障措施,大大降低了《神鬼寓言》被滥用于网络安全(以及其他)相关任务的可能性。事实上,我们的保护措施非常强大,以至于许多用户抱怨它们过于广泛。在《神鬼寓言》推出前的几周内,Anthropic 与美国政府、英国 AISI、多个私人第三方组织和内部团队合作,对《神鬼寓言》的安全措施进行了红队总计数千小时的合作。这些测试表明,《神鬼寓言》的防护措施比任何以前部署的模型都要有效得多。目前还没有测试人员能够找到一种通用的越狱方法,这种越狱方法可以广泛绕过模型的保护措施,从而解锁各种网络功能。我们怀疑目前任何模型提供商都无法实现完美的越狱抵抗。行业中使用的每一种防护措施都容易受到非通用越狱的影响(在特定情况下可以引出一些网络信息),并且很可能将来最终会找到通用越狱。我们在发布《神鬼寓言 5》时就明确指出了这一点。鉴于如今完美的越狱抵抗似乎不太可能,Anthropic 在《神鬼寓言 5》中采用了纵深防御策略。我们的目标是使越狱范围变得狭窄(在非通用越狱的情况下)或制造成本非常昂贵(在通用越狱的情况下),并将其与彻底的监控相结合,以快速检测和关闭任何成功的攻击。这也是 Anthropic 要求 Fable 将客户数据保留 30 天的原因——这一政策变化给我们与客户带来了实际成本,但使我们能够研究和缓解越狱问题。我们支持这种纵深防御战略。它降低了《神鬼寓言》带来的风险,使其与整个行业已经部署的现有模型的风险相当。我们甚至还没有收到有关导致有害结果的非普遍潜在越狱的披露。向我们披露的潜在越狱要么是完全良性的反应,要么是次要的发现,没有提供神话特定的提升。迄今为止,政府只向我们提供了潜在的狭隘、非通用越狱的口头证据,其本质上包括要求模型读取特定的代码库并修复任何软件缺陷。我们的理解是,一项潜在的越狱事件已与政府分享。我们审查了一份报告,我们认为该报告是政府指令的基础,并验证了该报告所显示的能力水平可以从其他模型(包括 OpenAI 的 GPT-5.5)中广泛获得,并且每天都被保护系统安全的防御者所使用。我们将在接下来的 24 小时内分享更多详细信息。我们遵守政府的法律指令,并取消所有用户对《神鬼寓言 5》和《神话 5》的访问权限。然而,我们不认为,小范围潜在越狱的发现应该成为召回部署到数亿人的商业模式的理由。如果该标准在整个行业中应用,我们相信它将基本上停止所有前沿模型提供商的所有新模型部署。正如我们公开表示的那样,我们认为政府应该有能力阻止不安全的部署,作为透明、公平、明确且基于技术事实的法定程序的一部分。这一行动不遵守这些原则。对于给客户带来的干扰,我们深表歉意。我们认为这是一个误会,并正在努力尽快恢复访问。相关内容 第一个 Anthropic 公共记录的结果 阅读更多 TCS 和 Anthropic 合作伙伴将 Claude 引入 regu