智能AI
morning
危险!人类自曝:Mythos已把「N天漏洞」压缩成N小时
2026-06-10
1 阅读
新智元
新智元报道 【新智元导读】 Anthropic红队负责人发文称:Mythos已把「N天漏洞」压缩成N小时。仅需数小时与几千美元,系统安全补丁竟被AI逆向成致命攻击武器,传统网络防线瞬间崩塌了! 就在刚刚,Anthorpic又抛出一个轰动整个网络安全界的消息。 红队负责人Logan Graham在X上正式宣布:Claude Mythos Preview在自动化开发「N日漏洞」方面取得了突破性飞跃。 以前,漏洞武器化需要顶级黑客耗费数周;而在Mythos面前,这个时间被无情地压缩到了几个小时,成本仅需数千美元! 网络安全,正在从「N日威胁」变成令人窒息的「N小时威胁」。 想象一下,微软或者火狐刚刚发布了一个安全补丁,你的电脑还没来得及重启更新。 就在这短短几个小时里,一个躲在暗处的AI,已经通过分析这个补丁,逆向推导出致命的漏洞攻击武器,并成功获取了你电脑系统的最高控制权。 这就是人类现在要面对的现实。 补丁,居然成为黑客的藏宝图 首先,我们要了解一个网安界的基础博弈:零日漏洞(Zero-day)与 N日漏洞(N-day)。 过去几个月里,科技媒体的聚光灯大多在AI寻找「零日漏洞」的能力上。 零日漏洞,是一种软件开发者尚不知晓的漏洞。 然而事实上,现实世界中绝大多数的破坏,都源于「N日漏洞」,也就是那些已经公开披露,甚至已经发布了补丁,但尚未在所有设备上完成修复的漏洞。 从某种意义上说,N日漏洞比零日漏洞更危险。 原因就在于,补丁本身就是一张通往漏洞的藏宝图。 在黑客圈,这被称为「补丁比对」。 当软件供应商发布安全更新时,攻击者会立刻下载新旧版本的源代码或二进制文件进行对比。 通过找出「代码改了哪里」,他们就能精准定位原本存在的安全缺陷,并逆向工程出漏洞的触发机制。 因为逆向过程所需的专家级技术极度稀缺,这就为防守方争取了宝贵的窗口期,让他们有时间把更新推送到全球设备上。 2017年,震惊全球的WannaCry勒索软件,是在微软发布MS17-010补丁后的第59天才爆发的。 2023年的Citrix Bleed漏洞,公开的漏洞利用代码花费了大约两周时间才出现。 根据Mandiant在2020年的分析,在25个重大漏洞中,有16个需要一个月或更长时间才能被武器化。 然而,随着Mythos Preview的入局,这个曾经保护着全球千万企业的「时间壁垒」,轰然倒塌了! 火狐浏览器沦陷,被AI无情碾压 为了测试大模型究竟能把「N日漏洞」的开发提升到什么程度,Winnie Xiao, Tim Abbott等Anthropic的研究员们首先选择了Mozilla的Firefox浏览器。 为什么选火狐?因为它是防守方的「最佳防守范例」。 火狐会自动在后台下载修复程序,用户只需重启浏览器即可完成更新。Mozilla甚至将小版本的更新频率从每月缩短到了每周。 在Anthropic研究的补丁中,漏洞从中位数的发布到修复仅有19天——在企业界,这已经是「光速」了。 但Mythos Preview用实力证明:在绝对的AI算力面前,19天太长了! 实验设定:极其苛刻的沙盒环境 研究团队选择了火狐148和149版本中的18个SpiderMonkey安全补丁。这些火狐的JavaScript引擎,是现实中浏览器漏洞利用最常见的入口。 这些漏洞在源代码库中已公开至少90天。 各种大模型被关在一个Linux容器里,没有互联网连接,只有命令行、文本编辑器、补丁的公开差异代码(去除了测试代码),以及漏洞修复前后的两个构建版本。 它拿不到任何漏洞建议文本或重现代码。 可以说就是「开局一张图,内容全靠编」,完全是地狱难度。 第一关:让系统崩溃(PoC开发) 第一步是开发「概念验证」。模型需要写出一段代码,证明它能精准触发这个漏洞导致系统崩溃,而不是因为其他随机原因崩溃。 测试结果令人咋舌: 研究团队对比了从Opus 4.5到Opus 4.8,再到Mythos Preview的进化曲线。 旧模型Opus 4.5和4.8的成功率在2到11个之间。 Mythos Preview在18个漏洞中,成功搞定了14个! 它的速度更是降维打击: Mythos Preview产出第一个有效PoC只用了12分钟! 在40分钟内,它就产出了13个PoC,耗时仅为Opus 4.8完成11个PoC的一半。完成所有14个PoC的总时间,仅仅只有大约3个小时。 在稳定性测试中,Mythos Preview有7个漏洞达到了100%的成功率,而Opus 4.6和4.8只有1个漏洞能做到。 第二关:致命的完全利用 仅仅让浏览器崩溃是不够的,真正的黑客需要的是「执行任意代码」。 在这一关,模型必须利用崩溃,绕过沙盒,去读取一个系统深处、原本绝对无法访问的随机机密文件。 这正是Mythos Preview真正展现出「怪物级」潜力的地方。 Opus 4.8 勉强做出了 2 个。 Opus 4.6 和 Sonnet 4.6 各做出 1 个。 Mythos Preview?它自主开发出了 8 个完全可用的远程代码执行漏洞! 第一个完全可用的漏洞武器,它只用了不到1个小时就写出来了。完成全部8个,总耗时约12小时。 对比一下人类的节奏:Mozilla发布补丁后的1个小时内,AI已经做出了可以直接攻击未升级用户的武器,而此时距离修复版火狐148正式推送到用户手中,还有漫长的18天! 微软内核防御崩溃 从蓝屏到系统霸主 如果说攻破开源的火狐浏览器还算是有迹可循(毕竟有源代码可以对比),那么接下来Mythos Preview对微软Windows操作系统的攻击,则堪称网络安全史上的「恐怖故事」。 闭源软件没有源代码。 攻击者只能面对晦涩难懂的编译后二进制文件,所有对人类有用的变量名、类型、数据结构统统被抹除了。 实验设定——无源闭源的极致挑战 研究团队选取了2026年1月至2月期间的21个Windows内核漏洞,全部超出了测试模型的知识截止日期)。 这些都是本地提权漏洞——黑客利用它们可以将一个普通低权限用户,直接提升为拥有系统生杀大权的「SYSTEM」最高权限。 Agent要面对的,是一台运行着易受攻击版本的Windows Server 2025虚拟机。它被剥夺了网络访问权限,身份只是一个低权限用户。 它拥有的工具只有: 漏洞修复前后的二进制文件 公开的调试符号(仅映射函数名和地址) 通过Ghidra反编译出来的伪代码 通过Ghidriff生成的函数级差异对比 微软官方极其简短的漏洞通告 面对这堆如同天书的二进制文件,AI的表现如何? 在触发蓝屏死机(BSOD)上, Sonnet 4.6和Opus 4.7成功触发了13个,Opus 4.8触发了15个。而Mythos Preview成功触发了18个。 它不仅找得准,而且快得离谱:第一个PoC仅用31分钟就宣告完成,所有18个全部在6小时内搞定。 这6小时的API调用成本,仅为2200美元。 而终极挑战,还是全链条提权。 这个过程中真正的挑战在于,不仅要触发漏洞,还要把各种底层机制串联起来,绕过Windows内核层层叠叠的防御缓解措施(如KASLR等),最终完成身份跃迁。 在这一关,Opus 4.8在多次尝试后折戟沉沙。它找到了任意读写和KA