Anthropic“狼来了”：喊停的人，跑得最快

文 | AIX财经（AIXcaijing），作者 | 陈丹，编辑 | 魏佳向SEC秘密递交了IPO文件三天后，Anthropic突然抛出一篇万字长文，呼吁全世界为前沿AI开发准备一个“刹车”。又过了五天，它上线迄今最强的模型Claude Fable5，同时发布不设限版本Mythos5。递表、喊停、上新，都发生在十天内。这篇6月初发表的文章名为《When AI Builds Itself（当AI开始构建自身）》，由Anthropic研究负责人Marina Favaro与政策负责人、联合创始人Jack Clark共同执笔。其核心概念是“递归自我改进”，即AI几乎无需人类介入，就能自行设计、训练并升级出下一代自己。过去几年，AI流行的风险被视为“AI替代人”。Anthropic这一次把问题往前推了一层，当AI开始替代AI研究者，技术进步就不再只是线性加速，而可能进入自我加速。另一家AI巨头OpenAI，也加入了这场刹车讨论。 6月8日，OpenAI发布由首席执行官Sam Altman与首席研究官Jakub Pachocki联署的战略愿景文件，提出应建立一个国际组织，协调全球领先AI开发，并在必要时“放缓前沿开发”，让社会韧性、安全和对齐研究跟上技术进步。一边是估值逼近万亿美元、冲在公开市场最前面的赛车手；一边是提醒全世界“我们手里只有油门，没有刹车”的吹哨人。两种身份，集于一身。于是问题来了：这究竟是发自良知的警告，还是领先者在为下一程竞争，提前划赛道规则？ 01.Anthropic到底在怕什么？ Anthropic这篇长文最令人不安的地方，是它把风险的发生地，从外部世界拉回到了AI公司内部。在Anthropic内部，一个人资历越深，接到的任务就越开放。打个比方，新人的任务如果是“导出按钮坏了，修一下”；那么资深员工则要查清“为什么高负载下网络会变慢”；更高层的可能要回答“团队下个季度该做什么”。如果把AI比作一名普通员工，那么它正顺着这个金字塔一步步往上爬。早期，AI只是补全工具，人类写代码、搭系统、训练模型。后来，它能生成代码片段、修复Bug。再往后，编码智能体开始自己运行代码，把几小时的工作交给另一个智能体完成。Anthropic称之为“闭环”——未来，智能体可能具备自行构建和训练模型的能力。若真如此，Claude的后续版本，将由Claude自己持续改进。这就是“递归自我改进”。这并非科幻推演，它来自Anthropic自己的生产数据。截至2026年5月，Anthropic代码库中合并的代码，超过80%由AI写成；2025年初Claude Code还是研究预览版时，这个比例只有个位数。落到具体的人身上，2026年第二季度，一名典型工程师每天合并的代码量是2024年的8倍。一位员工说，他已大约五个月没有亲手写过一行代码。 Claude写的也不只是简单代码。在最开放、最难定义的任务上，它的成功率在2026年5月达到76%，半年内提升了50个百分点。举个例子：一次例行升级让数万个训练任务接连崩溃，工程师几乎只丢给Claude一段说明和集群权限，它逐个环境变量测试，两小时内揪出一个冷僻的调试参数，复现并修复。这放在以前，通常是两三天的工作量。更让Anthropic警觉的是研究环节。每次发布新模型，它都让Claude做同一道题：把一段训练小模型的代码改到尽可能快、又不出错。通常来说，一个熟练的人类研究员，要花四到八小时才能做到4倍。2025年5月，Opus4平均提速约3倍，还略逊于人类；到2026年4月，这个数字变成约52倍。不到一年，Claude在这件事上就从接近人类，变成了把人类远远甩在身后。把这些曲线连起来，是一条人类不断后撤的路径。即便是这家全球前沿的AI公司内部，员工也经常产生虚无感。一位员工说：“在一切顺利的日子里，我忍不住觉得自己做的事都不重要了。” 今天人类还守得住的，是所谓的研究品味与判断力：判断哪个问题值得做、哪个结果可信、哪条路是死胡同，以及看见眼前任务之外那张更大的图景。但Anthropic对这块最后的阵地也并不乐观。所谓“品味”，或许只是又一项AI先失败一阵，然后就能学会的能力。基于此，Anthropic拆解了三种未来：其一，趋势停在今天，但现有能力被广泛扩散；其二，AI大量接管开发，人类仍掌着方向盘，组织效率成倍放大；其三，AI具备完整的自我改进能力，开始设计并训练自己的继任者，即“递归自我改进”。 Anthropic说，第三种尚未到来，也并非注定，“但可能比多数机构准备好的时间更早到来”。那么，该怎么办？ Anthropic的答案是希望世界保留一个选项——必要时能放慢甚至暂停前沿开发，让社会结构和对齐研究跟上技术的脚步。 02.呼吁暂停，但很难暂停 Anthropic设计的暂停键，分三层。公司内部，设立更严格的安全评估、红线与发布门槛；行业层面，前沿实验室彼此协调，不能一家踩刹车、另一家继续加速；国际层面，让政府、科学家、倡议组织与竞争对手坐到同一张桌前，讨论如何核实“暂停”是否真的发生。它把自己的态度也写得很清楚：只要这样的验证机制存在，且其他同处前沿的开发者也以可验证的方式停下，它就愿意一起放慢，甚至暂停。但每一个前提，都指向同一句潜台词，它不会一个人停。这像是一个囚徒困境。 Anthropic认为，如果没有全球协调机制，公司和政府都会在竞争压力下做安全决策。而训练前沿模型，不像看守一口导弹发射井，算力可以租，任务可以拆，云服务可以跨境调用。只要有人停下，偷偷往前跑的那一方，就可能顺势接过领先位置。最直接的例子，就是Anthropic和OpenAI的贴身肉搏。 4月23日，OpenAI发布GPT-5.5，同时推出编程助手Codex，正面狙击Anthropic的Claude Code。一个多月后，Anthropic把旗舰模型升级至Opus4.8。外界普遍认为，这一步正是被GPT-5.5和Codex逼出来的。当地时间6月9日，Anthropic又上线了Fable 5版本，同时发布Mythos5系列模型和新一代智能体开发工具，继续把战线推向代码生成、复杂任务执行和企业级工作流。Anthropic称，Fable5的能力超过它此前公开发布的所有模型。一边警告前沿AI可能失控，一边把最强模型推向市场，中间只隔了五天。现在，这场竞争已经蔓延到了资本市场。就在更新Opus 4.8的同一天，Anthropic宣布完成新一轮650亿美元融资，公司投后估值9650亿美元，逼近万亿。6月1日，它抢在OpenAI前面，向SEC秘密递交了IPO文件。OpenAI也很快跟上：6月8日，宣布秘密提交S-1招股书草案，最快9月、最晚今年四季度上市，市场给出的估值预期最高到1万亿美元。两家公司争的是谁能先成为资本市场上“前沿模型公司”的标杆，在这种量级的资本竞赛里，没人敢主动松油门。还是拿Anthropic来说，它的最新估值已经超过了OpenAI在3月融资后8520亿美元的估值，但两家的用户规模完全不在一个量级。今年3月，ChatGPT移动端月活约9.61亿，Claude约2350万，相差40倍。撑起这个估值的，是企业客户和单用户价值。按第三方测

订阅66必读