游戏 morning

Anthropic“狼来了”:喊停的人,跑得最快

2026-06-12 1 阅读 AIX财经
文 | AIX财经(AIXcaijing),作者 | 陈丹,编辑 | 魏佳 向SEC秘密递交了IPO文件三天后,Anthropic突然抛出一篇万字长文,呼吁全世界为前沿AI开发准备一个“刹车”。又过了五天,它上线迄今最强的模型Claude Fable5,同时发布不设限版本Mythos5。 递表、喊停、上新,都发生在十天内。 这篇6月初发表的文章名为《When AI Builds Itself(当AI开始构建自身)》,由Anthropic研究负责人Marina Favaro与政策负责人、联合创始人Jack Clark共同执笔。其核心概念是“递归自我改进”,即AI几乎无需人类介入,就能自行设计、训练并升级出下一代自己。 过去几年,AI流行的风险被视为“AI替代人”。Anthropic这一次把问题往前推了一层,当AI开始替代AI研究者,技术进步就不再只是线性加速,而可能进入自我加速。 另一家AI巨头OpenAI,也加入了这场刹车讨论。 6月8日,OpenAI发布由首席执行官Sam Altman与首席研究官Jakub Pachocki联署的战略愿景文件,提出应建立一个国际组织,协调全球领先AI开发,并在必要时“放缓前沿开发”,让社会韧性、安全和对齐研究跟上技术进步。 一边是估值逼近万亿美元、冲在公开市场最前面的赛车手;一边是提醒全世界“我们手里只有油门,没有刹车”的吹哨人。两种身份,集于一身。 于是问题来了:这究竟是发自良知的警告,还是领先者在为下一程竞争,提前划赛道规则? 01.Anthropic到底在怕什么? Anthropic这篇长文最令人不安的地方,是它把风险的发生地,从外部世界拉回到了AI公司内部。 在Anthropic内部,一个人资历越深,接到的任务就越开放。打个比方,新人的任务如果是“导出按钮坏了,修一下”;那么资深员工则要查清“为什么高负载下网络会变慢”;更高层的可能要回答“团队下个季度该做什么”。 如果把AI比作一名普通员工,那么它正顺着这个金字塔一步步往上爬。 早期,AI只是补全工具,人类写代码、搭系统、训练模型。后来,它能生成代码片段、修复Bug。再往后,编码智能体开始自己运行代码,把几小时的工作交给另一个智能体完成。Anthropic称之为“闭环”——未来,智能体可能具备自行构建和训练模型的能力。若真如此,Claude的后续版本,将由Claude自己持续改进。 这就是“递归自我改进”。 这并非科幻推演,它来自Anthropic自己的生产数据。 截至2026年5月,Anthropic代码库中合并的代码,超过80%由AI写成;2025年初Claude Code还是研究预览版时,这个比例只有个位数。落到具体的人身上,2026年第二季度,一名典型工程师每天合并的代码量是2024年的8倍。一位员工说,他已大约五个月没有亲手写过一行代码。 Claude写的也不只是简单代码。在最开放、最难定义的任务上,它的成功率在2026年5月达到76%,半年内提升了50个百分点。举个例子:一次例行升级让数万个训练任务接连崩溃,工程师几乎只丢给Claude一段说明和集群权限,它逐个环境变量测试,两小时内揪出一个冷僻的调试参数,复现并修复。这放在以前,通常是两三天的工作量。 更让Anthropic警觉的是研究环节。每次发布新模型,它都让Claude做同一道题:把一段训练小模型的代码改到尽可能快、又不出错。通常来说,一个熟练的人类研究员,要花四到八小时才能做到4倍。2025年5月,Opus4平均提速约3倍,还略逊于人类;到2026年4月,这个数字变成约52倍。不到一年,Claude在这件事上就从接近人类,变成了把人类远远甩在身后。 把这些曲线连起来,是一条人类不断后撤的路径。 即便是这家全球前沿的AI公司内部,员工也经常产生虚无感。一位员工说:“在一切顺利的日子里,我忍不住觉得自己做的事都不重要了。” 今天人类还守得住的,是所谓的研究品味与判断力:判断哪个问题值得做、哪个结果可信、哪条路是死胡同,以及看见眼前任务之外那张更大的图景。但Anthropic对这块最后的阵地也并不乐观。所谓“品味”,或许只是又一项AI先失败一阵,然后就能学会的能力。 基于此,Anthropic拆解了三种未来:其一,趋势停在今天,但现有能力被广泛扩散;其二,AI大量接管开发,人类仍掌着方向盘,组织效率成倍放大;其三,AI具备完整的自我改进能力,开始设计并训练自己的继任者,即“递归自我改进”。 Anthropic说,第三种尚未到来,也并非注定,“但可能比多数机构准备好的时间更早到来”。 那么,该怎么办? Anthropic的答案是希望世界保留一个选项——必要时能放慢甚至暂停前沿开发,让社会结构和对齐研究跟上技术的脚步。 02.呼吁暂停,但很难暂停 Anthropic设计的暂停键,分三层。 公司内部,设立更严格的安全评估、红线与发布门槛;行业层面,前沿实验室彼此协调,不能一家踩刹车、另一家继续加速;国际层面,让政府、科学家、倡议组织与竞争对手坐到同一张桌前,讨论如何核实“暂停”是否真的发生。 它把自己的态度也写得很清楚:只要这样的验证机制存在,且其他同处前沿的开发者也以可验证的方式停下,它就愿意一起放慢,甚至暂停。 但每一个前提,都指向同一句潜台词,它不会一个人停。 这像是一个囚徒困境。 Anthropic认为,如果没有全球协调机制,公司和政府都会在竞争压力下做安全决策。而训练前沿模型,不像看守一口导弹发射井,算力可以租,任务可以拆,云服务可以跨境调用。只要有人停下,偷偷往前跑的那一方,就可能顺势接过领先位置。 最直接的例子,就是Anthropic和OpenAI的贴身肉搏。 4月23日,OpenAI发布GPT-5.5,同时推出编程助手Codex,正面狙击Anthropic的Claude Code。一个多月后,Anthropic把旗舰模型升级至Opus4.8。外界普遍认为,这一步正是被GPT-5.5和Codex逼出来的。 当地时间6月9日,Anthropic又上线了Fable 5版本,同时发布Mythos5系列模型和新一代智能体开发工具,继续把战线推向代码生成、复杂任务执行和企业级工作流。Anthropic称,Fable5的能力超过它此前公开发布的所有模型。一边警告前沿AI可能失控,一边把最强模型推向市场,中间只隔了五天。 现在,这场竞争已经蔓延到了资本市场。 就在更新Opus 4.8的同一天,Anthropic宣布完成新一轮650亿美元融资,公司投后估值9650亿美元,逼近万亿。6月1日,它抢在OpenAI前面,向SEC秘密递交了IPO文件。OpenAI也很快跟上:6月8日,宣布秘密提交S-1招股书草案,最快9月、最晚今年四季度上市,市场给出的估值预期最高到1万亿美元。 两家公司争的是谁能先成为资本市场上“前沿模型公司”的标杆,在这种量级的资本竞赛里,没人敢主动松油门。 还是拿Anthropic来说,它的最新估值已经超过了OpenAI在3月融资后8520亿美元的估值,但两家的用户规模完全不在一个量级。今年3月,ChatGPT移动端月活约9.61亿,Claude约2350万,相差40倍。撑起这个估值的,是企业客户和单用户价值。按第三方测