智能AI morning

刚刚,人类首个神话级克劳德5正式解禁!

2026-06-10 1 阅读 新智元
新智元报道 【新智元导读】 藏了两个月说「太危险」的Mythos 5终于解封!ASI级「神话」,今夜降临。 Anthropic今夜「双连发」! 就在刚刚,Claude Fable 5和Claude Mythos 5同时上线。 那个被Anthropic藏了两个月、说「太危险不能公开」的Mythos级模型,第一次交到了所有人手上。 从Opus 4.7到4.8用了43天,4.8到Fable 5只用了11天 Fable这个名字来自拉丁语fabula,和希腊语mythos同源。 同一个故事,同一个底座。公开版叫寓言,完整版叫神话。 软件工程、知识工作、视觉、科学研究、长上下文,在几乎所有benchmark上,Fable 5都是第一。 而且,任务越长、越复杂,拉开的差距就越大。 用Every CEO Dan Shipper的话来说,这简直就是一头「性能怪兽」! Fable 5和Mythos 5的分数几乎一模一样,差距通常在1到3个百分点以内。 它们最大的区别在于,前者内置了「安全分类器」,后者完全没有限制。 一旦触发了网安任务的查询,Fable 5直接会被「降级」到Opus 4.8回复。 Fable 5在所有安全任务中,拿下0分,就是最好的说明 定价方面,Fable 5和Opus 4.8 Fast Mode基本一致,输入10美元/百万token,输出50美元/百万token。 虽然是Opus标准版的两倍,但不到Mythos Preview的一半,也只有GPT-5.5 Pro的六分之一。 Pro、Max和Team订阅用户在6月22日前可以免费体验,但之后就要花credits了。API今天即可使用,开发者调claude-fable-5就行。 Claude 5「双模」首秀 编程全球第一 Fable 5上线后,𝕏上的画风已经变了。 在刚加入Anthropic的Karpathy看来,这是一次配得上「大版本号」升级的跨越式进步。 工作软件正在变得像自来水一样随取随用,你可以随手索取任何东西,解释器、可视化工具、仪表盘、一次性定制应用。 末尾,他还引了一句「黑客帝国」的台词:「解放你的思想」。 经历过Claude每一次发布的研究员Alex Albert表示,这是第一个让他觉得「不像工具,像伙伴」的模型。 Claude Code负责人Felix Rieseberg直接下了一个判断,「第三个AI时代」在今天正式开启! 随之而来的,是一场史诗级的质变——我们将不再只是给AI派发「任务」,而是正式向它们赋予「职责」。 上下滑动查看 这几句话背后真正的分量,恐怕许多人尚未真正领悟。 光说无凭,在各大基准测试、内/外部严苛评估中,Claude 5早已展现出「碾压级」统治力。 碾压,不是一点半点 在人类最后考试(HLE)上,Mythos 5不用工具,实力赶超Preview版本。 相较于GPT-5.5、Gemini 3.1 Pro,Mythos 5更是断层式领先。 然后,再来看看Claude「最拿手」的智能体编程任务。 SWE-Bench Pro,衡量真实世界Agent编程能力的核心榜单,也是所有前沿模型卷得最凶的赛道。 Fable 5拿下80.3%。 作为参照,11天前刚发的Opus 4.8是69.2%,GPT-5.5是58.6%,Gemini 3.1 Pro是54.2%。 Fable 5比Opus 4.8高出11个百分点,比GPT-5.5高出21.7个百分点。 上代王者刚坐稳11天的王座,被自家新模型一脚踹翻。 FrontierCode Diamond,Cognition做的专测Agent代码质量的榜单,Fable 5拿了29.3%,GPT-5.5是5.7%。五倍差距。 而且Fable 5在中等算力档位就到顶了。不需要拉满思考,随便想想就是第一。 Stripe拿到Fable 5早期权限后干了一件大事。 在一个5000万行的Ruby代码库里,做了一次全局代码迁移。这种级别的工作,正常情况下需要一整个团队花两个多月。 Fable 5只用了一天。一天,5000万行,整个团队都看傻了。 Physical Superintelligence CEO测完之后也大受震撼。 在前沿物理研究任务上,Fable 5不仅只消耗了GPT-5.5三分之一的推理token,而且只用了36小时就跑到了GPT-5.5花四天才到的位置。 Fable 5编曲造物,强到可怕 Anthropic的每一个测试,都在展示同一件事——Fable 5能长时间自主工作,而且产出质量高到离谱。 它自主玩Factorio,工程师们的圣经级工厂建设游戏。 画面上密密麻麻的传送带飞速运转,机械臂在火炉和组装机之间疯狂挥舞。AI自己规划资源流向、建设自动化生产线,在一个每秒都在消耗资源的混沌环境里从零搭出秩序。 它在浏览器里设计了一个完整的3D可打印模型。 先是几行代码,然后一个带UI面板、工具栏的3D CAD编辑器在屏幕上被凭空渲染出来。 接着Fable 5切换身份,在搭建的编辑器里旋转视角、拉伸网格、倒角边缘,把一个抽象概念塑造成可以送去3D打印的实体模型。 它还推演了太阳系行星运动,从物理第一性原理出发自己推导轨道方程,然后用推导结果预测日食。 最魔幻的一个,暗色画布顶端打着「FIFTH SYMPHONY FABLE」的标题,贝多芬第五交响曲的EDM混音响起,高精度粒子流体在画面中心炸开。 低音轰鸣时涌起深紫色星云,小提琴扬起时冰蓝色流体如极光般撕裂黑暗,每一次流体碰撞和扩散都踩在节拍上。 这首混音曲本身,也是Fable 5用代码生成的。 一个从没「听」过音乐的AI,用代码写了一首贝多芬混音,再用代码写了一段跟着节拍跳舞的流体模拟。 另外,让Fable 5玩「杀戮尖塔」游戏时,配上持久化的文件记忆后,性能提升是Opus 4.8的3倍,到达游戏最终关卡的频率也是3倍。 记忆让Fable 5变强的幅度,远超同样的记忆对上一代模型的效果。 模型在「从自己的经验中学习」这件事上,已经跨到了另一个台阶。 不用一行代码,裸眼通关「宝可梦」 不仅如此,Fable 5在「视觉能力」上也取得了巨大的进步,程度不亚于编程。 之前的Claude模型玩宝可梦火红版,需要一整套复杂的辅助工具才能推进,地图导航、游戏状态解析、额外的工具接口,全都得喂进去,还经常卡关。 Fable 5只用了一个极简的视觉接口。 没有地图,没有导航辅助,没有任何额外的游戏状态信息。 就靠看屏幕截图,从头到尾打通了整个宝可梦火红。 Anthropic放出了一段完整的延时摄影视频记录了全过程。AI看着像素画面做决策、踩草丛遇敌、选技能打道馆、穿迷宫,一路推到通关。 这意味,Fable 5能从科学期刊里复杂的图表中提取精确数值,能仅凭几张截图把一个Web应用的源代码完整重建出来。 模型对视觉信息的理解深度到了一个新的层级,不再是「能看图说话」,而是「看懂了,然后能动手」。 AI当科学家 Science级成果一周搞定 如果说编程和视觉还在「提效」的范畴里,Fable 5和Mythos 5在生命科学领域做的事情,已经开始让人重新想「AI能做什么」这个问题了。 在蛋白质设计任务中,Mythos 5实现全自动研发。 从选靶点、跑设计到失败