智能AI morning

国产模型,打平了克劳德寓言5!已上线OpenRouter

2026-06-15 1 阅读 新智元
新智元报道 【新智元导读】 OpenRouter 上线了一个叫 Fusion 的新功能,把同一道题丢给一组模型,再让一个裁判模型把答案揉成一份。结果是,几个便宜的开源模型组起团来,能直接打平 Fable 5,价格只有其一半。 昨天,Anthropic 最强大的新模型 Claude Fable 5 遭全球禁用,OpenRouter 立刻上线了 Fusion 功能。 效果极其震撼——同时让几个高性价比的国产模型协作,即可达到 Fable 5 同样级别的智能,与此同时,价格连 Fable 5 的一半都不需要! Harness 的艺术,让性价比的重要性有了根本性的改变——价格即智能。 单一模型不计成本的智能上限依旧重要,但现在绝不是唯一重要的事了。 高性价比的国产开源模型迎来第二春! https://x.com/OpenRouter/status/2065856853989270011 高性价比模型组团打赢了不计成本的单个前沿模型 测试用的是 Perplexity 出的 DRACO,专门考模型做深度研究的真功夫,覆盖学术、金融、法律、医疗等 10 个领域,每道题有约 39 条带权重的评分标准,答错会扣负分,靠堆字数糊弄拿不到分。 在这套标准下,OpenRouter 跑出三个发现。 第一,组团稳定压过单跑,融合配置在榜单上整体高于单模型。 第二,顶配组团能「超出前沿」,Fable 5 加 GPT-5.5 的 69.0% 就是天花板,比任何单个模型都高。 第三个最有意思,预算组(Gemini 3 Flash、Kimi K2.6、DeepSeek V4 Pro 三个模型组团)拿到 64.7%,干掉了单跑 60.0% 的 GPT-5.5 和 58.8% 的 Opus 4.8,逼到离 Fable 5 只差不到一个百分点,成本却只有前沿组团的一半。 这里还藏着一个被 OpenRouter 老实交代出来的细节。 Fable 5 单跑那 65.3% 的成绩,其实只算了 93 道题,剩下 7 道被它自己的内容过滤器拦下了,没跑成。 OpenRouter 选择不拿 Opus 4.8 去补这 7 道,所以这个分是 Fable 真实能力的样子,但也说明它跟跑满 100 道的模型比,本来就占了点便宜。 把这件事和预算组的成绩摆在一起,革命性才显出来。 最强的那个单模型,恰恰也是最会拒绝你、最容易卡壳的那个。 过去用单模型,用户被一个模型的脾气、过滤器和盲区绑死,它罢工你就没辙。 Fusion 把这件事拆开了,一组模型里某一个掉链子,还有别人顶上,而且这组人可以全是高性价比模型,照样把活干到接近前沿的水准。 如何用上 Fusion 最简单的方式,在 API 调用里把模型名直接填成 openrouter/fusion,剩下的并行分发、裁判融合全在服务端跑完,一次调用就拿结果。 想让模型自己判断什么时候该组团,也可以把 Fusion 作为一个工具挂进 tools 列表,由模型自己决定要不要调用。 想自己挑队员的,可以在调用里指定参团的模型清单和负责融合的裁判模型,比如让一组国产模型参团、用一个更强模型坐镇做裁判。 不想碰代码的,直接打开 openrouter.ai/fusion 的网页版,选一个预设套餐或者手搭一个自己的 panel 就能试。 https://openrouter.ai/fusion 裁判模型干的活儿比投票选优复杂。 它通读所有回答后产出一份结构化分析,列出哪些是共识、哪些互相矛盾、谁有独到见解、大家共同的盲区在哪,最后由作答模型基于这份分析重新写出成稿。 真正变天的是性价比这件事 很多最复杂最困难的任务,模型智能是一道硬门槛,针对这类任务,再贵也得用最强的。 Fusion 把这个排序撬动了。 预算组那 64.7% 说明一件事,几个高性价比模型组起团来,智能水平能逼近单个最强的前沿模型,价钱却砍掉一半。 当低价能换来几乎一样高的智能,「单模型最强」这个指标的分量就被稀释了,性价比从次要变量挪到了主角位置。 这对开源模型是实打实的利好。 预算组里的 Kimi K2.6 和 DeepSeek V4 Pro,都是国产开源路线的代表。 它们单拎出来未必跑得过闭源前沿,可一组起团,差距就被补上了大半。 对走开源、走性价比路线的国内模型公司来说,Fusion 这类融合机制等于辟出一条新赛道,不必在「单模型刷榜」上和闭源巨头硬碰,靠组合也能交付接近前沿的结果。 开源模型可能要迎来第二春了。 AGI 格局被搅动 Fusion 还顺手验证了一个反直觉的发现。 OpenRouter 让 Opus 4.8 和自己组队,同一道题跑两遍再融合,分数从单跑的 58.8% 涨到 65.5%,足足多了 6.7 分。 同一个模型跑两遍,会走出不同的推理路径、调用不同的工具、选取不同的资料,光是把这些差异融合起来,提升就已经很可观。 可见 Fusion 的增益有相当一部分来自「融合」这个动作本身。 顺着这个逻辑往大了想,过去几年行业默认的路是把单个模型堆到尽可能强,参数更大、训练更久、能力更前沿,仿佛通往 AGI 就是一条单模型不断变强的直线。 Fusion 给出了另一种可能,把多个视角各异的模型组织起来协作,产出的结果可以超过其中任何一个,就像一支多样化的人类团队能解决任何单个天才都搞不定的问题。 通往 AGI 甚至 ASI 的关键,有一部分藏在 Harness 里。 竞争的焦点会跟着挪位,谁能把一群参差不齐的模型调度好、融合好,可能和谁能训出最强的单个模型,变得同样重要。 参考资料: https://openrouter.ai/blog/announcements/fusion-beats-frontier/ 编辑:马可 秒追ASI ⭐ 点赞、转发、在看一键三连 ⭐ 点亮星标,锁定新智元极速推送! 文章原文