智能AI morning

蚂蚁百灵 Ring-2.6-1T 开源 Agent 执行能力全面增强

2026-05-15 1 阅读 量子位的朋友们
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 蚂蚁百灵 Ring-2.6-1T 开源 Agent 执行能力全面增强 量子位的朋友们 2026-05-15 15:14:36 来源: 量子位 AIME 26 得分 95.83 5 月 15 日,蚂蚁百灵宣布其旗舰级思考模型 Ring-2.6-1T 正式开源,权重文件同步上线 Hugging Face、ModelScope 平台。此前,该模型上线 OpenRouter,并开放限时免费 API 体验。 Ring-2.6-1T 的核心设计逻辑是“按需思考”,模型引入了可调节的 Reasoning Effort 机制,支持 high 与 xhigh 两种推理强度,开发者可以根据任务特性动态分配推理资源。其中,high 模式面向高频 Agent 工作流获得更高效率,适合多轮对话、工具协作与任务拆解;xhigh 模式则面向数学竞赛、科研分析等高难任务,释放能力上限。有开发者表示,这是“工程实用性”的进步。 根据权威评测,Ring-2.6-1T 的两档模式各有所长。high 模式下,PinchBench 得分 87.60,高于 GPT-5.4 xHigh和Gemini-3.1-Pro high,Tau2-Bench Telecom 达到 95.32,Agent 场景执行能力显著。xhigh 模式下,AIME 26 得分 95.83,接近多家头部模型水平;GPQA Diamond 达到 88.27,体现出稳健的科学知识理解与复杂推理能力。 在训练层面,Ring-2.6-1T 采用异步(Async)强化学习训练架构,将策略采样与参数更新解耦为独立流水线,解决了传统同步训练中 GPU 资源等待、训练吞吐不足的问题,并支持更长周期的持续训练。在此基础上,百灵将此前在 Ring-1T 中验证过的“棒冰算法”引入异步 RL 训练,解决训练不稳定问题。百灵表示,相关技术细节将在后续技术报告中公开。 近一个月内,百灵迭代发布并开源了多款模型,覆盖 Ling 语言模型和 Ring 推理模型。记者注意到,相较于追求更大的参数规模或更高的单点分数,百灵更强调“真实生产环境使用”,系列模型集体切入“Token Efficiency”,强调用更少的 token 完成高质量的任务输出。市场对此也有明确反馈,Ling-2.6-flash 的匿名测试版本“Elephant Alpha”上线 OpenRouter 后,连续多日位列 Trending 榜首,日均 tokens 调用量达到100B级别。 版权所有,未经授权不得以任何形式转载及使用,违者必究。 百灵 蚂蚁 量子位的朋友们 阿里发布Qoder 1.0,可全面接管代码生成、验证和交付流程 2026-05-15 智能无处不在:OpenClaw预示的AI未来 2026-05-15 淘天金码奖落幕:20 名超级工程师诞生,推动 AI Native 实践 2026-05-14 阿里云上线团队版Token Plan,支持多坐席分配和管理 2026-05-12 扫码分享至朋友圈 相关阅读 AI医生终于有了硬标尺!全球首个专病循证评测框架GAPS发布,蚂蚁联合北大王俊院士团队出品 聚焦肺癌,92个问题+1691个临床要点 邓思邈 2025-12-29 AI医生 AI医疗 北大 蚂蚁 前端没死,AI APP正在返祖 程序员要还技术债 十三 2025-12-02 AI APP 前端 前端程序员 终端开发 蚂蚁 蚂蚁技术日首次对外开放,各种大模型应用看花了 CTO何征宇:AI规模化落地的三个决定因素 白交 2024-05-29 大模型 蚂蚁 超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码全开源 | 蚂蚁&清华出品 只需200条数据 白交 2025-04-01 开源 推理框架 蚂蚁 探营云栖大会黑科技:动嘴就能做网站,给灵感就能制作海报 三个AI机器人 白交 2023-10-31 云栖大会 蚂蚁 蚂蚁数科企业级AI产品全线出海,首次在海外市场展现全栈产品矩阵 还有Web3服务赛道 白交 2025-05-14 出海 蚂蚁 热门文章 两项AI政策发布,范式智能战略布局与产业方向高度契合 2026-05-09 太初元碁携龙虾一体机亮相北京科博会 2026-05-09 阶跃最新语音模型位列 Artificial Analysis 评测榜中国第一 2026-05-09 不更新参数就能强化学习!OpenAI翁家翌提出新范式:决策只需AI手搓一个.py 文件 2026-05-09 百度发布文心 5.1:搜索能力登顶国内,预训练成本仅为业界 6% 2026-05-09