智能AI
morning
GPT-5.6泄露了!
2026-05-25
1 阅读
新智元
新智元报道 【新智元导读】 最近,GPT-5.6泄露了!150万Token+神级极简UI,下月紧急上线,奥特曼的「超级智能体」要掀翻整个硅谷?6月AI大战,已经提前爆发了。 全网都在盼的OpenAI新模型——GPT-5.6,终于要来了! 距离GPT-5.5发布仅仅过去三周,就在昨天,整个AI圈开始疯转这个消息。 多名开发者在OpenAI的Codex后台日志中,赫然发现了一个尚未公布的神秘模型gpt-5.6,内部开发代号为 iris-alpha。 没错,这次依然是一次「手滑」,但透露出极其多的信号。 如果说,三周前的GPT-5.5,是OpenAI在编程领域的一大进步,那么这次,代号为 「iris-alpha」 的GPT-5.6,则是展示出一场强大的「暴力美学」升级。 内部代号曝光、150万上下文窗口实测跑通、零指令生成极简神级UI……显然,我们以为要等上大半年的GPT-5.6,以及传说中的GPT-5.6 Pro,即将在6月空降。 更可怕的是,这不仅仅是OpenAI一家在秀肌肉。Anthropic的Sonnet 4.8与Claude Mythos 1、谷歌的Gemini 3.5 Pro,甚至马斯克的Grok 5,全都在暗中蓄力,剑指6月。 这不再是单纯的「大模型迭代」,这是2026年AI领域最激烈的一场军备竞赛! 审美核爆 不仅是程序员,设计师也要失业? 这次,GPT-5.6在前端的突破,简直是彻头彻尾的质变。 长期以来,AI生成代码一直存在一个致命的痛点:「Slop」(泥浆/垃圾代码)。 大模型生成的后端逻辑往往非常出色,但一旦让它生成前端UI,出来的效果往往是一言难尽——充斥着繁杂臃肿的CSS、不协调的色彩搭配、公式化的「AI味」网格等等。 但这一切,在GPT-5.6面前被终结了。 科技博主Leo近日晒出了一张GPT-5.6生成的应用界面。 在这张截图中,GPT-5.6展现了被开发者称为封神的能力。 在完全没有给出详细prompt进行UI引导的默认状态下,GPT-5.6竟然自主生成了一款名为「Lumen Notes」的极简主义笔记应用程序。 它展现出了极其高阶的设计审美: 1. 成熟的网格布局:模块之间的间距控制达到了像素级的完美。 2. 克制的色彩哲学:放弃了早期AI喜欢用的高饱和度颜色,采用了淡紫色调的关键组件搭配,清晰的色彩编码标签让视觉焦点异常明确。 3. 字重分层与直观导航:字体大小、粗细的层次感极强,导航设计直观到不需要任何说明书。 「去Slop化(UI de-slopification)」——这是这次泄露中最让前端开发者感到震撼的词汇。 仅仅在10天前,Leo还在吐槽GPT-5.6的前端生成效果极差。仅仅一周之隔,效果就发生了天翻地覆的变化。 这种颠覆性的UI去Slop化效果,说明OpenAI正在集中算力,定向爆破前端代码生成的短板。 显然,他们正集中精准爆破被长期抱怨的一痛点。 以前,Claude 4.5的Artifacts之所以封神,是因为它能在对话中实时生成可预览的代码组件。而现在,GPT-5.6直接把审美水准拉到了同等段位。 不久以后,只等GPT-5.6接口一开,直接用它来生成高质量的商业级应用前端。 前端程序员会失业吗?也许不会。但那些缺乏顶级设计审美的人,在GPT-5.6面前,生存空间已经不多了。 让全网破防的「金丝雀」 1.5M上下文屠榜 GPT-5.6的身影,不是第一次出现了。 知名开发者Haider在日常审查Codex的路由日志时,敏锐地捕捉到—— 在满屏指向gpt-5.5的调用记录中,赫然出现了一条明确映射为gpt-5.6的条目。 起初,Haider以为这只是OpenAI在做「金丝雀测试」时留下的一点痕迹,或者是某个系统Bug,因为它很快消失了。 但到了5月第二周,风向彻底变了。 上周,当开发者尝试在代码中强行指定调用gpt-5.6时,系统还会冷冰冰地弹出一个报错:「model is not supported」。 但在过去的几天里,多名嗅觉灵敏的开发者通过ChatGPT Pro的OAuth认证,在Codex环境中成功调用了尚未公布的GPT-5.6模型。 不仅跑通了,探针测试还显示,GPT-5.6的上下文窗口达到了惊人的1.5M tokens! 要知道,目前强大的GPT-5.5 API上下文窗口是1.05M tokens,而如果走Codex OAuth通道,更是被限制在区区400K。GPT-5.6直接将这个上限拉升了将近43%。 开发者在辅助工具OpenCode中的极限实测证实:当输入达到90万tokens时,模型依然对答如流,甚至突破1.05M的请求也能被完美接住。 在这些隐秘的测试对话中,新模型自曝:它运行在openai/gpt-5.6上,推理等级最高可设定为x high,并且支持极其迅捷的fast模式。 随后,爆料大神Leo也跳出来实锤:「GPT-5.6的研发已经全面推进,首批checkpoint在过去几天已经开始内部测试,预计下个月正式发布。」 伴随实锤而来的,是三个极具神秘色彩的内部测试代号:iris-alpha(鸢尾花)、ember-alpha(余烬)、beacon-alpha(灯塔)。 目前泄露的信息显示,这次OpenAI将采取 「双版本」 策略:标准版和GPT-5.6 Pro。 - 标准版主打多步骤推理能力的跃升; - Pro版本则重点强化 「智能体」 工作流。 显然,奥特曼不要做一个只会聊天的对话框,他要做一个能接管你所有数字化生存空间的「超级智能体」。 Polymarket上更是用真金白银给出了态度:GPT-5.6在6月30日前发布的概率,已经飙升至85%以上。 GPT-5.6 Pro与三巨头混战 6月注定血流成河 如果说150万Token和神级UI是GPT-5.6的「外功」,那么它真正让人胆寒的「内功」,则是它在多步推理和智能体工作流上的升级。 一位接近OpenAI内部的研究人员泄露了一条重要信息:「为近期一项重大数学突破提供支持的那个底层模型,目前已经在OpenAI内部被广泛用作日常调试和技术工作的主力驱动。」 业内资深人士对此评价道:「版本号并不重要,重要的是OpenAI显然在内部将其作为日常调试工具使用。这通常是最明确的信号。当构建AI的工程师们都开始信任它,用于实际研发时,你就知道它的能力有了显著提升。」 显然,GPT-5.6的进化方向非常明确:不仅要追求benchmark分数,更要让用户在执行长线任务时更加丝滑,也就是Agent工作流的方向。 而且,不仅是GPT-5.6,根据最新的供应链和内部爆料,Anthropic和Google也准备在6月动手了。 显然,6月我们将迎来一波大模型的爆发。 Anthropic Claude Sonnet 4.8已经在Vertex AI后端列表中现身,代号「Conway」,主打持久化后台代理,专门针对企业级超长任务。 Google Gemini 3.5 Pro传闻同样定档6月,意图在多模态领域扳回一城。 三大前沿模型将在同一个月内硬碰硬。这个6月,是真正的一场大模型盛宴! OpenAI大模型,迭代正在加速 在这场关于GPT-5.6的泄露狂欢中,有一个数据让人细思极恐:OpenAI的发布周期。