GPT-5.6泄露了！

新智元报道【新智元导读】最近，GPT-5.6泄露了！150万Token+神级极简UI，下月紧急上线，奥特曼的「超级智能体」要掀翻整个硅谷？6月AI大战，已经提前爆发了。全网都在盼的OpenAI新模型——GPT-5.6，终于要来了！距离GPT-5.5发布仅仅过去三周，就在昨天，整个AI圈开始疯转这个消息。多名开发者在OpenAI的Codex后台日志中，赫然发现了一个尚未公布的神秘模型gpt-5.6，内部开发代号为 iris-alpha。没错，这次依然是一次「手滑」，但透露出极其多的信号。如果说，三周前的GPT-5.5，是OpenAI在编程领域的一大进步，那么这次，代号为「iris-alpha」的GPT-5.6，则是展示出一场强大的「暴力美学」升级。内部代号曝光、150万上下文窗口实测跑通、零指令生成极简神级UI……显然，我们以为要等上大半年的GPT-5.6，以及传说中的GPT-5.6 Pro，即将在6月空降。更可怕的是，这不仅仅是OpenAI一家在秀肌肉。Anthropic的Sonnet 4.8与Claude Mythos 1、谷歌的Gemini 3.5 Pro，甚至马斯克的Grok 5，全都在暗中蓄力，剑指6月。这不再是单纯的「大模型迭代」，这是2026年AI领域最激烈的一场军备竞赛！审美核爆不仅是程序员，设计师也要失业？这次，GPT-5.6在前端的突破，简直是彻头彻尾的质变。长期以来，AI生成代码一直存在一个致命的痛点：「Slop」（泥浆/垃圾代码）。大模型生成的后端逻辑往往非常出色，但一旦让它生成前端UI，出来的效果往往是一言难尽——充斥着繁杂臃肿的CSS、不协调的色彩搭配、公式化的「AI味」网格等等。但这一切，在GPT-5.6面前被终结了。科技博主Leo近日晒出了一张GPT-5.6生成的应用界面。在这张截图中，GPT-5.6展现了被开发者称为封神的能力。在完全没有给出详细prompt进行UI引导的默认状态下，GPT-5.6竟然自主生成了一款名为「Lumen Notes」的极简主义笔记应用程序。它展现出了极其高阶的设计审美： 1. 成熟的网格布局：模块之间的间距控制达到了像素级的完美。 2. 克制的色彩哲学：放弃了早期AI喜欢用的高饱和度颜色，采用了淡紫色调的关键组件搭配，清晰的色彩编码标签让视觉焦点异常明确。 3. 字重分层与直观导航：字体大小、粗细的层次感极强，导航设计直观到不需要任何说明书。「去Slop化（UI de-slopification）」——这是这次泄露中最让前端开发者感到震撼的词汇。仅仅在10天前，Leo还在吐槽GPT-5.6的前端生成效果极差。仅仅一周之隔，效果就发生了天翻地覆的变化。这种颠覆性的UI去Slop化效果，说明OpenAI正在集中算力，定向爆破前端代码生成的短板。显然，他们正集中精准爆破被长期抱怨的一痛点。以前，Claude 4.5的Artifacts之所以封神，是因为它能在对话中实时生成可预览的代码组件。而现在，GPT-5.6直接把审美水准拉到了同等段位。不久以后，只等GPT-5.6接口一开，直接用它来生成高质量的商业级应用前端。前端程序员会失业吗？也许不会。但那些缺乏顶级设计审美的人，在GPT-5.6面前，生存空间已经不多了。让全网破防的「金丝雀」 1.5M上下文屠榜 GPT-5.6的身影，不是第一次出现了。知名开发者Haider在日常审查Codex的路由日志时，敏锐地捕捉到—— 在满屏指向gpt-5.5的调用记录中，赫然出现了一条明确映射为gpt-5.6的条目。起初，Haider以为这只是OpenAI在做「金丝雀测试」时留下的一点痕迹，或者是某个系统Bug，因为它很快消失了。但到了5月第二周，风向彻底变了。上周，当开发者尝试在代码中强行指定调用gpt-5.6时，系统还会冷冰冰地弹出一个报错：「model is not supported」。但在过去的几天里，多名嗅觉灵敏的开发者通过ChatGPT Pro的OAuth认证，在Codex环境中成功调用了尚未公布的GPT-5.6模型。不仅跑通了，探针测试还显示，GPT-5.6的上下文窗口达到了惊人的1.5M tokens！要知道，目前强大的GPT-5.5 API上下文窗口是1.05M tokens，而如果走Codex OAuth通道，更是被限制在区区400K。GPT-5.6直接将这个上限拉升了将近43%。开发者在辅助工具OpenCode中的极限实测证实：当输入达到90万tokens时，模型依然对答如流，甚至突破1.05M的请求也能被完美接住。在这些隐秘的测试对话中，新模型自曝：它运行在openai/gpt-5.6上，推理等级最高可设定为x high，并且支持极其迅捷的fast模式。随后，爆料大神Leo也跳出来实锤：「GPT-5.6的研发已经全面推进，首批checkpoint在过去几天已经开始内部测试，预计下个月正式发布。」伴随实锤而来的，是三个极具神秘色彩的内部测试代号：iris-alpha（鸢尾花）、ember-alpha（余烬）、beacon-alpha（灯塔）。目前泄露的信息显示，这次OpenAI将采取「双版本」策略：标准版和GPT-5.6 Pro。 - 标准版主打多步骤推理能力的跃升； - Pro版本则重点强化「智能体」工作流。显然，奥特曼不要做一个只会聊天的对话框，他要做一个能接管你所有数字化生存空间的「超级智能体」。 Polymarket上更是用真金白银给出了态度：GPT-5.6在6月30日前发布的概率，已经飙升至85%以上。 GPT-5.6 Pro与三巨头混战 6月注定血流成河如果说150万Token和神级UI是GPT-5.6的「外功」，那么它真正让人胆寒的「内功」，则是它在多步推理和智能体工作流上的升级。一位接近OpenAI内部的研究人员泄露了一条重要信息：「为近期一项重大数学突破提供支持的那个底层模型，目前已经在OpenAI内部被广泛用作日常调试和技术工作的主力驱动。」业内资深人士对此评价道：「版本号并不重要，重要的是OpenAI显然在内部将其作为日常调试工具使用。这通常是最明确的信号。当构建AI的工程师们都开始信任它，用于实际研发时，你就知道它的能力有了显著提升。」显然，GPT-5.6的进化方向非常明确：不仅要追求benchmark分数，更要让用户在执行长线任务时更加丝滑，也就是Agent工作流的方向。而且，不仅是GPT-5.6，根据最新的供应链和内部爆料，Anthropic和Google也准备在6月动手了。显然，6月我们将迎来一波大模型的爆发。 Anthropic Claude Sonnet 4.8已经在Vertex AI后端列表中现身，代号「Conway」，主打持久化后台代理，专门针对企业级超长任务。 Google Gemini 3.5 Pro传闻同样定档6月，意图在多模态领域扳回一城。三大前沿模型将在同一个月内硬碰硬。这个6月，是真正的一场大模型盛宴！ OpenAI大模型，迭代正在加速在这场关于GPT-5.6的泄露狂欢中，有一个数据让人细思极恐：OpenAI的发布周期。

订阅66必读