谷歌Gemini 3.2偷跑上线！2200行代码一镜到底，Claude/GPT坐不住了

新智元报道【新智元导读】发布会还没开，谷歌彻底藏不住了！Gemini 3.2 Flash网页端静默上线，被开发者抓了个正着。单次提示狂飙2200行代码、手搓Windows 98，直接把自家旗舰Pro按在地上摩擦。 I/O大会在即，谷歌彻底藏不住了！就在刚刚，Gemini 3.2 Flash悄无声息地「上线」，被全球开发者抓了个正着。 AI大佬们只是在Gemini网页端，选择「Fast模式+Canvas」，就触发了一个完全不同的模型。不仅如此，在Gemini应用端，还灰度了「思考层级」功能。最恐怖的，是Gemini 3.2 Flash的编码实力！代码量从过去最多400-500行，直接飙到1000行以上：交互式SVG、2200行的Three.js项目、PS5蓝图.... 这些以前想都不敢想的复杂编码任务，现在单次生成，一次成功。 Gemini 3.2 Flash，悄悄「上线」了最先发现问题的，是一个Reddit网友。他注意到，Gemini Canvas上生成的代码风格，和Google AI Studio里同一个模型跑出来的结果，完全不同—— 前者输出了大量「GPT化」的高质量UI设计SVG，后者还是老Flash的朴素风格。同一个prompt，两种截然不同的结果。结论只有一个：后台在偷偷换模型。与此同时，Google Cloud Console后端也暴露了。一个名为 gemini-3.2-flash-lite-live-preview 的模型条目赫然出现在控制台里。更让人坐不住的是，谷歌后台开始在网页端静默路由到这个新模型。许多大佬分享了触发方法：选择Thinking+Canvas模式，就有概率命中Gemini 3.2 Flash。全网首测，编码杀疯在物理模拟3D场景的测试中，Gemini 3.2 Flash展现出极为强悍的编码实力。仅单次提示，它便用精湛的代码，气球透明光影、撞击反馈、水花粒子特效瞬间拉满。它还能一次生成，细节高度丰富，且可交互的PS5主机SVG。在前端上的设计，Gemini 3.2 Flash的编码能力也是一绝。最让人惊叹的是，Gemini 3.2 Flash仅凭一个简单的提示，即可生成2200行代码。要知道，过去的Flash模型，输出很难突破400到500行。现在，轻松突破1000行。不得不说，一个Flash级别的模型，在创意编程任务上把自家旗舰Pro按在地上摩擦，这才是真正的新闻。另外，还有人在LM Arena上盲测的3.2 Pro版本，徒手搓出了一个原汁原味、甚至真正能用的Windows 98！拖拽、缩放窗口只是基本操作，它里面甚至内置了一个真能联网的浏览器。打开「工具」菜单，里面的经典游戏、计算器、画图、Word、记事本全部支持真实交互。再配上像素级还原的任务栏和启动登录体验，这代码完备度简直太顶了。核心技术：蒸馏+稀疏化 Gemini 3.2 Flash能取得如此不凡的表现，是谷歌DeepMind技术迭代的又一里程碑。核心奥秘在于，炉火纯青的「模型蒸馏与稀疏化」技术。他们如同重塑骨骼一般，成功将LLM的精髓压缩至轻量化版本，打破了「模型变小、性能雪崩」的行业魔咒。业内更有震撼传言：基准测试表明，Gemini 3.2 Flash在核心的代码与推理任务上，已逼近GPT-5.5 92%的性能。然而，其推理成本却骤降了15-20倍，且大多数查询的响应延迟被极限压缩至200毫秒以内。这一套「降维打击」的技术组合拳，正为谷歌带来难以估量的回报。 Gemini全能管家，一键打通所有APP 更重磅的是，模型泄露只是冰山一角。 Gemini App正在全面铺开第三方应用集成。目前，已接入GitHub、OpenStax、Spotify、WhatsApp。支持的文档显示，Canva、Instacart、OpenTable即将上线。 Canva集成意味着，可以直接在Gemini里说—— 用Canva帮我设计一张婚礼请柬，主题是复古风，用灰玫瑰色和鼠尾草绿。它就能直接调用Canva完成设计，甚至可以让Gemini生成一张图片，然后一键推送到Canva编辑。 Instacart集成在Gemini里查库存、选门店、加购物车，全自动。甚至，你可以直接丢一个菜谱链接，说「我要做这道菜，把所有食材加到我的Instacart」。 OpenTable集成查餐厅、订位、改签、取消，全部在对话里完成，比如—— 帮我找一家能坐8个人的牛排馆，下周五晚上7点以后有位子就订了。显然，谷歌在用Gemini做超级入口：不需要打开任何App，所有事情都在一个对话窗里搞定。它正在变成一个能打电话、能订餐、能设计、能购物的全能AI管家。「全家桶」曝光，谷歌火力全开一年一度的谷歌I/O大会，倒计时不到两天。发布会还没开，谷歌一系列产品几乎全曝光，接下来，即将到来的产品可能有—— Gemini Spark / Remy ：全天候24/7都在线的Agent，专为处理应用、收件箱、聊天和网页任务而生 Gemini Omni ：直接在Gemini内部进行视频生成、编辑和二次创作 Veo升级：深度融入谷歌的整个视频技术栈 Gemini 3.2 / 3.5 Flash ：更快、更便宜、更低延迟 Gemini 3.5 Pro ：编程和推理能力都会有大幅提升 Spark Robin ：带来更丰富的视觉交互与回复 Teamfood ：支持记忆功能和长期上下文信号三巨头「ASI暗战」这一次发布，对于谷歌来说至关重要。 OpenAI正在筹备GPT-5.6，Anthropic的下一代模型也蓄势待发。此前有爆料称，Gemini新模型大约对标GPT-5.5水平，跟Claude Mythos还有明显差距。一位大佬Kol Tregaskes犀利地评价道，「谷歌不能再只是追赶了，它需要超越」。等谷歌追上今天的基准线，其他人早就跑远了。对我来说，Gemini排第三。 I/O是他们证明自己在争夺胜利的机会。现在我不相信大多数人每天醒来会兴奋地选择Gemini。这话刺耳，但不无道理。谷歌有最强的基础设施、最大的用户基数、最全的产品矩阵，但在「模型本身够不够强」这个最核心的问题上，它一直被两个对手压着打。 I/O 2026大会，是谷歌的翻盘局。不是「能不能追上」的问题，是「能不能让人相信它在领跑」的问题。 2026年的AI竞争，已经不是比谁的benchmark高了。这是一场通往ASI的终极竞速。参考资料： https://9to5google.com/2026/05/17/gemini-app-thinking-level/ https://x.com/marmaduke091/status/2056052380278374830?s=20 编辑：桃子 David 秒追ASI ⭐ 点赞、转发、在看一键三连 ⭐ 点亮星标，锁定新智元极速推送！文章原文