智能AI
morning
谷歌Gemini 3.2偷跑上线!2200行代码一镜到底,Claude/GPT坐不住了
2026-05-18
1 阅读
新智元
新智元报道 【新智元导读】 发布会还没开,谷歌彻底藏不住了!Gemini 3.2 Flash网页端静默上线,被开发者抓了个正着。单次提示狂飙2200行代码、手搓Windows 98,直接把自家旗舰Pro按在地上摩擦。 I/O大会在即,谷歌彻底藏不住了! 就在刚刚,Gemini 3.2 Flash悄无声息地「上线」,被全球开发者抓了个正着。 AI大佬们只是在Gemini网页端,选择「Fast模式+Canvas」,就触发了一个完全不同的模型。 不仅如此,在Gemini应用端,还灰度了「思考层级」功能。 最恐怖的,是Gemini 3.2 Flash的编码实力! 代码量从过去最多400-500行,直接飙到1000行以上:交互式SVG、2200行的Three.js项目、PS5蓝图.... 这些以前想都不敢想的复杂编码任务,现在单次生成,一次成功。 Gemini 3.2 Flash,悄悄「上线」了 最先发现问题的,是一个Reddit网友。 他注意到,Gemini Canvas上生成的代码风格,和Google AI Studio里同一个模型跑出来的结果,完全不同—— 前者输出了大量「GPT化」的高质量UI设计SVG,后者还是老Flash的朴素风格。 同一个prompt,两种截然不同的结果。结论只有一个:后台在偷偷换模型。 与此同时,Google Cloud Console后端也暴露了。 一个名为 gemini-3.2-flash-lite-live-preview 的模型条目赫然出现在控制台里。 更让人坐不住的是,谷歌后台开始在网页端静默路由到这个新模型。 许多大佬分享了触发方法:选择Thinking+Canvas模式,就有概率命中Gemini 3.2 Flash。 全网首测,编码杀疯 在物理模拟3D场景的测试中,Gemini 3.2 Flash展现出极为强悍的编码实力。 仅单次提示,它便用精湛的代码,气球透明光影、撞击反馈、水花粒子特效瞬间拉满。 它还能一次生成,细节高度丰富,且可交互的PS5主机SVG。 在前端上的设计,Gemini 3.2 Flash的编码能力也是一绝。 最让人惊叹的是,Gemini 3.2 Flash仅凭一个简单的提示,即可生成2200行代码。 要知道,过去的Flash模型,输出很难突破400到500行。现在,轻松突破1000行。 不得不说,一个Flash级别的模型,在创意编程任务上把自家旗舰Pro按在地上摩擦,这才是真正的新闻。 另外,还有人在LM Arena上盲测的3.2 Pro版本,徒手搓出了一个原汁原味、甚至真正能用的Windows 98! 拖拽、缩放窗口只是基本操作,它里面甚至内置了一个真能联网的浏览器。 打开「工具」菜单,里面的经典游戏、计算器、画图、Word、记事本全部支持真实交互。 再配上像素级还原的任务栏和启动登录体验,这代码完备度简直太顶了。 核心技术:蒸馏+稀疏化 Gemini 3.2 Flash能取得如此不凡的表现,是谷歌DeepMind技术迭代的又一里程碑。 核心奥秘在于,炉火纯青的「模型蒸馏与稀疏化」技术。 他们如同重塑骨骼一般,成功将LLM的精髓压缩至轻量化版本,打破了「模型变小、性能雪崩」的行业魔咒。 业内更有震撼传言:基准测试表明,Gemini 3.2 Flash在核心的代码与推理任务上,已逼近GPT-5.5 92%的性能。 然而,其推理成本却骤降了15-20倍,且大多数查询的响应延迟被极限压缩至200毫秒以内。 这一套「降维打击」的技术组合拳,正为谷歌带来难以估量的回报。 Gemini全能管家,一键打通所有APP 更重磅的是,模型泄露只是冰山一角。 Gemini App正在全面铺开第三方应用集成。目前,已接入GitHub、OpenStax、Spotify、WhatsApp。 支持的文档显示,Canva、Instacart、OpenTable即将上线。 Canva集成 意味着,可以直接在Gemini里说—— 用Canva帮我设计一张婚礼请柬,主题是复古风,用灰玫瑰色和鼠尾草绿。 它就能直接调用Canva完成设计,甚至可以让Gemini生成一张图片,然后一键推送到Canva编辑。 Instacart集成 在Gemini里查库存、选门店、加购物车,全自动。 甚至,你可以直接丢一个菜谱链接,说「我要做这道菜,把所有食材加到我的Instacart」。 OpenTable集成 查餐厅、订位、改签、取消,全部在对话里完成,比如—— 帮我找一家能坐8个人的牛排馆,下周五晚上7点以后有位子就订了。 显然,谷歌在用Gemini做超级入口:不需要打开任何App,所有事情都在一个对话窗里搞定。 它正在变成一个能打电话、能订餐、能设计、能购物的全能AI管家。 「全家桶」曝光,谷歌火力全开 一年一度的谷歌I/O大会,倒计时不到两天。 发布会还没开,谷歌一系列产品几乎全曝光,接下来,即将到来的产品可能有—— Gemini Spark / Remy :全天候24/7都在线的Agent,专为处理应用、收件箱、聊天和网页任务而生 Gemini Omni :直接在Gemini内部进行视频生成、编辑和二次创作 Veo升级 :深度融入谷歌的整个视频技术栈 Gemini 3.2 / 3.5 Flash :更快、更便宜、更低延迟 Gemini 3.5 Pro :编程和推理能力都会有大幅提升 Spark Robin :带来更丰富的视觉交互与回复 Teamfood :支持记忆功能和长期上下文信号 三巨头「ASI暗战」 这一次发布,对于谷歌来说至关重要。 OpenAI正在筹备GPT-5.6,Anthropic的下一代模型也蓄势待发。 此前有爆料称,Gemini新模型大约对标GPT-5.5水平,跟Claude Mythos还有明显差距。 一位大佬Kol Tregaskes犀利地评价道,「谷歌不能再只是追赶了,它需要超越」。 等谷歌追上今天的基准线,其他人早就跑远了。对我来说,Gemini排第三。 I/O是他们证明自己在争夺胜利的机会。现在我不相信大多数人每天醒来会兴奋地选择Gemini。 这话刺耳,但不无道理。 谷歌有最强的基础设施、最大的用户基数、最全的产品矩阵,但在「模型本身够不够强」这个最核心的问题上,它一直被两个对手压着打。 I/O 2026大会,是谷歌的翻盘局。 不是「能不能追上」的问题,是「能不能让人相信它在领跑」的问题。 2026年的AI竞争,已经不是比谁的benchmark高了。这是一场通往ASI的终极竞速。 参考资料: https://9to5google.com/2026/05/17/gemini-app-thinking-level/ https://x.com/marmaduke091/status/2056052380278374830?s=20 编辑:桃子 David 秒追ASI ⭐ 点赞、转发、在看一键三连 ⭐ 点亮星标,锁定新智元极速推送! 文章原文