开发者生态
morning
Gemini 3.5:前沿情报与行动
2026-05-19
1 阅读
meetpateltech
Gemini 3.5:前沿情报与行动 2026 年 5 月 19 日 · 分享 x.com Facebook LinkedIn LinkedIn 邮件 复制链接 Gemini 3.5 旨在帮助您执行复杂、代理的工作流程。 Koray Kavukcuoglu 首席技术官,Google DeepMind 兼首席 AI 架构师,Google Jeff Dean 首席科学家,Google DeepMind 和 Google 研究 Oriol Vinyals 副总裁,Google DeepMind Noam Shazeer 副总裁,Google DeepMind 分享 x.com Facebook LinkedIn Mail 复制链接 今天,我们将介绍 Gemini 3.5,这是我们将前沿智能与行动相结合的最新模型系列。这代表着构建更强大、更智能的代理的重大飞跃。我们通过发布 3.5 Flash 拉开了该系列的序幕。它为代理和编码提供了前沿性能,擅长于提供现实世界实用性的复杂的长期任务。 3.5 Flash 现已可供全球数十亿人使用: 通过 Gemini 应用程序和 Google 搜索中的 AI 模式为所有人提供服务 对于我们的代理优先开发平台 Google Antigravity 以及 Google AI Studio 和 Android Studio 中的 Gemini API 中的开发人员;对于 Gemini 企业代理平台和 Gemini Enterprise 中的企业。我们也在努力开发 3.5 Pro。它已经在内部使用,我们期待下个月推出。 3.5 Flash:代理和编码的前沿性能 Gemini 3.5 Flash 提供的智能可在多个维度上与大型旗舰机型相媲美,速度也符合您对 Flash 系列的期望。它是我们迄今为止最强大的代理和编码模型,在具有挑战性的编码和代理基准(如 Terminal-Bench 2.1 (76.2%)、GDPval-AA (1656 Elo) 和 MCP Atlas (83.6%))上优于 Gemini 3.1 Pro,并在多模态理解方面处于领先地位(CharXiv Reasoning 为 84.2%)。当查看每秒输出令牌时,它比其他前沿模型快 4 倍。 3.5 Flash 位于人工分析指数的右上象限,以超凡的速度提供前沿级智能,证明您不再需要以质量换取延迟。 3.5 Flash:大规模代理任务 这种速度和性能的平衡使得 3.5 Flash 非常适合处理长期代理任务。过去需要开发人员几天或审核人员几周的时间,3.5 Flash 现在可以帮助在很短的时间内完成,而且成本通常还不到其他前沿模型的一半。它快速规划、构建和迭代来解决现实世界的问题,无论是开发新应用程序、维护代码库还是帮助准备财务文档。当与更新的反重力工具结合使用时,3.5 Flash 成为部署协作子代理的强大引擎,以解决最苛刻用例的大规模问题。在监督下,它可以可靠地执行多步骤工作流程和编码任务,同时保持前沿性能。在 Antigravity 的支持下,3.5 Flash 执行多步骤工作流程,根据动态标准自动重命名和分类非结构化资产。利用反重力,3.5 Flash 使用两个代理来合成 AlphaZero 纸张,并在六个小时内编写出一个完全可玩的游戏。 3.5 Flash 使用 Antigravity 工具将混乱的遗留代码库转换为 Next.js。 3.5 Flash 使用子代理在反重力中创建新的城市景观。 3.5 Flash 使用两个代理:构建者和玩家,在快速自我完善循环中工作来开发反重力游戏。 3.5 Flash 建立在 Gemini 3 强大的多模式基础之上,可生成更丰富、更具交互性的 Web UI 和图形。 3.5 Flash 为 AI Studio 上的一篇研究论文创建交互式动画。 3.5 Flash 将纯文本描述转变为 AI Studio 上的交互式硬件。 3.5 Flash 并行执行多个概念,为 AI Studio 上的学校筹款活动构建完整的品牌概念。 3.5 Flash 在 AI Studio 上只需 60 秒即可为结帐流程生成不同的 UX 方法。 3.5 Flash:现实世界的影响 3.5 Flash 的现实世界代理功能已经为我们的开发人员和企业带来了有意义的进步。在开发 3.5 模型系列的过程中,我们与行业合作伙伴密切合作,了解他们的工作流程中出现的辛苦和复杂性。合作伙伴正在看到有意义的影响——从银行和金融科技公司自动化数周的工作流程到数据科学团队在复杂的数据环境中挖掘洞察力。 Shopify 并行运行子代理来长期分析复杂数据,以便在全球范围内进行更准确的商家增长预测。麦格理银行正在试验 3.5 Flash 如何通过推理 100 多页的复杂文档、检索相关信息并以低延迟提出可靠的建议来加速客户入职。 Salesforce 正在将 3.5 Flash 集成到 Agentforce 中,通过部署多个保留上下文并执行复杂的多轮工具调用的子代理,可靠地自动化复杂的企业任务。 3.5 Flash 正在帮助 Ramp 通过多模式统一实现更智能、更可靠的 OCR