开发者生态
evening
Gemini 3.5 Flash 中的计算机使用
2026-06-24
1 阅读
swolpers
在 Gemini 3.5 Flash 中引入计算机使用 2026 年 6 月 24 日 · 分享 x.com Facebook LinkedIn 邮件 复制链接 计算机使用现在是 Gemini 3.5 Flash 中的内置工具,用于构建可以跨平台交互的代理。 Mateo Quiros 产品经理,Google DeepMind 分享 x.com Facebook LinkedIn 邮件 复制链接 您的浏览器不支持音频元素。收听文章此内容由 Google AI 生成。生成式 AI 处于实验阶段 [[持续时间]] 分钟 语音速度 语音速度 0.75X 1X 1.5X 2X 计算机使用现在是 Gemini 3.5 Flash 支持的内置工具,可为代理计算机使用任务提供迄今为止的最佳性能。以前仅作为独立的 Gemini 2.5 计算机使用模型提供,现在计算机使用已原生集成在主要的 Gemini Flash 模型中。 Gemini 已经擅长函数调用和使用搜索和地图基础等内置工具。凭借内置的计算机使用功能,开发人员现在可以使用 3.5 Flash 可靠地构建自定义代理,这些代理可以跨浏览器、移动和桌面环境进行查看、推理并采取行动。这可以提高长期和企业自动化任务的性能,例如跨专业应用程序的持续软件测试和知识工作。开发人员和企业可以通过 Gemini API 和 Gemini Enterprise Agent Platform 开始在 3.5 Flash 中使用计算机。 3.5 Flash 使用计算机来分析 Gemini 应用程序并返回分类的功能列表。 3.5 Flash 与计算机的使用审核其自身文档的可访问性问题。确保计算机在 3.5 Flash 中安全使用 为了减轻在实时环境中运行的代理的一些即时注入风险,我们在 Gemini 3.5 Flash 中对计算机使用进行有针对性的对抗性训练。我们还发布了两个可选的企业保护系统,使企业能够: 要求用户明确确认敏感或不可逆转的操作。如果识别出间接提示注入,则自动停止任务。采用“纵深防御”方法,我们鼓励开发人员将这些功能与安全沙箱、人机交互验证和严格的访问控制相结合。有关安全措施的更多信息可以在我们的最佳实践文档中找到。我们已经看到客户通过使用计算机来创造价值。以下是他们中的一些人所说的:今天开始使用计算机进行构建:立即尝试:在 Browserbase 托管的演示环境中测试功能。开始构建:通过 Gemini API 和 Gemini Enterprise Agent Platform 深入了解我们的参考实现和文档。在收件箱中获取更多来自 Google 的故事。在收件箱中获取更多来自 Google 的故事。电子邮件地址 您的信息将根据 Google 的隐私政策使用。订阅完成。只要再多一步。检查您的收件箱以确认您的订阅。您已经订阅了我们的时事通讯。您还可以使用不同的电子邮件地址进行订阅。发表于: