智能AI morning

谷歌CEO最新访谈:谷歌多模态能力领先,但Coding确实落后了

2026-05-25 1 阅读 划重点KeyPoints
作者|林易 编辑|重点君 谷歌 I/O大会落幕后,谷歌首席执行官Sundar Pichai接受了知名科技播客Hard Fork的专访。 对于外界最关注的谷歌大模型 能力 , Pichai 表示 , 谷歌模型在整体智能上 极具竞争力,但在代理式编程( agentic coding)和长周期任务 方面 ,依然落后于行业前沿水平。 新 发布的 Gemini 3.5 Flash模型 存在 伪影和性能退化 问题 ,团队 正在 通过 后训练 进行快速修复 。 我们梳理了这场访谈的核心信息,以下是重点内容: 1. 谷歌模型的多模态能力处于前沿,但编程与长周期任务能力落后 针对外界对谷歌大模型实力的关注, Pichai说,谷歌的模型在文本、多模态输入、语音与音频处理,以及通用推理等整体智能维度上,均处于行业极具竞争力的前沿水平。但在代理式编程(agentic coding)、指令遵循以及长周期任务处理方面,谷歌目前暂时落后。资深开发者在复杂代码库上执行的长期任务,是谷歌当前必须坚守并全力追赶的重要阵地。 此外,针对刚发布的 Gemini 3.5 Flash模型出现的性能退化和行为异常问题,Pichai表示这是新领域探索中的常见现象,团队将通过后训练迅速修复,并逐步放宽为防范服务中断而设置的使用限制。 2. 谷歌搜索不会 激进 切换至全 AI模式,来源和链接将 长期 存在 谷歌不会采取激进的方式 将搜索 切换到全 AI模式 。 Pichai说, 引导用户共同经历技术变革 , 确保产品符合用户预期至关重要 。 虽然谷歌 正在全面推进 AI ,但用户依然需要 搜索节点这种 快速建立联系 的方式 ,因此来源和链接将始终作为搜索的一部分而存在 。 在商业模式层面上, Pichai 认为, 经济价值始终取决于技术为用户提供的价值总量 ,而 在 AI模式下,智能体将比过去为用户创造更多的总价值 。 因此,谷歌将持续采用订阅与广告相结合的商业模式, 这一 商业规律在新技术周期中并不会发生改变 。 3. 谷歌智能体产品将采用渐进式推广策略,以赢取用户信任,防范黑客攻击 谷歌最新智能体产品 Spark计划于今年夏天发布,Pichai分享了他个人测试体验:Spark能够自主读取会议安排,直接在日历中按类别进行颜色编码,清晰标记出不同的会议类别及工作时间。 在谈到智能体的推广策略时, Pichai说,赢得用户信任的关键在于分步推进,向人们提供绝对的掌控感和系统透明度。如果智能体发生了意料之外的行为,用户就会产生退缩心理。此外,从安全角度来看,智能体系统存在被外部黑客攻击的隐患,因此在技术推进过程中必须确保边界安全,避免以错误的方式越界。 4. 谷歌向竞争对手开放 TPU算力,以保持硬件前沿优势 为了满足模型迭代的庞大算力需求,谷歌在供应自研模型的同时,依然向竞争对手和外部公司出售 TPU芯片的访问权限。提供技术能让谷歌保持在最前沿,促使团队开发出最好的下一代硬件,并在各个方面获得规模经济优势。如果缺乏庞大的外部云业务支撑,公司无论如何也不会去规划如此高产量的芯片制造。 5. AGI过去一两年的演进速度已超出原有预期 底层技术向 AGI迈进是正在发生的必然趋势。虽然 Pichai 并未给出实现 AGI的确切时间表,但他承认,过去一两年的技术演进速度超出了原有的预期,让这一目标的实现节点显得更近。即使完全实现AGI还需要时间,三年后的技术也将比今天强大得多,因此社会公众不能因为认为实现AGI尚需时日就放松准备,整个社会必须提前做好内化与应对的准备。 以下是 Sundar Pichai访谈实录: 1. 谷歌 在 AI竞赛中的模型能力评估 Kevin Roose: Sundar Pichai,欢迎回到Hard Fork。 Sundar Pichai: 感谢邀请,很高兴来到这里。 Kevin Roose: 我们上一次请你参加节目是在 2023年。当时Bard刚刚发布,我想当时人们的普遍看法是Google在AI领域正处于追赶状态。你现在如何看待你们在这场竞赛中的地位? Sundar Pichai: 这勾起了我的回忆。感觉那已经是很久以前的事了,这三年感觉过了很久。但我认为,看到这项技术所取得的进展是惊人的。作为一家公司,我们也取得了长足的进步。我认为对于整个行业来说,这是一个充满活力的时刻。 我们的模型在某些领域处于前沿水平,在某些领域我们也落后于前沿水平,这是一种并存的状态。如果你观察包括文本、多模态在内的整体能力、语音或音频,以及通用的推理能力, 在整体智能方面,我认为我们非常有竞争力。当涉及到结合工具使用的代理式编程( agentic coding)以及指令遵循、长周期任务时,我认为我们目前稍微落后了一点。 但我们正在努力工作。这个领域充满了活力,所有领先的实验室都有各自的预训练周期,所以会有不同的节奏,且可能并不完全匹配。当下的竞争非常激烈,三个月前人们还在说 “我们处于领先地位,没有人能赶上我们”,然后现在的舆论风向就反转了。但这就是处于前沿领域必须面对的常态。 我们是唯一一家真正处于该前沿领域的大型公司。目前有几家初创公司取得了非凡的进展。我们在这方面已经深耕很久了,我认为我们在 Gemini 3.5 Flash上迈出了一大步,它确实解决了一些我们之前落后的领域。将模型推向现实世界,并根据反馈回来的数据进行迭代,对我们非常有帮助。 我认为编程是一个获取数据流访问权限非常重要的领域。我们当时可能还没有足够的覆盖面,例如 Claude Code,或者Anthropic与Cursor类似的合作。所以,推出Anti-gravity 2.0后,我们已经在Google内部使用了一段时间。 我在 Google I/O大会上分享了Token的使用情况。我从未在公司内部见过这样的景象,我们的规模每周都在翻倍,大家正真切地将这些模型投入到实际工作中。这正帮助我们不断攀升,进步非常大。虽然前沿领域非常动态,但我非常乐观,并且有信心我们将会在那里取得突破。 Casey Newton: 听起来,如果说有哪个领域让你觉得还没有完全达到你真正想领先的地位,那就是编程。是这样吗?这就是你施加压力的地方吗? Sundar Pichai: 我认为编程最终会成为我们所做的一切事情的基础,所以这是一个必须坚守的重要前沿阵地。在编程领域,我们一直表现得非常出色,我们非常擅长创建单次生成的 Web前端及相关内容。但就资深开发者在复杂代码库上工作的长期运行任务而言,我们正在取得进展,只是与其他人所处的领先水平之间还存在差距。但我们正在努力,我们对此非常清楚,并且正在这方面取得进展。 Casey Newton: Gemini 3.5 Flash已经发布一天了。我确实认为,通常需要几天时间才能真正对这些模型进行全面的压力测试。不过我们也看到了一些关于定价和模型质量的抱怨。很好奇你对目前为止的市场反响有什么看法。 Sundar Pichai: 我期待着能完成采访,这样我就可以花更多时间与团队在一起。这需要一两天时间来适应。这是一个新模型,且处于我们取得了一些进展的新领域。可能会出现一些性能退化,但我认为我们将能够通过训练后处理( post-training)非常迅速地解决。 我