谷歌CEO最新访谈：谷歌多模态能力领先，但Coding确实落后了

作者｜林易编辑｜重点君谷歌 I/O大会落幕后，谷歌首席执行官Sundar Pichai接受了知名科技播客Hard Fork的专访。对于外界最关注的谷歌大模型能力， Pichai 表示，谷歌模型在整体智能上极具竞争力，但在代理式编程（ agentic coding）和长周期任务方面，依然落后于行业前沿水平。新发布的 Gemini 3.5 Flash模型存在伪影和性能退化问题，团队正在通过后训练进行快速修复。我们梳理了这场访谈的核心信息，以下是重点内容： 1. 谷歌模型的多模态能力处于前沿，但编程与长周期任务能力落后针对外界对谷歌大模型实力的关注， Pichai说，谷歌的模型在文本、多模态输入、语音与音频处理，以及通用推理等整体智能维度上，均处于行业极具竞争力的前沿水平。但在代理式编程（agentic coding）、指令遵循以及长周期任务处理方面，谷歌目前暂时落后。资深开发者在复杂代码库上执行的长期任务，是谷歌当前必须坚守并全力追赶的重要阵地。此外，针对刚发布的 Gemini 3.5 Flash模型出现的性能退化和行为异常问题，Pichai表示这是新领域探索中的常见现象，团队将通过后训练迅速修复，并逐步放宽为防范服务中断而设置的使用限制。 2. 谷歌搜索不会激进切换至全 AI模式，来源和链接将长期存在谷歌不会采取激进的方式将搜索切换到全 AI模式。 Pichai说，引导用户共同经历技术变革，确保产品符合用户预期至关重要。虽然谷歌正在全面推进 AI ，但用户依然需要搜索节点这种快速建立联系的方式，因此来源和链接将始终作为搜索的一部分而存在。在商业模式层面上， Pichai 认为，经济价值始终取决于技术为用户提供的价值总量，而在 AI模式下，智能体将比过去为用户创造更多的总价值。因此，谷歌将持续采用订阅与广告相结合的商业模式，这一商业规律在新技术周期中并不会发生改变。 3. 谷歌智能体产品将采用渐进式推广策略，以赢取用户信任，防范黑客攻击谷歌最新智能体产品 Spark计划于今年夏天发布，Pichai分享了他个人测试体验：Spark能够自主读取会议安排，直接在日历中按类别进行颜色编码，清晰标记出不同的会议类别及工作时间。在谈到智能体的推广策略时， Pichai说，赢得用户信任的关键在于分步推进，向人们提供绝对的掌控感和系统透明度。如果智能体发生了意料之外的行为，用户就会产生退缩心理。此外，从安全角度来看，智能体系统存在被外部黑客攻击的隐患，因此在技术推进过程中必须确保边界安全，避免以错误的方式越界。 4. 谷歌向竞争对手开放 TPU算力，以保持硬件前沿优势为了满足模型迭代的庞大算力需求，谷歌在供应自研模型的同时，依然向竞争对手和外部公司出售 TPU芯片的访问权限。提供技术能让谷歌保持在最前沿，促使团队开发出最好的下一代硬件，并在各个方面获得规模经济优势。如果缺乏庞大的外部云业务支撑，公司无论如何也不会去规划如此高产量的芯片制造。 5. AGI过去一两年的演进速度已超出原有预期底层技术向 AGI迈进是正在发生的必然趋势。虽然 Pichai 并未给出实现 AGI的确切时间表，但他承认，过去一两年的技术演进速度超出了原有的预期，让这一目标的实现节点显得更近。即使完全实现AGI还需要时间，三年后的技术也将比今天强大得多，因此社会公众不能因为认为实现AGI尚需时日就放松准备，整个社会必须提前做好内化与应对的准备。以下是 Sundar Pichai访谈实录： 1. 谷歌在 AI竞赛中的模型能力评估 Kevin Roose： Sundar Pichai，欢迎回到Hard Fork。 Sundar Pichai：感谢邀请，很高兴来到这里。 Kevin Roose：我们上一次请你参加节目是在 2023年。当时Bard刚刚发布，我想当时人们的普遍看法是Google在AI领域正处于追赶状态。你现在如何看待你们在这场竞赛中的地位？ Sundar Pichai：这勾起了我的回忆。感觉那已经是很久以前的事了，这三年感觉过了很久。但我认为，看到这项技术所取得的进展是惊人的。作为一家公司，我们也取得了长足的进步。我认为对于整个行业来说，这是一个充满活力的时刻。我们的模型在某些领域处于前沿水平，在某些领域我们也落后于前沿水平，这是一种并存的状态。如果你观察包括文本、多模态在内的整体能力、语音或音频，以及通用的推理能力，在整体智能方面，我认为我们非常有竞争力。当涉及到结合工具使用的代理式编程（ agentic coding）以及指令遵循、长周期任务时，我认为我们目前稍微落后了一点。但我们正在努力工作。这个领域充满了活力，所有领先的实验室都有各自的预训练周期，所以会有不同的节奏，且可能并不完全匹配。当下的竞争非常激烈，三个月前人们还在说 “我们处于领先地位，没有人能赶上我们”，然后现在的舆论风向就反转了。但这就是处于前沿领域必须面对的常态。我们是唯一一家真正处于该前沿领域的大型公司。目前有几家初创公司取得了非凡的进展。我们在这方面已经深耕很久了，我认为我们在 Gemini 3.5 Flash上迈出了一大步，它确实解决了一些我们之前落后的领域。将模型推向现实世界，并根据反馈回来的数据进行迭代，对我们非常有帮助。我认为编程是一个获取数据流访问权限非常重要的领域。我们当时可能还没有足够的覆盖面，例如 Claude Code，或者Anthropic与Cursor类似的合作。所以，推出Anti-gravity 2.0后，我们已经在Google内部使用了一段时间。我在 Google I/O大会上分享了Token的使用情况。我从未在公司内部见过这样的景象，我们的规模每周都在翻倍，大家正真切地将这些模型投入到实际工作中。这正帮助我们不断攀升，进步非常大。虽然前沿领域非常动态，但我非常乐观，并且有信心我们将会在那里取得突破。 Casey Newton：听起来，如果说有哪个领域让你觉得还没有完全达到你真正想领先的地位，那就是编程。是这样吗？这就是你施加压力的地方吗？ Sundar Pichai：我认为编程最终会成为我们所做的一切事情的基础，所以这是一个必须坚守的重要前沿阵地。在编程领域，我们一直表现得非常出色，我们非常擅长创建单次生成的 Web前端及相关内容。但就资深开发者在复杂代码库上工作的长期运行任务而言，我们正在取得进展，只是与其他人所处的领先水平之间还存在差距。但我们正在努力，我们对此非常清楚，并且正在这方面取得进展。 Casey Newton： Gemini 3.5 Flash已经发布一天了。我确实认为，通常需要几天时间才能真正对这些模型进行全面的压力测试。不过我们也看到了一些关于定价和模型质量的抱怨。很好奇你对目前为止的市场反响有什么看法。 Sundar Pichai：我期待着能完成采访，这样我就可以花更多时间与团队在一起。这需要一两天时间来适应。这是一个新模型，且处于我们取得了一些进展的新领域。可能会出现一些性能退化，但我认为我们将能够通过训练后处理（ post-training）非常迅速地解决。我

订阅66必读