全家桶在手的谷歌和字节,为什么编程仍然是软肋?

2026-05-26 1 阅读 字母AI
文 | 字母AI 在《纽约时报》旗下播客的采访中,谷歌CEO桑达尔·皮查伊承认,谷歌在Coding上确实落后了。 谷歌做AI完全算得上强势,它有Gemini,有非常庞大的谷歌生态,还有自研TPU。在最近的I/O大会上,谷歌几乎把AI塞进了所有核心入口。 它不是没做AI Coding,Antigravity已经被推到台前,Gemini CLI和Gemini Code Assist也一直在服务开发者。但做了,不等于做成了;生态全面,不代表自动拿下市场。 提到AI Coding,最先被想起的往往还是Claude Code、Codex和Cursor。 Coding已经成为AI Agent最早跑通的战场,几乎所有前沿AI公司都在往这个方向进军。就连并不靠编程出圈的DeepSeek,也开始围绕Agent Harness招人。 可以说,AI Coding未必是每家AI公司的起点,却正在成为前沿AI公司的共同落点。 在国内,字节的尴尬和谷歌很相似。它们都拥有完整的AI生态,但到了AI Coding领域,Trae和Antigravity一样,只是众多可替换的开发工具中的一个名字。 如果它们想在Agent时代继续做巨头全家桶,这块短板还是要抓紧补全。 没拿下程序员 谷歌在AI Coding上的问题,不是缺产品,是缺用户。 Codex有超过400万周活跃用户,Claude Code则取得了开发者心智的胜利。The Pragmatic Engineer今年2月面向软件工程师的AI工具调查显示,Claude Code是最受喜爱的工具,占比46%。Business Insider 5月23日报道,在创业公司内部,Claude Code已成为复杂工程任务里的首选工具。 相比之下,Antigravity没有什么值得拿来说道的地方,仅仅是一个背靠谷歌生态大厦的AI Coding产品。 就体感方面,Antigravity也没能获得开发者的信任。 5个月前,有人专门整理了100多条Antigravity相关帖子,把Reddit社群里最常见的痛点归成几类:额度混乱、性能吃资源、安全担忧、模型选择问题,以及Agent删除或改坏代码。 这些痛点本应在更新后得到解决,Antigravity 2.0的发布按理是谷歌追赶AI Coding的一个重要节点。但更新之后,社群反响也并不算好。 目前最大的争议是,Antigravity 2.0把原本偏IDE的体验,突然改成了一个更偏Agent Manager的界面。用户找不到熟悉的编辑器、文件树、终端、版本控制和扩展环境,不得不被迫适应新的界面。 或许谷歌觉得这样做是在往更智能的方向进步,但事实是,谷歌在没有充分建立信任之前,就试图让开发者从“可控的IDE协作”跳到“黑盒式Agent调度”,约等于完全放弃了之前的那套模式,连带着放弃了原先的那群用户。 额度混乱的问题依然存在,并且变本加厉。 从5月20号开始,Gemini的限额机制从按条数,转向更接近算力消耗的口径。 Antigravity官方说Pro用户有5小时刷新机制,但同时又有周限制;用户不知道一次Agent任务会消耗多少,也不知道自己什么时候会撞上周上限。一旦中途限额,就可能直接打断开发流程。 更要命的是,谷歌最新发布的Gemini 3.5 Flash虽然速度很快,但在编程上表现不够稳定。 有用户吐槽,自己只是让Gemini 3.5 Flash给一个重构计划,它却直接开始改代码,之后还声称重构成功,但核心目标基本没完成,最后甚至在没有许可的情况下恢复了一个无关文件。 还有用户抱怨,3.5 Flash在明确给出目标文件、行号和修改要求后,仍然会反复探索同一批文件,而不是直接完成代码改动。而token在这个过程中不要钱似地烧。 一边是产品形态突然从IDE协作转向Agent Manager,用户觉得原来的工作台被拆掉了;一边是额度规则不透明,长任务可能跑到一半被中断;再加上Gemini 3.5 Flash在真实代码库里的执行稳定性仍然被质疑,Antigravity并没做到向开发者证明,自己值得相信。 谷歌已经开始补课 但谷歌也不是没有意识到问题。 在最新的采访里,谷歌CEO皮查伊其实把谷歌的短板说得很清楚:如果看文本、多模态、语音、音频、推理和整体智能,谷歌仍然很有竞争力;但到了AI Coding、工具使用、指令遵循和长周期任务,谷歌确实有点落后。 皮查伊专门提到, 谷歌过去在Coding上可能缺少类似Claude Code或Cursor那样的数据流和产品。 这也是谷歌现在追赶动作的逻辑。 过去很长一段时间,谷歌面向开发者的AI工具比较分散:Gemini Code Assist、Gemini CLI、Antigravity、Firebase相关工具,各自都在,但很难形成一个清晰的主入口。I/O大会之后,谷歌开始把这条线往Antigravity上收,Gemini CLI和Gemini Code Assist面向个人用户的相关能力,将逐步转向Antigravity CLI和Antigravity 2.0。 谷歌需要一个统一入口,把Gemini真正放进复杂软件工程流程里,拿到足够多的真实任务、失败案例、工具调用和长任务数据。 但同样是进入真实工作流,Claude Code的做法是让Agent贴着开发者原来的终端和代码库工作,Cursor的做法是把AI塞进IDE,让人随时能看、能改、能接管。Antigravity 2.0的产品形态却难免有些过于激进,直接把开发者往上推了一层,推到一个Agent Manager里去看任务进度、等结果交付。 这不是不能做,甚至可能是未来方向之一。可前提是,用户已经足够信任这个Agent,而Antigravity还没有建立起这种信任,就先把熟悉的IDE协作体验削弱了。 只能说不破不立,可能还需要一段时间来过渡。 除了把产品入口往Antigravity上收,谷歌也在补它背后的Agent底座。官方已经开放Antigravity SDK预览版,开发者可以基于这套框架搭自己的Agent。 这背后多少能看到Claude Code的“他山之石”。 Claude Code做得好的地方不只是Claude模型本身,还有Anthropic把模型放进了一套成熟的Agent Harness里。很多开发者喜欢Claude Code,在于它足够贴近真实开发现场,终端、代码库、Git、测试、报错都在眼前。谷歌显然也在吸收这套经验。 组织层面,据The Information报道,Google DeepMind已经组建了一支针对AI Coding模型能力的专责行动小组,由研究员和工程师集中改善Gemini的代码能力。这支团队由Google DeepMind研究工程师Sebastian Borgeaud牵头,DeepMind CTO Koray Kavukcuoglu 和Google联合创始人Sergey Brin据称也参与其中。 这些动作证明谷歌已经开始补课,但还不能证明它可以追上。 谷歌历史上并不缺“集中力量补短板”的时刻。社交网络时代,它曾经用Google+追赶Facebook;移动通讯时代,它也试过用Allo追赶WhatsApp、iMessage和M