谷歌不想再追赶ChatGPT

文 | 强调Next Google I/O 2026最值得关注的是它终于把AI放回了自己的主场。过去两年，AI行业的节奏被OpenAI改写。ChatGPT重新定义了用户对AI产品的期待，也让谷歌第一次显得被动。一个做搜索起家的公司，被一个聊天框抢走了“第一问”的心智。对谷歌来说，这比模型参数落后更危险。因为搜索的价值，从来不只是答案本身，而是入口、广告、内容分发和商业转化。今年的I/O，谷歌给出的回应很清楚。它不想再围着ChatGPT打。它要把Gemini 变成搜索、办公、视频、购物、开发者工具和硬件入口背后的默认层。 1 · 搜索被改写这次I/O最大的看点，仍然是Search。过去一年，市场一直在问一个问题AI会不会杀死搜索？如果用户直接向 ChatGPT、Perplexity或其他AI产品提问，谷歌搜索的高利润模型是否会被削弱？谷歌这次没有回避这个问题，而是试图改写它。根据谷歌披露，AI Overviews月活已经超过25亿，AI Mode月活超过10亿。Gemini App月活也达到9亿，较一年前的4亿以上大幅增长。谷歌还称，Search、Gmail、Android、Chrome和YouTube等五个产品用户规模均超过30亿。这组数字说明谷歌并没有把AI当成一个独立应用来做，而是在用旧入口承载新交互。 AI Mode的意义，不是搜索结果页多了一个聊天框，而是谷歌正在把搜索从“找网页”变成“完成任务”。用户可以用自然语言提出复杂问题，也可以接入图片、文件、视频和Chrome标签页。搜索框不再只是关键词输入框，而是一个任务起点。这对谷歌很重要。搜索真正的护城河，不是网页链接本身，而是用户遇到问题时的默认动作。只要用户的第一问还发生在Google，广告、购物、本地服务、地图和内容分发就仍有重组空间。反过来，如果第一问被ChatGPT抢走，谷歌即使拥有全网最强的信息索引，也会变成后端能力。所以，AI Mode是防守，也是进攻。它守的是搜索入口，攻的是下一代用户交互习惯。 2 · Gemini从模型变成产品组织方式这次谷歌反复强调一个词：agentic Gemini era。谷歌不想让Gemini只是回答问题，而是希望它能理解上下文、调动工具、处理任务。 Gemini 3.5 Flash是这套体系里的核心模型。谷歌称它面向更复杂的智能体任务和 coding 场景，并将成为 Gemini App 和搜索 AI Mode 的默认模型。更高阶的 Gemini 3.5 Pro 预计随后推出。这说明谷歌的模型策略发生了变化。过去，大模型发布会喜欢比较能力：谁更聪明，谁推理更强，谁上下文更长。但今年I/O的重点不是单点能力，而是模型能否进入真实产品流程。Gemini 3.5 Flash 被放进 Search、Gemini App、Google AI Studio、Android Studio和企业平台，目的是成为谷歌产品里的统一发动机。这也是谷歌区别于OpenAI的地方。 OpenAI的优势是一个强心智的超级入口。用户知道，想问AI，就打开 ChatGPT。谷歌的优势恰好相反。它不一定需要用户打开一个新 App。Gemini 可以藏在搜索框、邮箱、文档、浏览器、YouTube 和手机系统里。这个策略不性感，但很符合谷歌的底层能力。它不是从零开始做一个AI原生入口，而是把AI注入已有入口。用户不一定感知到自己在使用Gemini，但只要搜索结果、邮件摘要、文档生成、视频搜索和购物决策都开始由Gemini参与，谷歌就完成了产品层面的迁移。百度采取的也是类似的策略，放弃和豆包PK AI助手体量，转而把AI助手作为一种能力，融入已有的超级APP中。 3 · Agent 开始进入真实场景过去两年，Agent是AI行业最容易被滥用的词。很多所谓Agent，本质上只是一个更长的提示词，或者一个能调用插件的聊天助手。谷歌这次的不同之处在于，它拥有足够多的真实场景，可以让Agent不停留在演示里。 Gemini Spark是一个典型例子。根据Reuters报道，谷歌希望它能结合Gmail、Chrome、YouTube等用户数据，帮助完成日程安排、报告起草等任务。这类功能看似琐碎，却很接近AI商业化的真实路径。用户未必每天都需要一个能写诗的模型，但经常需要有人帮他找邮件、整理资料、生成文档、规划行程、比较商品。AI的价值，不在于它多像人，而在于它能从多少重复劳动里把人解放出来。 Docs Live 也属于这个方向。用户可以用语音把想法说出来，由Gemini整理成文档。Ask YouTube则让用户用自然语言直接询问视频内容，并跳到相关片段。这些功能不是炫技，而是在改造原有产品的使用成本。更值得注意的是，谷歌的Agent天然有数据和权限优势。Gmail里有邮件，Calendar里有日程，Docs里有文档，Chrome里有浏览记录，YouTube里有内容消费轨迹。只要用户授权，Gemini就可以在这些产品之间形成连接。这恰恰是独立AI应用最难补齐的部分。模型可以追赶，产品权限很难复制。AI越从问答走向办事，越依赖上下文、账户体系和工具调用。谷歌的反击点，就在这里。 4 · 视频生成和智能眼镜，是另一条入口线索除了搜索和办公，谷歌这次还推出了Gemini Omni。它的定位是“从任意输入生成任意输出”，第一阶段从视频开始。相关能力会进入Gemini App、Google Flow 和 YouTube Shorts，也会面向开发者和企业客户开放。这不是一个孤立的AIGC工具。如果只看模型，Gemini Omni需要面对 OpenAI Sora、Runway、Pika等对手。但如果放在YouTube生态里看，它的意义会更大。谷歌不只是提供生成能力，还拥有全球最大的视频分发平台之一。生成工具和内容分发结合，才是视频AI的真正变量。对创作者来说，AI视频降低的是生产门槛。对平台来说，它改变的是内容供给密度。未来短视频和中长视频平台的竞争，可能不只是推荐算法和流量分配，也会包括谁能提供更低成本、更高效率的内容生产工具。智能眼镜则是更长期的伏笔。谷歌展示了新的智能眼镜与Android XR相关进展，并与Samsung、Warby Parker、Gentle Monster 等伙伴推进产品。The Verge报道称，部分眼镜会主打音频能力，支持实时翻译、Gemini导航辅助和通知摘要等功能。 Google Glass当年失败，并不代表眼镜这个入口没有价值。它失败在时机太早，产品太突兀，场景太稀薄。现在情况变了。大模型让眼镜不再只是一个小屏幕，而可能成为“看见、理解、回应现实世界”的入口。这条线未必马上成熟，但它解释了谷歌为什么重新回到硬件入口竞争。手机之后，下一代计算入口仍不确定。智能眼镜、耳机、车载系统、AI设备都在争夺位置。谷歌不能只守在网页和App里。 5 · 商业化压力正在逼近 AI发布会容易让人兴奋，但真正决定行业格局的，仍然是商业化。谷歌在I/O上披露了一个很重的数据：它现在每月处理3.2千万亿tokens。一年前，这个数字约为480万亿；两年前则是9.7万亿。这说明Gemi