智能AI
morning
谷歌不想再追赶ChatGPT
2026-05-20
1 阅读
强调Next
文 | 强调Next Google I/O 2026最值得关注的是它终于把AI放回了自己的主场。 过去两年,AI行业的节奏被OpenAI改写。ChatGPT重新定义了用户对AI产品的期待,也让谷歌第一次显得被动。一个做搜索起家的公司,被一个聊天框抢走了“第一问”的心智。对谷歌来说,这比模型参数落后更危险。因为搜索的价值,从来不只是答案本身,而是入口、广告、内容分发和商业转化。 今年的I/O,谷歌给出的回应很清楚。它不想再围着ChatGPT打。它要把Gemini 变成搜索、办公、视频、购物、开发者工具和硬件入口背后的默认层。 1 · 搜索被改写 这次I/O最大的看点,仍然是Search。 过去一年,市场一直在问一个问题AI会不会杀死搜索?如果用户直接向 ChatGPT、Perplexity或其他AI产品提问,谷歌搜索的高利润模型是否会被削弱? 谷歌这次没有回避这个问题,而是试图改写它。 根据谷歌披露,AI Overviews月活已经超过25亿,AI Mode月活超过10亿。Gemini App月活也达到9亿,较一年前的4亿以上大幅增长。谷歌还称,Search、Gmail、Android、Chrome和YouTube等五个产品用户规模均超过30亿。 这组数字说明谷歌并没有把AI当成一个独立应用来做,而是在用旧入口承载新交互。 AI Mode的意义,不是搜索结果页多了一个聊天框,而是谷歌正在把搜索从“找网页”变成“完成任务”。用户可以用自然语言提出复杂问题,也可以接入图片、文件、视频和Chrome标签页。搜索框不再只是关键词输入框,而是一个任务起点。 这对谷歌很重要。 搜索真正的护城河,不是网页链接本身,而是用户遇到问题时的默认动作。只要用户的第一问还发生在Google,广告、购物、本地服务、地图和内容分发就仍有重组空间。反过来,如果第一问被ChatGPT抢走,谷歌即使拥有全网最强的信息索引,也会变成后端能力。 所以,AI Mode是防守,也是进攻。它守的是搜索入口,攻的是下一代用户交互习惯。 2 · Gemini从模型变成产品组织方式 这次谷歌反复强调一个词:agentic Gemini era。谷歌不想让Gemini只是回答问题,而是希望它能理解上下文、调动工具、处理任务。 Gemini 3.5 Flash是这套体系里的核心模型。谷歌称它面向更复杂的智能体任务和 coding 场景,并将成为 Gemini App 和搜索 AI Mode 的默认模型。更高阶的 Gemini 3.5 Pro 预计随后推出。 这说明谷歌的模型策略发生了变化。 过去,大模型发布会喜欢比较能力:谁更聪明,谁推理更强,谁上下文更长。但今年I/O的重点不是单点能力,而是模型能否进入真实产品流程。Gemini 3.5 Flash 被放进 Search、Gemini App、Google AI Studio、Android Studio和企业平台,目的是成为谷歌产品里的统一发动机。 这也是谷歌区别于OpenAI的地方。 OpenAI的优势是一个强心智的超级入口。用户知道,想问AI,就打开 ChatGPT。谷歌的优势恰好相反。它不一定需要用户打开一个新 App。Gemini 可以藏在搜索框、邮箱、文档、浏览器、YouTube 和手机系统里。 这个策略不性感,但很符合谷歌的底层能力。它不是从零开始做一个AI原生入口,而是把AI注入已有入口。用户不一定感知到自己在使用Gemini,但只要搜索结果、邮件摘要、文档生成、视频搜索和购物决策都开始由Gemini参与,谷歌就完成了产品层面的迁移。 百度采取的也是类似的策略,放弃和豆包PK AI助手体量,转而把AI助手作为一种能力,融入已有的超级APP中。 3 · Agent 开始进入真实场景 过去两年,Agent是AI行业最容易被滥用的词。很多所谓Agent,本质上只是一个更长的提示词,或者一个能调用插件的聊天助手。谷歌这次的不同之处在于,它拥有足够多的真实场景,可以让Agent不停留在演示里。 Gemini Spark是一个典型例子。根据Reuters报道,谷歌希望它能结合Gmail、Chrome、YouTube等用户数据,帮助完成日程安排、报告起草等任务。 这类功能看似琐碎,却很接近AI商业化的真实路径。用户未必每天都需要一个能写诗的模型,但经常需要有人帮他找邮件、整理资料、生成文档、规划行程、比较商品。AI的价值,不在于它多像人,而在于它能从多少重复劳动里把人解放出来。 Docs Live 也属于这个方向。用户可以用语音把想法说出来,由Gemini整理成文档。Ask YouTube则让用户用自然语言直接询问视频内容,并跳到相关片段。这些功能不是炫技,而是在改造原有产品的使用成本。 更值得注意的是,谷歌的Agent天然有数据和权限优势。Gmail里有邮件,Calendar里有日程,Docs里有文档,Chrome里有浏览记录,YouTube里有内容消费轨迹。只要用户授权,Gemini就可以在这些产品之间形成连接。 这恰恰是独立AI应用最难补齐的部分。模型可以追赶,产品权限很难复制。AI越从问答走向办事,越依赖上下文、账户体系和工具调用。谷歌的反击点,就在这里。 4 · 视频生成和智能眼镜,是另一条入口线索 除了搜索和办公,谷歌这次还推出了Gemini Omni。它的定位是“从任意输入生成任意输出”,第一阶段从视频开始。相关能力会进入Gemini App、Google Flow 和 YouTube Shorts,也会面向开发者和企业客户开放。 这不是一个孤立的AIGC工具。 如果只看模型,Gemini Omni需要面对 OpenAI Sora、Runway、Pika等对手。但如果放在YouTube生态里看,它的意义会更大。谷歌不只是提供生成能力,还拥有全球最大的视频分发平台之一。生成工具和内容分发结合,才是视频AI的真正变量。 对创作者来说,AI视频降低的是生产门槛。对平台来说,它改变的是内容供给密度。未来短视频和中长视频平台的竞争,可能不只是推荐算法和流量分配,也会包括谁能提供更低成本、更高效率的内容生产工具。 智能眼镜则是更长期的伏笔。 谷歌展示了新的智能眼镜与Android XR相关进展,并与Samsung、Warby Parker、Gentle Monster 等伙伴推进产品。The Verge报道称,部分眼镜会主打音频能力,支持实时翻译、Gemini导航辅助和通知摘要等功能。 Google Glass当年失败,并不代表眼镜这个入口没有价值。它失败在时机太早,产品太突兀,场景太稀薄。现在情况变了。大模型让眼镜不再只是一个小屏幕,而可能成为“看见、理解、回应现实世界”的入口。 这条线未必马上成熟,但它解释了谷歌为什么重新回到硬件入口竞争。手机之后,下一代计算入口仍不确定。智能眼镜、耳机、车载系统、AI设备都在争夺位置。谷歌不能只守在网页和App里。 5 · 商业化压力正在逼近 AI发布会容易让人兴奋,但真正决定行业格局的,仍然是商业化。 谷歌在I/O上披露了一个很重的数据:它现在每月处理3.2千万亿tokens。一年前,这个数字约为480万亿;两年前则是9.7万亿。 这说明Gemi