智能AI
morning
今夜,库克终极绝唱!Siri在25亿苹果设备中重生
2026-06-09
1 阅读
新智元
新智元报道 【新智元导读】 库克卸任前的谢幕之作来了!今晚的WWDC上,我们见证了重生的Siri,谷歌大模型让AI融入了苹果的全线生态。全球25亿台苹果设备,将被Siri「复活」。 就在刚刚,Siri借谷歌的1.2万亿参数Gemini「重生」了! 在今夜的苹果WWDC 2026上,Siri彻底迎来新生。 结合设备端小模型,苹果打造了混合智能架构,让Siri在各个APP之间无缝穿梭。 从此,全球25亿台苹果设备,将被注入真正的上下文理解能力。 而且,这也是库克最后一次对我们说「早安」。 据说,在退役前库克深度介入,疯狂打磨Siri的各种细节。 今天,库克交卷了。 令人惊喜的是, 苹果把Siri AI部署到了整个生态中,根据每个平台进行了定制。 iPhone、Mac、iPad、Apple Watch和Vision Pro中,都可以使用Siri AI了。 这一次,苹果凭借卖向全球的25亿设备,凭借自己对消费者意图的了解,走出了一条世界上绝无仅有的路。 可以说,从今天开始,苹果终于成为一家真正的AI公司! 今夜,苹果AI史诗级重构 此前,苹果就被曝出干了一件震动硅谷的大事——秘密联手宿敌谷歌,直接引入了Gemini和强大的云端算力支撑。 彻底重构后的Siri,究竟是什么样? 今天的WWDC上,它的神秘面纱彻底被揭开。 苹果AI全新架构,联手谷歌 首先,苹果为Apple Intelligence打造了全新架构。 它的核心是苹果基础模型,由端侧模型、私有云计算、系统调度器等共同组成。 这次,苹果跟谷歌展开深度合作,充分利用Gemini模型背后的技术,打造了全新一代的Apple Intelligence基础模型。 针对高频、低延迟、日常隐私敏感的任务,端侧模型能够直接在设备上直接运行,快速给出响应。 而针对复杂的推理和大规模任务,系统则会转向私有云计算,确保算力充足。 并且,为了充分发挥苹果芯片的潜能,苹果还在端侧设备上更进一步,设计了两种端侧模型。 标准端侧模型:满足绝大多数日常基础智能任务。 高级端侧模型(第二代高效端侧模型):专为配备高性能苹果芯片的系统而优化。 其中,高级端侧模型不仅能够高效理解文本与图像,语音理解和生成也很强大。 它实现了极高准确度的系统解听写 ,更强的自然语言理解能力,甚至人声也能传递更细腻的情感。 此外,新架构中还引入了系统调度器,成为整个系统的指挥官。它的工作流,有以下三个核心。 Spotlight语义索引:全新的语义索引,能真正理解内容背后的含义。多年前的照片,前几天随手的笔记,都能通过语义关联快速检索。 应用动作箱:调度器可以「工具箱」中抽取合适工具,来完成复杂的请求,比如读取特定邮件、编辑一组照片,用户无需在不同应用之间手动切换。 屏幕感知:实时感知当前屏幕上正在显示什么、用户在做什么,在恰当的时刻提供帮助。 Siri AI诞生! 重建语音助理,智商飞跃 今天,Siri AI上线了! 基于强大的 Apple Intelligence 底层,苹果把Siri AI全新升级了。 这一次,Siri AI彻底摆脱了「人工智障」的称号,它能理解情境,深层交互,还能自主行动,真正成为了你的AI助理! 而且,它还能跨平台应用。 场景一:查询音乐会并自动创建提醒 以前,要去听某个歌手的演唱会,我们要分别打开浏览器搜索日程、打开买票应用、手动记下日程。 现在,你可以直接和Siri AI对话,它会用世界知识来回答。 比如,旧金山那场Suki Waterhouse的演出是什么时候?怎么买票? 你可以命令它:抢票开始时提醒我报名。甚至,只要你下指令,它还能播放这位歌手的新单曲。 整个过程中,Siri AI的对话极度自然,毫不割裂。 场景二:屏幕感知与信息检索 接下来,是Siri对屏幕内容的感知。 比如,你想问一位朋友的新地址。你可以给Siri相册中的海岸照片,问它这是哪里? Siri展现出强大的能力,识别出了照片的地标!「这里是美丽的圣克鲁斯海岸,具体位置是 Natural Bridges State Beach。」 你告诉它,我朋友最近搬到这附近了,Jeff的新家在哪儿? 要知道,Jeff只发了一条信息,但Siri在后台通过语义抖音,快速找到了这条信息,找到了地址。 接下来你可以命令Siri,「帮我导航到海岸边的这个拱门地标,中途在Jeff家停一下。」它调用了地图,一键生成了路线。 多个复杂的跨应用操作,Siri一气呵成。 场景三:零手操照片分类 假设你刚从度假地回来,相册里积累了上百张照片,想要找出特定的照片分享给家人,直接找Siri就可以了。 「帮我找出上周末在沙斯塔山拍的照片」,Siri会瞬时检索相册,展示出符合时间与地理位置的大量图片。 再下命令,「只把里面有 Bryce、Madison 和 Quinn 的照片挑选出来,加到我们共享的家庭相册里」。 这时,Siri会自动人脸识别,找到照片,直接后台推送到共享相册。这个过程中,完全不用打开相册。 Siri的听觉体验,华丽蜕变 而且,这次Siri AI的升级不仅在大脑上,也在声音和耳朵上。 因为端侧语言和语音模型的融合,新版Siri的发音情绪起伏极为丰富,非常像真人。 你还可以微调它的发音风格、语调、语速,独家定制自己喜欢的声音。 它的听写能力也大幅提升,无论是在嘈杂地铁上给朋友发短信,还是用日记长篇口述,它都能实现高精度的拼写、标点符号及大小写判定,几乎不用二次修改。 多轮对话,情境整合 iOS端的Siri AI,具备极强的多轮对话和情境整合能力。 比如可以问它:世界杯开幕的赛程是什么样的?它会给出赛程列表。 用户看到巴西对摩洛哥的比赛,决定举办一次观赛派对,让Siri介绍两国的特色菜肴。 Siri结合世界知识,给出了经典菜品,还附带了食物照片。 用户问:我女儿想贡献个倡议,她最近提到的甜点是什么? Siri在后台搜索了手机短信和聊天记录,找到了答案——椰子饼干。 最终,Siri把这些元素整合到一起,自动整理好一切信息,拟好派对邀请,用户只要点击发送,就能通知到所有好友了。 MacOS里的Siri生产力大提升 在 Mac 平台上,通过将 Siri AI 内置在 Spotlight 搜索中,让我们的日常效率大大提升。 现在,我们想为学校或社区建立一个创客空间。 首先,可以在Spotlight 中直接输入:「如何在棚屋里建造创客空间」? 搜索框会自动识别,转为 Siri 交互,在侧边对话框给出方案。 我们有三份不同厂商的报价单,可以直接让Siri来对比。它立刻生成对比表格,清晰列出各方面优劣。 儿子提过学校原先的方案有电路故障,问Siri:「Luke 提到过一个电学问题,哪一个能解决?」(就算拼错单词,它都能自动容错)。 Siri AI 随即在后台搜索邮件和短信,找到儿子发过的故障描述,给出明确的选购建议。 最后,它给厂商写好了邮件,自动抓取了厂商联系人名字和具体选购理由。 而且,Siri在整个产品中都是通用的。 你可以把它在iPhone上打开,在iPad上继续中断的工作,在Mac上还继续可用。 更是神奇的是,在Vision Pro上,你不需要说嘿siri,只要看着Siri,就可以开始说话。 视觉智能,看你所看 多模态的终极奥义,是让A