智能AI morning

物理AI火了,我的一些新思考

2026-05-18 1 阅读 新眸
文 | 新眸,作者 | 鹿尧 最近有个词在圈子里传得很热,叫“物理AI”。 这个词其实在去年初的拉斯维加斯CES展会上,就被黄仁勋演讲时反复念叨了十多遍,但直到今年,“Physical AI”才迎来了真正意义上的爆发。 那么,“物理AI”究竟是什么? 前两天我看到一段机器人浇花的视频,机器人先走到水龙头前,拧开阀门,把水壶灌满,然后转身走到花盆边,调整角度,把水均匀地浇进去,壶嘴没有撞到花盆边缘,水也没有洒出来。 让一台机器理解“端一杯水”,它得知道杯子是圆柱形的,得算出该用多大的力捏住才不会滑也不会碎,得明白水是液体、晃动会洒出来,得在行走过程中实时调整手臂角度来抵消身体的起伏。 这些东西,人类三岁小孩凭直觉就能做到。但对AI来说,这是一个巨大的跨越。过去十年,AI学会了看、学会了听、学会了说话、学会了画图,但它始终困在屏幕里。物理AI要做的事情,就是把这个聪明的大脑,装进一个能在真实世界里跑、跳、抓、放的躯体里。 说白了,物理AI就是让AI理解并作用于物理世界。它不再只是处理文字和图片,而是要在重力、摩擦力、惯性都起作用的环境里,做出正确的动作。 一个很少被国内讨论的事实是,“Physical AI”这个提法并非出自某个芯片巨头的公关部门。这个概念最早见于2020年的一篇论文,发表在《Nature Machine Intelligence》上。文中第一次系统定义了Physical AI: 一类能够执行通常与智能生物体相关联任务的实体系统,核心在于把物理规律深度整合进人工智能系统,让机器不再是“物理盲”,能够完成从感知到行动的闭环。 从2020年学术圈的一声枪响,到2026年产业界全面接棒,中间隔了整整六年。这六年里,传感器成本降低了几个量级,端侧AI算力从理论走向工程化,机器人本体的可靠性和量产能力也悄悄走到了临界点——这些才是物理AI从论文走向产线的隐性推力。 从演示到干活 如果说2023年的大语言模型让AI学会了聊天,那2026年物理AI的关键词只有一个:干活。 事情的变化是肉眼可见的。 去年这个时候,机器人公司出来秀肌肉的方式还是拍Demo视频,设定好场景,反复排练,一镜到底。好看是好看,但你不知道它拍了多少遍。 而今年,玩法完全不同了。今年智元机器人在南昌的一条3C产线上做了一件事:把机器人扔进真实工厂,连续干了几个小时的活,全程直播。没有预设剧本,没有限定场景,就是工人日常面对的那条产线。几十万人次在线围观。 一个月后,智元在香港宣布人形机器人实现万台量产。从实验室里的一台原型机,到工厂产线上的一万台,这个坎翻过去,性质就变了。 智元的路线很有意思,大多数机器人创业公司聚焦在某个环节上,做本体的只管本体,做大模型的只管大模型,做灵巧手的只管手。智元选了另一条路:全栈都做,同时布局本体制造、AI模型、灵巧操作和数据采集四个方向,还投资了60多家产业链上下游公司。 这么做的代价也很直观,母公司员工一千多人,到今年底预计进一步突破人,光薪资一年就是十几到二十个亿。这条路烧钱,但一旦跑通,壁垒也最深。 智元创始人邓泰华提过一个叫“XYZ曲线”的分析框架。他说具身智能的发展分三个阶段:X是开发尝鲜期,大家还在玩Demo;Y是部署成长期,机器人开始真正进产线干活;Z是终局的智能涌现期。 他给2026年的定性是:“部署态元年,正式从‘能动’走向‘会干’”。“能动”和“能干”,差一个字,但差的是整个产业的成年礼。 海外也在冲刺,太平洋对岸的节奏一点不慢。 美国人形机器人公司Figure AI是这条赛道上一个绕不开的名字。去年9月,他们完成了一轮超过10亿美元的融资,估值干到了390亿美元,在那会儿是全球估值最高的人形机器人公司。 一个月后发布了新一代产品Figure 03,1米68的身高,差不多60公斤重,演示了浇花、端菜、叠衣服这些家务活。创始人Brett Adcock特意在社交媒体上补了一句:所有动作都是机器人自主完成的,没有人在背后遥控。 技术上值得留意的是,Figure做了一次重大的路线调整,终止了和OpenAI的合作,全面转向自研的神经网络系统Helix。 这套系统模仿人类认知做成了三层结构,最底层管平衡和本能反应,中间层把大脑指令翻译成每秒200次的电机控制,最高层是逻辑大脑,负责理解场景和做决策。这个“本能-反射-思考”的三层架构,思路挺巧妙的,相当于给机器人装了一个不会宕机的神经系统。 还有件事值得一提。今年英伟达在GTC大会上宣布了一个动作:和全球四大工业机器人巨头,ABB、库卡、安川、发那科,达成了深度合作。全球已经安装在产线上的超过200万台工业机器人,以后可以通过英伟达的仿真平台做虚拟调试和AI训练。 这四家公司加一块占了全球工业机器人市场超过一半的份额。接下来十年,这些机器人都会面临一轮从“传统编程”到“AI驱动”的升级换代。未来哪个软件平台能嵌进这个进程,就相当于拿到了下一代工业自动化的“操作系统”层。英伟达显然不想错过这张船票。 供应链的跨界抢跑 还有一个有意思的现象:汽车供应链企业正在成规模地涌进物理AI赛道。 今年北京车展上,安波福、法雷奥、地平线、千寻位置这些老牌汽车供应商,扎堆展示了机器人相关方案。当时不少业内人士都认识到,具身智能感知和汽车智驾的感知是一样的,汽车的解决方案可以直接用到人形机器人上。 仔细一想确实如此。汽车智能驾驶系统本质上就是一个“移动机器人”的感知-决策-执行闭环,其中的视觉感知、路径规划、实时控制三大模块,与传统工业机器人和人形机器人在技术架构上高度同源。 汽车供应商手中的摄像头、雷达、线控底盘和实时操作系统,稍加适配就能迁移到机器人领域。从这个意义上说,汽车产业过去十年在智能化上烧的上千亿研发费用,正在以“技术溢出”的方式流进物理AI赛道。 这或许能解释为什么中国的机器人公司能这么快冲进量产阶段。制造能力和供应链管理不是凭空长出来的,很多是现成的。那些已经在汽车产线上磨合了十几年的零部件供应商,现在换了个新战场。 国外有现成的案例,就拿特斯拉来说,它的第一代人形机器人Optimus也在加速入场。此前特斯拉在2026年第一季度财报电话会议上明确宣布,公司将向“以AI、自动驾驶出租车和人形机器人为核心的未来转型”,第一代机器人生产线将下线100万台产能,并取代现有Model S和Model X的生产线。 100万台的数字放到今天的语境里可能显得夸张,但特斯拉的逻辑是清楚的:它要把汽车制造领域积累的大规模生产能力和供应链管理经验,直接复制到人形机器人领域。 马斯克要的不是一台“能动的机器人”,而是一台能在工厂里和人类协同作业的“量产工具”。这条路一旦走通,它对制造业自动化格局的冲击将不亚于Model 3对燃油车市场的冲击。 世界模型 为什么今年突然能用起来了 讲完了产业层面的大厂动作,不妨把镜头往深拉一层,这场物理AI竞赛的技术底座是什么? 如果用一句话概括,那就是:世界模型的工程化突破。我觉得这也是理解这波浪潮最关键的一点。 “世界模型”这个概念不新了,2018年就有人提出来,核心想法很简单:让AI学会一套对物理世界运转规律的内部理解,这样它就能预测“如果我推这个杯子一下,会发生什么”。但以前这东西基本只活在论文里——太吃算力,生