智能AI
evening
大模型看Coding,具身看Picking!原力灵机已抢先入局
2026-06-08
1 阅读
衡宇
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 大模型看Coding,具身看Picking!原力灵机已抢先入局 衡宇 2026-06-08 14:30:23 来源: 量子位 轻视它就会错过整个时代 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 当具身智能行业还在密集PoC、卷demo、拼概念时,原力灵机先把答案押向了一个具体动作。 Picking。 这家公司刚刚宣布,通过股权并购方式完成与物流机器人公司Atomix的合并,将模型能力与真实场景合为一体。 与此同时,中国头部大模型公司也用真金白银表达了对这一路线的认可——智谱、阶跃星辰、商汤、阿里共同押注原力灵机新一轮融资,形成了一次罕见的集体押注。 资本不会无缘无故聚集。 当行业还在争论具身智能的第一落地场景该选谁,原力灵机已经用一次合并和一轮顶级资方阵容给出了自己的答案。 原力灵机创始人兼CEO唐文斌 把这个判断概括成一句话: Picking,就是具身智能的Coding。 这不由得让人追问: Picking之于具身智能,真的会像Coding之于大模型吗? 为什么是Picking? 要理解这个判断,需回到Coding成为大模型基石的逻辑原点。 除“技能”属性外,Coding提供了可规模化训练和验证的闭环,使模型能力持续迭代生长。 于是,Coding成为了大模型时代公认的原子任务。 Anthropic正是在这一原子任务上建立了鲜明辨识度,树立行业技术优势,资本市场同时用一路走高的估值对其给出了实打实的认可。 要获得真正通用的智能, 具身机器人同样需要这样一个基础性的原子任务。 从大模型数据成长逻辑反向拆解,这项理想任务需满足四层约束: 高频 ,持续产生数据; 真实 ,补全仿真缺失的物理细节; 可验证 ,成功与失败可被系统记录; 可迁移 ,不局限单一封闭场景。 最后,不要忘了通用!通用啊朋友们! 在唐文斌看来,Picking不仅满足上述标准,更有三点优势。 首先,Picking能产生规模化高质量真实数据。 具身数据极度稀缺,物流仓储是已被验证的理想场景。 它任务边界清晰,SKU极度多样,原生素材源源不断。 全球物流仓库每天产生上亿次真实抓取动作,Picking作为该场景最高频、最核心的动作,自然成为数据汇集的核心入口。 其次,Picking有可验证的成功信号。 机器人把包裹从A点移到B点,成败清晰可判。 即便存在瑕疵,也可细分为抓取失败、掉落、放置偏差、识别错误、路径规划失败等。 反馈信号越清楚,模型越容易改进。 最后,Picking能向其他任务迁移。 表面看,Picking只是从A处挪到B处的简单动作;在具身训练维度,它却是高度浓缩的物理命题。 一次顺利抓取串联起感知预判、运动决策、伺服控制与全链路反馈。抓取的本质——手眼协调、力控与空间理解——覆盖了绝大多数操作任务的底层基础。 只要模型吃透多工况下灵活抓放的逻辑,分拣装箱、居家劳作、精密装配乃至更多开放环境作业,都能沿此衍生拓展。 依托数据、反馈与能力迁移的统一逻辑,Picking之于具身智能,恰恰正如Coding之于大模型。 为什么是物流? 进入2026年,具身智能行业逐渐走出混沌期,竞争焦点顺理成章从“Benchmark”转向“Business”。 “具身智能必须走出demo,在产线上接受ROI验证”成为大家的共识。 Picking这个原子任务的价值由此格外凸显。 它足够具体,可嵌入真实场景,每天产生海量任务,成本收益可计算,失败样本可直接回炉训练——这正是行业最缺的东西。 具身智能则难度更高 ,因为物理数据采集门槛远高于互联网文本。 谁能低成本、大规模获取真实数据并形成闭环,谁就能掌握主动权。 但并非所有场景都适合启动数据飞轮。 家庭环境太开放,任务边界太散,容错率也低;传统工业场景高度结构化,很多任务已经被专机和自动化产线解决,而且泛化能力的锻炼有限。 那Picking到底该从哪里开始? 物流,尤其是消费品仓储和分拣,恰好卡在绝佳平衡点——比家庭场景更可控,又比传统工业场景更长尾——天然成为孕育Picking数据飞轮的沃土。 海量网购订单催生几十万种SKU,包裹形态五花八门,流水线全天候运转,抓取需求高频稳定;更关键的是,劳动力缺口真实存在,客户有痛点、有预算。 这一逻辑 已在全球范围内被验证。 Skild AI、Physical Intelligence、Figure AI等海外玩家早早锚定仓储,依托真实分拣场景快速积累数据,迭代速度远超深耕小众场景的同行。 原力灵机与Atomix的合并,正是在这个逻辑下最具战略纵深的一步棋(不要简单把这件事看成一家模型公司和一家场景公司合并在一起)。 Atomix深耕物流分拣场景多年,拥有成熟的客户网络、真实的仓储部署经验和持续运转的产线。 原力灵机 自研的DM0具身原生大模型 ,突破了单机独立训练的老旧模式,依托多源数据联合训练、跨机型通用预训练技术,能够把散落在各地仓库、不同机型机械臂上的零散抓取数据,凝练为通用性更强的实操能力。 最丰富的Picking矿场,遇上能合并消化海量异构数据的模型底座,场景与技术双向奔赴。 合并之后,场景侧每天产生的海量真实Picking数据,直接灌入模型侧进行迭代;模型变强之后,又能反哺更多仓库、更多机型。 这条从数据到模型、再从模型到场景的闭环,在一个组织体内自然流转,不再需要跨越公司边界去外部合作调度了。 原本处于“合作关系”的两家公司,现在合并为同一家公司后,数据飞轮就成了“内生机制”。 Picking时刻到来,具身数据飞轮迎来支点 再说回Coding。 Coding之所以能成为大模型时代的原子任务,关键原因之一是它让大模型拥有了一个可持续运转的数据飞轮。 代码生成、运行、报错、修改、再运行,每一步都有反馈,每一次失败都能沉淀为下一轮优化素材。 海量真实开发任务不断产生数据,数据反过来推动模型能力提升,模型能力提升后又进入更多开发场景。 唐文斌所说的Picking时刻,对具身智能的意义也是如此。 它不只是让模型进入物流场景,更关键的是, 具身数据第一次有机会从采集型数据,走向场景型数据飞轮。 数据太少、太贵、太难规模化,这些一直以来是具身智能行业长期面临问题。 为了训练具身机器人,企业往往需要专门搭建采集环境,安排人员遥操作,设计任务流程,再把数据清洗成模型可用的格式。 这类数据当然有价值,但它本质上是为了训练而采。 采一次,多一批数据;不采,就没有新增数据,说白了这个模式下数据增长依赖人工组织、设备投入和项目预算,很难自然积累。 Picking则把数据产生嵌进了真实业务现场。 具身机器人在仓库里完成分拣、抓取、搬运,本身就是一次生产任务。只要任务持续发生,数据就会持续产生。 抓取成功、抓取失败、掉落、误识别、放置偏差、路径卡顿、节拍变化,都可以被系统记录下来,成为模型继续优化的素材。 数据不再只是专门设置环节额外采出来的训练材料,而是从真实场景中自然流出来的生产副产物。 这一步很关键。 只有数据生成和真实业务绑定在