大模型看Coding，具身看Picking！原力灵机已抢先入局

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400"> 大模型看Coding，具身看Picking！原力灵机已抢先入局衡宇 2026-06-08 14:30:23 来源：量子位轻视它就会错过整个时代衡宇发自凹非寺量子位 | 公众号 QbitAI 当具身智能行业还在密集PoC、卷demo、拼概念时，原力灵机先把答案押向了一个具体动作。 Picking。这家公司刚刚宣布，通过股权并购方式完成与物流机器人公司Atomix的合并，将模型能力与真实场景合为一体。与此同时，中国头部大模型公司也用真金白银表达了对这一路线的认可——智谱、阶跃星辰、商汤、阿里共同押注原力灵机新一轮融资，形成了一次罕见的集体押注。资本不会无缘无故聚集。当行业还在争论具身智能的第一落地场景该选谁，原力灵机已经用一次合并和一轮顶级资方阵容给出了自己的答案。原力灵机创始人兼CEO唐文斌把这个判断概括成一句话： Picking，就是具身智能的Coding。这不由得让人追问： Picking之于具身智能，真的会像Coding之于大模型吗？为什么是Picking？要理解这个判断，需回到Coding成为大模型基石的逻辑原点。除“技能”属性外，Coding提供了可规模化训练和验证的闭环，使模型能力持续迭代生长。于是，Coding成为了大模型时代公认的原子任务。 Anthropic正是在这一原子任务上建立了鲜明辨识度，树立行业技术优势，资本市场同时用一路走高的估值对其给出了实打实的认可。要获得真正通用的智能，具身机器人同样需要这样一个基础性的原子任务。从大模型数据成长逻辑反向拆解，这项理想任务需满足四层约束：高频，持续产生数据；真实，补全仿真缺失的物理细节；可验证，成功与失败可被系统记录；可迁移，不局限单一封闭场景。最后，不要忘了通用！通用啊朋友们！在唐文斌看来，Picking不仅满足上述标准，更有三点优势。首先，Picking能产生规模化高质量真实数据。具身数据极度稀缺，物流仓储是已被验证的理想场景。它任务边界清晰，SKU极度多样，原生素材源源不断。全球物流仓库每天产生上亿次真实抓取动作，Picking作为该场景最高频、最核心的动作，自然成为数据汇集的核心入口。其次，Picking有可验证的成功信号。机器人把包裹从A点移到B点，成败清晰可判。即便存在瑕疵，也可细分为抓取失败、掉落、放置偏差、识别错误、路径规划失败等。反馈信号越清楚，模型越容易改进。最后，Picking能向其他任务迁移。表面看，Picking只是从A处挪到B处的简单动作；在具身训练维度，它却是高度浓缩的物理命题。一次顺利抓取串联起感知预判、运动决策、伺服控制与全链路反馈。抓取的本质——手眼协调、力控与空间理解——覆盖了绝大多数操作任务的底层基础。只要模型吃透多工况下灵活抓放的逻辑，分拣装箱、居家劳作、精密装配乃至更多开放环境作业，都能沿此衍生拓展。依托数据、反馈与能力迁移的统一逻辑，Picking之于具身智能，恰恰正如Coding之于大模型。为什么是物流？进入2026年，具身智能行业逐渐走出混沌期，竞争焦点顺理成章从“Benchmark”转向“Business”。 “具身智能必须走出demo，在产线上接受ROI验证”成为大家的共识。 Picking这个原子任务的价值由此格外凸显。它足够具体，可嵌入真实场景，每天产生海量任务，成本收益可计算，失败样本可直接回炉训练——这正是行业最缺的东西。具身智能则难度更高，因为物理数据采集门槛远高于互联网文本。谁能低成本、大规模获取真实数据并形成闭环，谁就能掌握主动权。但并非所有场景都适合启动数据飞轮。家庭环境太开放，任务边界太散，容错率也低；传统工业场景高度结构化，很多任务已经被专机和自动化产线解决，而且泛化能力的锻炼有限。那Picking到底该从哪里开始？物流，尤其是消费品仓储和分拣，恰好卡在绝佳平衡点——比家庭场景更可控，又比传统工业场景更长尾——天然成为孕育Picking数据飞轮的沃土。海量网购订单催生几十万种SKU，包裹形态五花八门，流水线全天候运转，抓取需求高频稳定；更关键的是，劳动力缺口真实存在，客户有痛点、有预算。这一逻辑已在全球范围内被验证。 Skild AI、Physical Intelligence、Figure AI等海外玩家早早锚定仓储，依托真实分拣场景快速积累数据，迭代速度远超深耕小众场景的同行。原力灵机与Atomix的合并，正是在这个逻辑下最具战略纵深的一步棋（不要简单把这件事看成一家模型公司和一家场景公司合并在一起）。 Atomix深耕物流分拣场景多年，拥有成熟的客户网络、真实的仓储部署经验和持续运转的产线。原力灵机自研的DM0具身原生大模型，突破了单机独立训练的老旧模式，依托多源数据联合训练、跨机型通用预训练技术，能够把散落在各地仓库、不同机型机械臂上的零散抓取数据，凝练为通用性更强的实操能力。最丰富的Picking矿场，遇上能合并消化海量异构数据的模型底座，场景与技术双向奔赴。合并之后，场景侧每天产生的海量真实Picking数据，直接灌入模型侧进行迭代；模型变强之后，又能反哺更多仓库、更多机型。这条从数据到模型、再从模型到场景的闭环，在一个组织体内自然流转，不再需要跨越公司边界去外部合作调度了。原本处于“合作关系”的两家公司，现在合并为同一家公司后，数据飞轮就成了“内生机制”。 Picking时刻到来，具身数据飞轮迎来支点再说回Coding。 Coding之所以能成为大模型时代的原子任务，关键原因之一是它让大模型拥有了一个可持续运转的数据飞轮。代码生成、运行、报错、修改、再运行，每一步都有反馈，每一次失败都能沉淀为下一轮优化素材。海量真实开发任务不断产生数据，数据反过来推动模型能力提升，模型能力提升后又进入更多开发场景。唐文斌所说的Picking时刻，对具身智能的意义也是如此。它不只是让模型进入物流场景，更关键的是，具身数据第一次有机会从采集型数据，走向场景型数据飞轮。数据太少、太贵、太难规模化，这些一直以来是具身智能行业长期面临问题。为了训练具身机器人，企业往往需要专门搭建采集环境，安排人员遥操作，设计任务流程，再把数据清洗成模型可用的格式。这类数据当然有价值，但它本质上是为了训练而采。采一次，多一批数据；不采，就没有新增数据，说白了这个模式下数据增长依赖人工组织、设备投入和项目预算，很难自然积累。 Picking则把数据产生嵌进了真实业务现场。具身机器人在仓库里完成分拣、抓取、搬运，本身就是一次生产任务。只要任务持续发生，数据就会持续产生。抓取成功、抓取失败、掉落、误识别、放置偏差、路径卡顿、节拍变化，都可以被系统记录下来，成为模型继续优化的素材。数据不再只是专门设置环节额外采出来的训练材料，而是从真实场景中自然流出来的生产副产物。这一步很关键。只有数据生成和真实业务绑定在

订阅66必读