智能AI
morning
英伟达All in的物理AI路线,居然是中国黑马提前一年就定义好了
2026-06-26
1 阅读
新智元
新智元报道 【新智元导读】 当全球具身智能行业还在争论技术路线时,一家中国公司已经率先定义并跑通了自己的答案。深度机智提出的「人类学习」路线——以人类数据为起点、动作建模为中心、机器人为 AI 而生——正在被英伟达、Physical Intelligence 等海外头部机构沿同一方向跟进。成立仅一年,数据、模型、本体、场景全线落地,核心布局节奏领先美国同类项目近一年。 具身智能行业眼下最大的不确定性,在路线层面。 过去两年,行业在 VLA 端到端、仿真训练、遥操作三条路线上各有押注,每家都在大量投入,但谁也不确定哪条能走到终点。 数据从哪来、模型学什么、机器人怎么造——不同团队给出的答案截然不同。 而路线一旦选错,前期积累的数据、模型和硬件可能全部推倒重来。 在这个赛道,路线选择的权重,可能超过任何单点技术的突破。 2024 年 11 月,深度机智(DeepCybo)创始人陈凯在行业内率先提出了「人类学习」原创技术路线。 这条路线的野心远不止于换一种数据采集方式——它试图以人类认知和行为模式为蓝本,重新组织具身智能的整个技术栈:数据怎么采、模型怎么训、机器人怎么造,三者围绕同一套逻辑协同设计。 短短一年多时间内,英伟达 GR00T 体系、Physical Intelligence π 系列、Generalist AI GEN-1 陆续沿相似方向布局。 全球头部机构正在验证同一个判断——而深度机智是最早做出这个判断、并且最早完成全栈落地的团队。 一条路线:源于人,超越人 理解深度机智,首先要区分两件事:「用人类数据训练机器人」是一种技术手段,「人类学习」是一套完整的技术范式。 前者只解决数据来源问题,后者重新定义了数据、模型和硬件三者之间的关系。 当前具身智能的数据困境,是理解这条路线价值的起点。 训练大语言模型时,互联网上有数万亿 Token 的现成文本可直接使用。 机器人没有这样的数据矿藏——人怎么拿杯子、开抽屉、打鸡蛋,这些动作每天发生无数次,却从未被系统性数字化。 主流的遥操作采集产能极低,一人一机一天不过几小时有效数据; 仿真数据成本低但存在 Sim2Real Gap,到了真实环境性能大幅折损。 深度机智的选择是直接从人类日常操作中采集第一视角数据。 但这只是路线的第一层,更关键的是后面两层: 模型要能从人类视频中提取出物理常识、空间结构和交互规律,再「翻译」成机器人可执行的动作指令——这要求模型具备深层的物理世界理解能力; 而机器人本体也要为此专门设计,比例和自由度贴近人体,以最大化人类数据的迁移效率。 2025 年 10 月,深度机智发布《源于人 超越人》通用具身智能路线图,将这套逻辑概括为 三位一体战略:Human-Centric Data(人类数据为起点)、Action-Centric Modeling(动作建模为中心)、Robot for AI(机器人为 AI 而生) 。 三者协同设计,构成一条完整的技术范式,而非三个独立模块的简单拼接。 全栈落地:数据、模型、本体三线并进 路线图的说服力在于落地速度。 深度机智成立仅一年,已完成数据、模型、本体三条线的全栈技术落地,核心布局节奏领先美国同类项目近一年。 数据基建 数据是物理 AI 迭代的核心燃料。深度机智从硬件、范式、数据集三个维度,搭建了完整的第一视角数据基建体系。 深度机智自研的分体式第一视角感知采集方案,早在去年 6 月就完成定型落地,布局节奏领先美国 Scale AI 同类同质方案近一年。 比数据规模更关键的是数据范式。 首创 ICDC 情境数采范式,在真实场景中记录人与世界交互的时空经验,并通过自动化的数据转化管道,将真实世界中的人类行为转化为可被模型学习的时空经验。 在此基础上,构建了 DeepAct 第一视角多模态数据体系,整体规划早于英伟达 EgoScale 项目。 目前数据规模已达到数十万小时级,并正在向更大规模真实世界数据基础设施推进。 基座模型 深度机智的目标不是训练一个只会执行单一任务的机器人策略,而是构建面向物理世界的具身智能基座模型。 围绕「动作建模为中心」的核心战略,深度机智打造了多维度协同的模型技术矩阵,在七大国际权威评测中全面领跑。 2026 年 3 月,深度机智在中关村论坛全球首发 PhysBrain 1.0 具身通用智能基座体系,围绕物理世界理解、空间关系建模和连续动作生成进行训练。 发布时间比美国 Generalist AI 的 GEN-1 早一周,核心技术框架被 Physical Intelligence 旗下前沿模型 π0.7 公开引用。 模型层面最具说服力的进展是 Zero-shot 泛化验证:机器人在未针对特定物体或任务做过专项训练的情况下,仅凭人类数据预训练获得的能力,在真机上完成了自主操作。 这是国内首次在全自研技术体系下,验证纯人类数据从模型训练到真机执行的完整路径——人类数据不仅能帮机器人「理解世界」,更能直接转化为执行能力。 硬件本体 遵循「机器人为 AI 而生」的设计哲学,深度机智从结构比例、自由度配置到控制逻辑,全部为 AI 模型的数据迁移量身设计。 2025 年 9 月发布的 Prime 是全球首款工业级可自主站立的全自由度拟人体机器人,已实现纯人类数据驱动、零真机微调的技术路径,在世界范围内率先跑通 Robot for AI 的技术闭环。 围绕不同场景需求,公司进一步拓展产品矩阵,公司还推出了面向精细操作的轮式双臂机器人 Prime U,以及面向教育和开发者的 3D 打印轻量化机器人 Prime Lite。 三条线单独看各有别家在做,但三者围绕同一条技术路线做协同设计、并完整跑通从数据到模型到真机的闭环——深度机智是国内最早做到这一点的团队。 深度机智全尺寸拟人体机器人:Prime 进入真实场景 全栈能力的价值在于技术成果能快速转化为场景落地,而非仅仅停留在实验室 Demo。 深度机智目前在两类场景持续推进。 一类是高价值科研场景: 全自由度拟人体机器人已进入真实的生物科学实验室,围绕柔性操作和精密实验流程做验证,面向 AI 自主科学发现方向探索。 合作方包括中国科学技术大学多学科无人实验室、香港首个全栈具身智能实验室,以及海内外多所顶尖高校与科研机构。 另一类是教育与开发者场景: Prime Lite 已进入北京市十一学校和中关村学院等课堂,覆盖从结构设计、3D 打印、本体拼装到模型训练部署的完整教学链路,教育方案还实现了出海,进入澳大利亚等海外市场。 商业化方面,深度机智坚持「克制又灵活」的节奏——核心资源集中在基座模型的长期建设上,研发过程中沉淀的技术成果同步推向市场验证。 截止目前数采设备及方案、教育机器人、人形机器人及其遥操作系统等全产品线均已实现订单落地,累计签约金额达数千万元。 融资方面,深度机智近期再获数亿元融资,由国寿长三角科创基金领投,老股东普华资本、诚通科创基金持续加注,蓝湖资本、博彦科技、磐谷创投、朝晖资本、财鑫资本、道禾长期投资、易高资本、明德资本等多方资本参与。 凭借其前瞻的技术路线与扎实的落地兑现能力,本轮融资受到数十家机构高度关注与参与。 据悉,下一轮融资已进入收尾阶段。 先发一步的意义 具身智能的范式之争远未尘埃落定。