人形机器人价格大跳水,比iPhone还便宜:一场关于生产力而非形态的产业竞速

2026-06-17 1 阅读 华卫
作者 | 华卫 最近,人形机器人迎来了从“奢侈品”到“白菜价”的历史性转折。一年前需要花近百万元排队预购的工程样机,如今在二手网站和拆机市场上,以“5万元一车”的价格打包清仓。单价上,甚至有的比高端旗舰手机都便宜了。 宇树G1降至8.5万元起,消费级入门款R1仅售2.99万元,而松延动力的Bumi更是跌至9998元,比一台高配iPhone还便宜。与此同时,中国人形机器人的供应链国产化率已突破90%。根据摩根士丹利最新发布的报告,2025年全球出货的13000至16000台人形机器人中,约有90%来自中国制造商。 如果说现在的AI已经开始充当数字世界的生产力,那么迅猛发展的机器人有望成为物理世界的生产力。在产品价格“一日千里”的狂热局面下,一个问题开始浮出:未来是否只需要人形机器人? Gartner的调研数据给出一个冷静的事实:人形机器人的“现实比例”仅为1:60,约98.36%的受访客户仍处于探索阶段,而实际投入部署的仅占1.64%。“从实用或者理性的角度来说,我们认为未来的机器人未必要和人长得一模一样。”Gartner研究副总裁高挺表示。 近日,我们采访了高挺。他在对话中指出,虽然人类世界是按人的体型设计的,但人体结构并不一定是机器人的最佳形态。成功的机器人应该改良人类形态而非简单复制。例如,亚马逊测试的Digit机器人膝盖向后弯曲,能比人更高效地在货架前下蹲;1X的Eve机器人则使用单腿加平衡轮以提高移动速度。高效的机器人外形可以是犬类、轮式或完全根据任务需求设计的全新形态,这些形态通常比人形更稳定、成本更低且速度更快。 “不要被‘人形’外形限制,应优先寻找能快速交付价值、产生收入的特定垂直应用场景。”除此之外,高挺从技术、硬件、应用场景和现实挑战等多个维度,梳理了今天机器人产业的真实图景。 今天的机器人能做什么? “短期内,应该关注的不是‘机器人是不是长得像人’,而是‘机器人能不能在一个非常明确的场景里面稳定完成任务、降低成本、减少人力依赖和提升运营效率’。” 那么,今天的机器人能够做些什么呢? “从现在已经跑起来的案例看,机器人长什么样其实不是最重要的。不管是仓库里的机械臂,还是汽车工厂里的搬运机器人,真正比较容易落地的场景都有一个特点:环境比较固定。企业最后看的是:这台机器人能不能把活干好,这笔账能不能算得过来,而不是它长得像不像人。” 高挺总结,现阶段更容易形成投资回报的机器人场景,通常具有三个特点:任务边界清晰、流程可以重复、异常情况相对有限。例如,工业线边物流、仓储搬运和部分服务流程,都可以通过现场改造降低机器人需要处理的复杂度。家庭场景则不同:任务组合更加分散,环境变化更加频繁,而且任何失误都可能直接影响人员安全。因此,家庭机器人不仅需要更强的模型能力,也需要更成熟的工程可靠性和安全机制。 大规模产业化的窗口期,机会在哪里? “机器人正处于迈向规模化产业化的窗口期。”对于当前的机器人产业阶段,高挺这样定义。“目前,机器人已经在一些工商业场景里跑通了。尤其是在工厂和仓库里,一些重复频率高的工作,机器人已经可以替代一部分人工。所以资本对这个赛道非常关注,一些头部公司的估值也涨得很快。” 但是真正大规模的产业落地还没有发生。 特斯拉曾提出在 2025 年生产约 5000 台 Optimus 的目标。但在 2025 年第四季度财报发布时,Elon Musk 也承认,Optimus 在工厂里面只做了一些基础的任务,还没有形成真正意义上的生产力。据悉,特斯拉第三代人形机器人预计年中亮相,要到 2026 年 7-8 月才会启动正式投产。 “机器人、尤其是人形机器人,实际落地和大众预期有挺大差距,这也是现状。” 在高挺看来,未来 2-3 年,人形机器人仍难以实现完全大规模商业化。“这些人形机器人可能会继续出现在工厂、仓储、汽车制造等相对固定的环境里,做一些重复性、低复杂性的工作。但更多是试点和小规模部署,而不是全面替代劳动力。相比之下,工业机器人、仓储机器人、服务型机器人以及一些面对特定任务的多功能机器人,这些产品的商业化路径反而更清楚。因为它们的任务边界比较明确,投入产出也更容易算,安全和流程相对容易控制。” 对于想购买机器人的企业,他的建议是:“第一,起点不是‘买一个人形机器人’,而是要从找高价值、低复杂度的任务开始。第二,要把机器人当作一个运营改造项目,而不是单纯的硬件采购。买来本体不能直接落地,还要考虑现场流程、空间布局、IT/OT 集成、员工协作等等。第三,先试点、再扩展,从一两个小封闭场景开始,拿到真实的生产力结果后再复制。第四,先考虑成熟的品类,比如 AMR、机械臂、协作机器人,然后长期追踪人形机器人的成熟度。” “行业内常有人将当前具身智能的发展阶段类比为大模型早期:技术方向已经逐渐清晰,但规模化能力尚未形成。”高挺解释,这个类比有一定道理,但机器人的产业化难度更高。“因为它不仅受到数据和算力约束,还涉及传感器、驱动系统、电源管理和系统可靠性。” “VLA 仍是重要路线,世界模型正在加速融入机器人系统” 机器人能做什么、不能做什么,根本上取决于它的“大脑”,也就是机器人模型。 高挺表示:“VLA 是通用机器人模型目前比较成熟的技术路线。” VLA 即 Vision-Language-Action,指视觉、语言和动作。其中的“Language”部分,就是来自于大语言模型。它让机器人能够结合环境信息和任务指令,生成相应的动作。 “语言模型的作用是为机器人提供语义理解、常识和任务规划能力。例如,当用户说‘房间太暗了’,机器人需要理解这句话背后的任务目标,判断是否应该开灯。” 区别于以前的范式,VLA 模型是先有泛化能力,再一个一个场景去突破可靠性。逻辑正好反过来。“以前是先解决特定场景的高可靠性问题,然后再试图泛化。比如先让一个机器人把某个动作的可靠性做到非常高,然后试图让它学别的任务。但你会发现,这种方式很难真正实现泛化,你只能得到一个非常专业的机器人,换个任务就做不好。” 对于世界模型这类新的技术路线,高挺表示,“它提供了另一种思路:让系统学习物理世界中的状态变化和因果关系,并对动作可能产生的结果进行预测。它不一定依赖语言作为中间层,更强调对物理规律的建模。就像一个熟练的司机在开车时,看到前方有水坑,不需要在大脑里用语言翻译‘这里有水,可能会打滑,我要减速’,而是视觉直接触发了对车辆轨迹的物理预测,本能地踩下刹车。世界模型想解决的,就是这种不需要先翻译成语言、直接作出判断的能力。 不过,他认为,“今天,通用机器人和人形机器人的前沿路线仍然以 VLA 为主。世界模型虽然发展很快,但目前更多用于合成数据生成、仿真、评估和辅助规划,真正直接用于实体机器人控制的案例仍然比较早期。未来一两年,VLA 大概率仍然会是机器人动作模型的主体,但世界模型会逐步融入 VLA 系统,为机器人提供更强的物理理解、规划和预演能力。长期来看,更有可能出现的是 VLA 与世界模型的融合,而不是世界模型简单取代 VLA。” 高挺指出,目前 VLA 是最接近工程化落地的通用机器人技术路线之一。它距离像人一样灵活、通用的智能仍有较大差距,但在仓储、制造等边界相对明确的场景中,已经展现出较好的实用价值。未来一