人形机器人价格大跳水，比iPhone还便宜：一场关于生产力而非形态的产业竞速

作者 | 华卫最近，人形机器人迎来了从“奢侈品”到“白菜价”的历史性转折。一年前需要花近百万元排队预购的工程样机，如今在二手网站和拆机市场上，以“5万元一车”的价格打包清仓。单价上，甚至有的比高端旗舰手机都便宜了。宇树G1降至8.5万元起，消费级入门款R1仅售2.99万元，而松延动力的Bumi更是跌至9998元，比一台高配iPhone还便宜。与此同时，中国人形机器人的供应链国产化率已突破90%。根据摩根士丹利最新发布的报告，2025年全球出货的13000至16000台人形机器人中，约有90%来自中国制造商。如果说现在的AI已经开始充当数字世界的生产力，那么迅猛发展的机器人有望成为物理世界的生产力。在产品价格“一日千里”的狂热局面下，一个问题开始浮出：未来是否只需要人形机器人？ Gartner的调研数据给出一个冷静的事实：人形机器人的“现实比例”仅为1:60，约98.36%的受访客户仍处于探索阶段，而实际投入部署的仅占1.64%。“从实用或者理性的角度来说，我们认为未来的机器人未必要和人长得一模一样。”Gartner研究副总裁高挺表示。近日，我们采访了高挺。他在对话中指出，虽然人类世界是按人的体型设计的，但人体结构并不一定是机器人的最佳形态。成功的机器人应该改良人类形态而非简单复制。例如，亚马逊测试的Digit机器人膝盖向后弯曲，能比人更高效地在货架前下蹲；1X的Eve机器人则使用单腿加平衡轮以提高移动速度。高效的机器人外形可以是犬类、轮式或完全根据任务需求设计的全新形态，这些形态通常比人形更稳定、成本更低且速度更快。 “不要被‘人形’外形限制，应优先寻找能快速交付价值、产生收入的特定垂直应用场景。”除此之外，高挺从技术、硬件、应用场景和现实挑战等多个维度，梳理了今天机器人产业的真实图景。今天的机器人能做什么？ “短期内，应该关注的不是‘机器人是不是长得像人’，而是‘机器人能不能在一个非常明确的场景里面稳定完成任务、降低成本、减少人力依赖和提升运营效率’。” 那么，今天的机器人能够做些什么呢？ “从现在已经跑起来的案例看，机器人长什么样其实不是最重要的。不管是仓库里的机械臂，还是汽车工厂里的搬运机器人，真正比较容易落地的场景都有一个特点：环境比较固定。企业最后看的是：这台机器人能不能把活干好，这笔账能不能算得过来，而不是它长得像不像人。” 高挺总结，现阶段更容易形成投资回报的机器人场景，通常具有三个特点：任务边界清晰、流程可以重复、异常情况相对有限。例如，工业线边物流、仓储搬运和部分服务流程，都可以通过现场改造降低机器人需要处理的复杂度。家庭场景则不同：任务组合更加分散，环境变化更加频繁，而且任何失误都可能直接影响人员安全。因此，家庭机器人不仅需要更强的模型能力，也需要更成熟的工程可靠性和安全机制。大规模产业化的窗口期，机会在哪里？ “机器人正处于迈向规模化产业化的窗口期。”对于当前的机器人产业阶段，高挺这样定义。“目前，机器人已经在一些工商业场景里跑通了。尤其是在工厂和仓库里，一些重复频率高的工作，机器人已经可以替代一部分人工。所以资本对这个赛道非常关注，一些头部公司的估值也涨得很快。” 但是真正大规模的产业落地还没有发生。特斯拉曾提出在 2025 年生产约 5000 台 Optimus 的目标。但在 2025 年第四季度财报发布时，Elon Musk 也承认，Optimus 在工厂里面只做了一些基础的任务，还没有形成真正意义上的生产力。据悉，特斯拉第三代人形机器人预计年中亮相，要到 2026 年 7-8 月才会启动正式投产。 “机器人、尤其是人形机器人，实际落地和大众预期有挺大差距，这也是现状。” 在高挺看来，未来 2-3 年，人形机器人仍难以实现完全大规模商业化。“这些人形机器人可能会继续出现在工厂、仓储、汽车制造等相对固定的环境里，做一些重复性、低复杂性的工作。但更多是试点和小规模部署，而不是全面替代劳动力。相比之下，工业机器人、仓储机器人、服务型机器人以及一些面对特定任务的多功能机器人，这些产品的商业化路径反而更清楚。因为它们的任务边界比较明确，投入产出也更容易算，安全和流程相对容易控制。” 对于想购买机器人的企业，他的建议是：“第一，起点不是‘买一个人形机器人’，而是要从找高价值、低复杂度的任务开始。第二，要把机器人当作一个运营改造项目，而不是单纯的硬件采购。买来本体不能直接落地，还要考虑现场流程、空间布局、IT/OT 集成、员工协作等等。第三，先试点、再扩展，从一两个小封闭场景开始，拿到真实的生产力结果后再复制。第四，先考虑成熟的品类，比如 AMR、机械臂、协作机器人，然后长期追踪人形机器人的成熟度。” “行业内常有人将当前具身智能的发展阶段类比为大模型早期：技术方向已经逐渐清晰，但规模化能力尚未形成。”高挺解释，这个类比有一定道理，但机器人的产业化难度更高。“因为它不仅受到数据和算力约束，还涉及传感器、驱动系统、电源管理和系统可靠性。” “VLA 仍是重要路线，世界模型正在加速融入机器人系统” 机器人能做什么、不能做什么，根本上取决于它的“大脑”，也就是机器人模型。高挺表示：“VLA 是通用机器人模型目前比较成熟的技术路线。” VLA 即 Vision-Language-Action，指视觉、语言和动作。其中的“Language”部分，就是来自于大语言模型。它让机器人能够结合环境信息和任务指令，生成相应的动作。 “语言模型的作用是为机器人提供语义理解、常识和任务规划能力。例如，当用户说‘房间太暗了’，机器人需要理解这句话背后的任务目标，判断是否应该开灯。” 区别于以前的范式，VLA 模型是先有泛化能力，再一个一个场景去突破可靠性。逻辑正好反过来。“以前是先解决特定场景的高可靠性问题，然后再试图泛化。比如先让一个机器人把某个动作的可靠性做到非常高，然后试图让它学别的任务。但你会发现，这种方式很难真正实现泛化，你只能得到一个非常专业的机器人，换个任务就做不好。” 对于世界模型这类新的技术路线，高挺表示，“它提供了另一种思路：让系统学习物理世界中的状态变化和因果关系，并对动作可能产生的结果进行预测。它不一定依赖语言作为中间层，更强调对物理规律的建模。就像一个熟练的司机在开车时，看到前方有水坑，不需要在大脑里用语言翻译‘这里有水，可能会打滑，我要减速’，而是视觉直接触发了对车辆轨迹的物理预测，本能地踩下刹车。世界模型想解决的，就是这种不需要先翻译成语言、直接作出判断的能力。不过，他认为，“今天，通用机器人和人形机器人的前沿路线仍然以 VLA 为主。世界模型虽然发展很快，但目前更多用于合成数据生成、仿真、评估和辅助规划，真正直接用于实体机器人控制的案例仍然比较早期。未来一两年，VLA 大概率仍然会是机器人动作模型的主体，但世界模型会逐步融入 VLA 系统，为机器人提供更强的物理理解、规划和预演能力。长期来看，更有可能出现的是 VLA 与世界模型的融合，而不是世界模型简单取代 VLA。” 高挺指出，目前 VLA 是最接近工程化落地的通用机器人技术路线之一。它距离像人一样灵活、通用的智能仍有较大差距，但在仓储、制造等边界相对明确的场景中，已经展现出较好的实用价值。未来一

订阅66必读