神经符号驱动：驱动 VLA 的基于规则的忠实推理

arXiv:2606.23938v1 公告类型：新摘要：结合思想链 (CoT) 推理的驱动 VLA 模型很有吸引力，因为它们利用预训练的 VLM 表示并以自然语言公开中间决策，但当前的基本原理通常缺乏保持基本原理与计划运动的因果关系所需的分步决策语义。我们介绍了 Neuro-Symbolic Drive，这是一种神经符号驱动框架，它使用直接从经典的基于规则的规划器中提取的基于规则的推理轨迹来监督驱动 VLA。我们的主要观察结果是，基于规则的规划器是符号人工智能系统，已经充当可执行推理引擎：它们推理主动安全约束，搜索候选操作，并选择最终轨迹。我们在模拟中对这些规划器进行检测，以捕获每个规则评估步骤的执行轨迹和内部决策跟踪。每条轨迹都被序列化为结构化的基于规则的推理，并与轨迹配对以微调 Qwen3.5-4B 作为驱动 VLA。由于这些痕迹直接源自确定动作的规划器状态，因此它们确保推理在结构上通过构造耦合到运动生成，而不是通过事后对齐。在我们的模拟器生成的基准上，详细的基于规则的推理将三摄像头感知下的 ADE@3s 从 0.47 降低到 0.26，漏失率从 8.30% 降低到 6.40%，在八摄像头感知下从 0.54 降低到 0.26，漏失率从 10.13% 降低到 5.99%。因此，神经符号驱动将神经符号规划逻辑转换为结构化监督。代码库：https://github.com/XiangboGaoBarry/Neural-Symbolic-Drive。