归因不可能性：共线性下没有忠实、稳定、完整的特征排名

摘要

21492v1 Announce Type: new Abstract: No feature ranking can be simultaneously faithful, stable, and complete when features are collinear。For collinear pairs, ranking reduces to a coin flip。

and for the impossibility complete

2026-05-23 1 阅读约1分钟阅读 Drake Caraker, Bryan Arnold, David Rhoads

arXiv:2605.21492v1 发布类型：新摘要：当特征共线时，没有任何特征排序能够同时忠实、稳定和完整。对于共线对，排名就像抛硬币一样。我们证明了这种不可能性，将其量化为四个模型类，通过集成平均 (DASH) 解决它，并使用 305 个精益 4 定理进行机器验证。我们描述了完整的归因设计空间：存在两种方法——忠实完整方法（不稳定，排名在 50% 的时间内翻转）和 DASH 等集成方法（稳定，报告对称特征的关系）——没有任何方法可以脱离这种二分法。这种不可能是定量的：对于梯度提升，归因比率发散为 1/(1-rho^2)，对于 Lasso 则为无限，对于随机森林则收敛。 DASH（SHAP 的多样化聚合）在无偏聚合中被证明是帕累托最优，通过严格的集成大小公式实现了 Cramer-Rao 方差绑定。在对 77 个公共数据集的调查中，68% 的数据集表现出归因不稳定。当特征具有相同的因果效应时，切换到条件 SHAP 并不能避免这种可能性。该框架包括实用的诊断——Z 测试工作流程和单模型筛选工具——并对公平审计产生直接影响：基于 SHAP 的代理歧视审计在共线性下被证明是不可靠的。设计空间定理、诊断和不可能性在 Lean 4 中得到机械验证（来自 16 个公理的 305 个定理，0 抱歉）——据我们所知，这是可解释人工智能中第一个正式验证的不可能性。

订阅66必读