智能AI morning

归因不可能性:共线性下没有忠实、稳定、完整的特征排名

2026-05-23 1 阅读 Drake Caraker, Bryan Arnold, David Rhoads
arXiv:2605.21492v1 发布类型:新 摘要:当特征共线时,没有任何特征排序能够同时忠实、稳定和完整。对于共线对,排名就像抛硬币一样。我们证明了这种不可能性,将其量化为四个模型类,通过集成平均 (DASH) 解决它,并使用 305 个精益 4 定理进行机器验证。我们描述了完整的归因设计空间:存在两种方法——忠实完整方法(不稳定,排名在 50% 的时间内翻转)和 DASH 等集成方法(稳定,报告对称特征的关系)——没有任何方法可以脱离这种二分法。这种不可能是定量的:对于梯度提升,归因比率发散为 1/(1-rho^2),对于 Lasso 则为无限,对于随机森林则收敛。 DASH(SHAP 的多样化聚合)在无偏聚合中被证明是帕累托最优,通过严格的集成大小公式实现了 Cramer-Rao 方差绑定。在对 77 个公共数据集的调查中,68% 的数据集表现出归因不稳定。当特征具有相同的因果效应时,切换到条件 SHAP 并不能避免这种可能性。该框架包括实用的诊断——Z 测试工作流程和单模型筛选工具——并对公平审计产生直接影响:基于 SHAP 的代理歧视审计在共线性下被证明是不可靠的。设计空间定理、诊断和不可能性在 Lean 4 中得到机械验证(来自 16 个公理的 305 个定理,0 抱歉)——据我们所知,这是可解释人工智能中第一个正式验证的不可能性。