智能AI morning

通过将公平视为对称操作来检测和减轻偏差

2026-06-08 1 阅读 Nishit Singh
arXiv:2606.06514v1 公告类型:新 摘要:部署在高风险社会经济环境中的机器学习系统通常会表现出偏见。我们将偏差形式化为对称破坏操作:如果分类器的输出在切换敏感属性的反事实操作下保持不变,并且优点特征保持固定,则分类器是公平的。我们实现基于损失的正则化作为对称恢复机制,并在四个具有不同噪声、相关性和偏差水平的合成数据集上评估该框架。该框架实现了 90% 以上的违规减少,准确率成本降低了 5% 左右。该框架不需要因果图知识,计算量轻,并且可推广到任何可定义为位翻转的敏感属性,使其适合主流基准中不存在本地歧视源的情况。