智能AI morning

边界方差膨胀导致高斯过程中的采集偏差

2026-06-09 1 阅读 Maria B{\aa}nkestad, Sanna Jarl, Jens Sj\"olund
arXiv:2606.07561v1 公告类型:新 摘要:有界域上具有固定核的高斯过程在边界附近表现出膨胀的后验方差。尽管边界引起的采集偏差是地质统计学中长期公认的一个伪影,也是贝叶斯优化中过度探索的根源,但边界引起的采集偏差的原因和影响尚未得到充分探索。我们将根本原因追溯到一个简单的几何机制:域边界处核相关邻域的截断产生了与观察无关的失真,这种失真随着维度的增加而恶化。我们展示了这种失真如何在三个采集类别中表现出来:方差最大化将选择集中在角落,而负积分后验方差和预期预测信息增益将选择向内移动到轴对齐的内壳。这些模式的出现不涉及任何目标函数,这意味着采集行为可以由内核几何形状决定,而不是由所需的特定于任务的不确定性决定。为了量化这一点,我们引入了一种针对任意采集、内核和有界域几何的无函数选择配置文件诊断。