嵌入偏好，而不是语义

2026-05-12 1 阅读 Carter Blair, Ariel D. Procaccia, Milind Tambe

arXiv:2605.08360v1 公告类型：新摘要：现代人工智能正在为集体决策打开大门，参与者以自由格式文本的形式表达自己的观点，而不是对一组固定的候选人进行投票。一个自然的想法是将这些意见嵌入向量空间中，以便可以应用有关设施位置问题和公平聚类的大量文献。但是标准文本嵌入测量语义相似性，而设施位置问题和公平聚类中的距离需要我们所说的 \textit{优先相似性}：参与者对一段文本的同意应该与他们与文本的距离成反比。现成的嵌入通过语义和偏好相似性之间的相关性继承了粗略的偏好信号，但当相关性中断时无法捕获偏好。我们将其形式化为一个不变性问题：文本嵌入模型对与偏好相关的信号（立场和价值观）和语义干扰（风格和措辞）进行编码，并且两者在观察上是相关的，因此依赖于干扰的几何图形即使在不正确的情况下也会显得偏好正确。我们证明，旨在打破这种相关性的合成训练数据可证明将最佳评分器从令人讨厌的余弦中转移出来，并显着改善了 11 个在线审议数据集的偏好预测。