掩蔽离散序列模型中成对互信息的神经估计

摘要

arXiv:2605.20187v1 Announce Type: new Abstract: Understanding dependencies between variables is critical for interpretability and efficient generation in masked diffusion models (MDMs), yet these mode

and the for conditional variables

2026-05-21 1 阅读约1分钟阅读 Jai Sharma, Yifan Wang, Bryan Li

arXiv:2605.20187v1 公告类型：新摘要：理解变量之间的依赖性对于掩蔽扩散模型 (MDM) 的可解释性和高效生成至关重要，但这些模型主要暴露边际条件分布，并且不明确表示变量间的依赖性。我们提出了一种神经框架，用于直接从预训练 MDM 的隐藏状态估计成对条件互信息 (MI)，使用根据模型自身的条件分布计算出的真实 MI 进行监督。生成的估计器捕获模型关于依赖结构的内部信念，并在单个前向传递中预测完整的 MI 矩阵，从而通过识别条件独立的变量子集来实现 MI 引导的并行解码。我们使用 ESM-C 评估我们的数独和蛋白质序列生成方法，其中 MI 图恢复已知的结构约束，与顺序解码相比，可以将推理时间前向传递减少 3-5 倍，同时保持生成质量并优于基于熵的并行化方法。

订阅66必读