流形假设下可证明的学习扩散模型：崩溃和细化

摘要

arXiv:2605.20235v1 Announce Type: new Abstract: Diffusion models generate high-dimensional data with remarkable quality, yet how their training efficiently learns the score function, bypassing the cur

the score and dimensional data

2026-05-21 1 阅读约1分钟阅读 Wei Huang, Andi Han, Mingyuan Bai, Huanjian Zhou, Qixin Zhang, Taiji Suzuki, Kenji Fukumizu

arXiv:2605.20235v1 公告类型：新摘要：扩散模型生成具有卓越质量的高维数据，但是当数据支持低维流形时，它们的训练如何有效地学习得分函数，绕过维数灾难，在理论上仍然无法解释。我们确定了由得分函数本身的几何形状驱动的折叠和细化机制：在小噪声尺度下，得分的发散奇点驱动诱导去噪图在数据流形投影上的快速维度折叠；在中等噪声尺度下，训练可以细化学习流形的内在密度。我们将这一原理实例化为分数诱导潜在扩散（SiLD），这是一个两阶段框架，其中流形学习和密度估计都来自单个去噪分数匹配目标，取代了基于 VAE 的潜在扩散模型的启发式 KL 正则化。我们证明，最终的样本复杂性取决于内在维度而不是环境维度。 Stacked MNIST、CelebA 变体和分子生成基准的实验表明，SiLD 在生成质量方面匹配或优于基于 VAE 的 LDM，并持续改进重建，验证了我们的理论预测。

订阅66必读