智能AI
morning
流形假设下可证明的学习扩散模型:崩溃和细化
2026-05-21
1 阅读
Wei Huang, Andi Han, Mingyuan Bai, Huanjian Zhou, Qixin Zhang, Taiji Suzuki, Kenji Fukumizu
arXiv:2605.20235v1 公告类型:新 摘要:扩散模型生成具有卓越质量的高维数据,但是当数据支持低维流形时,它们的训练如何有效地学习得分函数,绕过维数灾难,在理论上仍然无法解释。我们确定了由得分函数本身的几何形状驱动的折叠和细化机制:在小噪声尺度下,得分的发散奇点驱动诱导去噪图在数据流形投影上的快速维度折叠;在中等噪声尺度下,训练可以细化学习流形的内在密度。我们将这一原理实例化为分数诱导潜在扩散(SiLD),这是一个两阶段框架,其中流形学习和密度估计都来自单个去噪分数匹配目标,取代了基于 VAE 的潜在扩散模型的启发式 KL 正则化。我们证明,最终的样本复杂性取决于内在维度而不是环境维度。 Stacked MNIST、CelebA 变体和分子生成基准的实验表明,SiLD 在生成质量方面匹配或优于基于 VAE 的 LDM,并持续改进重建,验证了我们的理论预测。