扩散模型和最优传输之间到底存在怎样的联系?
扩散模型与最优传输之间的联系
扩散模型与最优传输(OT)之间的关系仍然是一个未解之谜。虽然在相似的数据集上训练的扩散模型往往能够恢复出相似的映射关系,但这些映射关系并不一定是最优传输映射。2022年,博科尼大学的Hugo Lavenant与里昂第一大学的Filippo Santambrogio合作发表了论文,探讨了流模型在OT框架中的应用,并提供了反例,表明在某些情况下流模型并不实现最优传输。
研究背景
在先前的研究中,Khrulkov和Oseledets提出了一个猜想,认为通过积分Fokker-Planck方程的Wasserstein速度所得到的ODE流可以获得最优传输映射。然而,Kim和Milman的研究认为这一猜想是错误的,却没有提供证明。Lavenant和Santambrogio的论文则为这一点提供了明确的反例。
扩散模型与最优传输的定义
生成模型的目标是在参考分布α(通常是高斯分布)与数据分布β之间构建传输映射T。通过求解Monge问题,最优传输可以找到唯一的映射T。根据Brenier定理,这个映射可以表示成一个凸函数的梯度。另一方面,扩散模型则通过定义从数据分布β演化到高斯分布α的过程来构建流图。
重要发现
Lavenant和Santambrogio通过矛盾证明了,逆向流图一般情况下并不是最优传输。他们构造了一个接近各向同性高斯分布的β,证明在某些时刻从α到β_t的逆向流图T_t并不是最优传输。这一发现表明,假设流图T_t是所有t的最优传输会导致矛盾。
结论
总体而言,尽管扩散模型和最优传输之间存在某种联系,但流模型并不总是能够定义最优传输映射。Lavenant和Santambrogio的研究为这一复杂关系提供了新的视角,揭示了在某些情况下,流模型的映射可能并不具备最优性。这一领域的研究仍有待进一步深入,以更好地理解扩散模型与最优传输之间的本质关系。
联系作者
文章来源:机器之心
作者微信:
作者简介:专业的人工智能媒体和产业服务平台