AI文本到图像生成框架，提升单步扩散模型的效率和性能

产品名称：SNOOPI
产品简介：SNOOPI是创新的文本到图像生成框架，基于增强单步扩散模型的指导提升模型性能和控制力。SNOOPI包括PG-SB（适当指导 – SwiftBrush）和NASA（负向远离转向注意力）两种技术。PG-SB用随机尺度的无分类器引导方法，增强训练稳定性；NASA用交叉注意力机制整合负面提示，有效抑制生成图像中的不期望元素。
详细介绍：

SNOOPI是什么

SNOOPI是创新的文本到图像生成框架，基于增强单步扩散模型的指导提升模型性能和控制力。SNOOPI包括PG-SB（适当指导 – SwiftBrush）和NASA（负向远离转向注意力）两种技术。PG-SB用随机尺度的无分类器引导方法，增强训练稳定性；NASA用交叉注意力机制整合负面提示，有效抑制生成图像中的不期望元素。实验结果显示，SNOOPI在多个评估指标上显著超越基线模型，尤其在HPSv2得分达到31.08，树立了单步扩散模型的新标杆。

SNOOPI的主要功能

提高单步文本到图像扩散模型的效率：将多步骤的文本到图像扩散模型简化为单步模型，提高生成效率，减少计算资源的需求。
增强模型的稳定性和控制性：基于PG-SB和NASA技术，SNOOPI在训练和推理过程中提供更稳定的性能，支持对生成的图像进行更精细的控制。
支持负面提示引导：SNOOPI用NASA技术，实现对负面提示的支持，使在图像生成过程中排除不想要的元素，提升图像生成的实际应用价值。
提升图像质量：SNOOPI能生成高质量、高分辨率的图像，其HPSv2得分达到31.08，显示了在图像质量上的优势。
跨模型背板兼容性：SNOOPI能在不同的模型背板上有效工作，包括PixArt-α、SDv1.5和SDv2.1等，显示了广泛的适用性。

SNOOPI的技术原理

随机尺度分类器自由引导：PG-SB（Proper Guidance – SwiftBrush）在训练过程中变化教师模型的指导比例，扩大输出分布，让模型适应不同的扩散模型背板，同时保持竞争力的性能。
负向提示整合：NASA（Negative-Away Steer Attention）基于交叉注意力机制将负面提示融入单步扩散模型中，调整中间特征空间的注意力权重，减少不希望的特征在生成图像中的出现。
模型输出对齐：VSD框架用预训练的扩散模型增强基于文本的生成，确保生成的图像与教师模型的概率密度对齐。
特征过滤：基于NASA机制，SNOOPI在特征空间中过滤掉不想要的特征，能在生成图像之前排除不需要的元素，减少混合伪影的出现。