,将其输入分类模型,并通过获取模型不同层的激活得到一组特征图
。也就是说,
,其中
表示分类模型的第
层。然后将这些功能融合到生成器中,如下所示。
输入分类模型并从不同层提取激活图来计算得到的特征
;(2)噪声矢量z,它可以使得生成多样化并去学习一个分布而非一对一(重建)映射;(3)一组掩码
,每个掩码限制了如何使用输入特征
;
首先乘以
。然后,将得到的特征图将进行卷积处理,并将结果与相应块的结果相加。
控制的:例如,全1时,通过整个特征图;全0,遮盖整个特征图;或者允许部分(测试时可由用户制定)。
的任何子集生成多样化的高质量图像样本。
下图2中显示了一些示例。这些生成样本均来自相同的特征,但具有不同的噪声Z。分类模型更深或者更高层的抽象语义特征主导了类别、几何结构、更大范围的变动幅度;而分类模型较浅层的特征则控制的是细微的纹理、颜色的信息。
采用的是FID和用户调查:
注:
这项工作提出了一种联系语义分类模型和生成模型的方法;展示了语义金字塔生成方法可以作为统一通用框架,用于多种图像生成和处理任务。作者认为,通过语义特征进行相关逆映射或其它操作是图像编辑的关键思路之一。