https://arxiv.org/abs/2312.14091 https://github.com/Picsart-AI-Research/HD-Painter
基于文本到图像扩散模型的空前成功,文本引导图像修复的最新进展已经可以生成非常逼真和视觉上合理的结果。然而,当前的文本到图像修复模型仍有很大的改进潜力,特别是在更好地将修复区域与用户提示对齐以及执行高分辨率修复。
在本文中,我们介绍了HD-Painter,这是一种完全无需训练的方法,可以准确地遵循提示并连贯地缩放到高分辨率图像修复。
我们的实验表明,HD-Painter在质量和数量上都超过了现有的最先进的方法,实现了令人印象深刻的61.4%对51.9%的生成精度提高。
所提出方案由两个阶段组成:
.
,我们StableDiffusion-SR进行超分处理。我们应用SD的扩散后向过程,从
开始,并以低分辨率修复图像
为条件。在每一步之后,我们将去噪后的
与原始图像的编码
进行混合并得到
. 在通过解码器对隐变量完成解码后,我们进一步采用泊松融合进一步消除伪影。
如上表所示,我们的方法在所有三个指标上都优于竞争对手。特别是,我们在所有竞争对手中提高了超过1.5分的CLIP分数,并达到了61.4%的生成准确度(Acc),而其他最先进的方法为51.9%。此外,PickScore比较显示我们在整体质量方面也优于竞争对手。