据站长之家 8 月 2 日报道,在人工智能艺术创作工具的快速发展中,英伟达的研究人员推出了一种创新的文本到图像个性化方法,名为 Perfusion。但与竞争对手相比,它并不是一个价值百万美元的超级大型模型。Perfusion 的大小只有 100 KB,训练时间只需 4 分钟,能够在表达个性化概念时保持其特性,同时具有显著的创造性和灵活性。
Perfusion 是由英伟达与以色列的特拉维夫大学合作撰写的研究论文中介绍的。尽管其大小较小,但在特定版本的效率方面,它能够胜过像 Stability AI 的 Stable Diffusion v1.5. 新发布的 Stable Diffusion XL (SDXL) 和 MidJourney 等领先的 AI 艺术生成器。此外,Perfusion 提供了一个显著的功能,允许用户在推理期间通过调整一个只有 100KB 大小的模型控制视觉保真度(图像)和文本对齐度(提示)之间的平衡。目前,英伟达只发表了研究论文,并承诺很快将发布代码。
领取专属 10元无门槛券
私享最新 技术干货