编译 | bie管我叫啥
算法在绘画,素描和雕刻方面具有人性化的精确度。马里兰大学和Adobe研究所的研究人员开发了一种新的机器学习系统LPaintB,它可以在不到一分钟的时间内,重现达芬奇,梵高和维米尔风格的画。
随着非真实感渲染技术的发展,包括基于笔画的渲染和绘画渲染,特别设计的或手工设计的方法可以越来越多地通过应用启发式来模拟绘画过程,这些算法可以产生令人信服的结果,但很难将它们扩展到新的或看不见的样式。团队专注于构建一个绘画智能体,它可以用一系列绘画动作以相同或转换的样式再现参考图像。
研究人员的方法利用自我监督学习,其中未标记的数据与少量标记数据结合使用以提高学习准确性,从而在有限数量的参考图像上从头开始训练智能体。
通过数学建模系统的动作状态(即画笔配置,如长度,方向和画笔大小),并通过将失败的目标状态替换为最终状态,团队生成了一个带有正奖励的配对语料库,并将其提供给AI模型,使其学会画参考图像所需的艺术风格。
研究人员指出,通常情况下,系统采样的行动中只有一小部分具有正面奖励,他们使用强化学习技术解决了这个问题,该技术使用目标状态作为配对数据来训练策略。
但是生成的策略并不是特别强大,因为用于训练它的配对数据只包含正面奖励的行动(这使得难以从不良行为中恢复到负面奖励)以及由于连续一系列动作。再次解决这一问题需要强化学习:它为有助于推广模型的动作增加了噪音,并通过奖励优化了模型的行动。
最终的结果如何呢?一个AI框架可以使用描述笔划大小,颜色和位置信息的参数执行绘制操作,并相应地更新画布,使用奖励函数评估当前状态和目标状态之间的距离。
为了编制训练数据集,该团队以不同比例的特定样式从参考图像中抽取随机补丁,并将补丁采样到固定大小。他们将这些产品送到模型中,经过一个小时的训练后,该模型能够在一台装有16核处理器和Nvidia GTX 1080图形芯片的个人电脑上,在不到一分钟的时间内,以20000笔画复制出1000 x 800的图像。
研究人员指出,训练模型的推广高度依赖于训练数据,他们的方法基于一个相当基本的绘画环境,但他们说自我监督和强化学习的结合极大地提高了策略的效率和表现。团队未来的工作,包括合并笔刷参数,如笔刷大小,颜色和位置,以及构建可以用于绘图模拟器中的基于模型的强化学习框架。
End
领取专属 10元无门槛券
私享最新 技术干货