机器正在迅速缩小人类和人工智能之间的创造性差距。去年,我们对Nvidia的AI能够产生逼真的假人图像的能力感到惊讶,但昨天一组研究人员推出了一款能够从文字描述中制作“The Flintstones”原创视频的能力。
“ 摩登原始人 ”是关于一个流行的美国黄金时段的动画片,讲述的是摩登石器时代的家庭。
在艾伦人工智能研究所,伊利诺伊大学厄巴纳 - 香槟分校和华盛顿大学工作的研究人员开发了AI组合,检索和融合网络(Craft)。它在一个数据库上进行了培训,这些数据库包含了超过25,000多张经过精心注释的影视。
Craft使用视频中的注释来确定原始图像如何与用于描述它们的文字相对应。最终,它建立了一组参数,使其能够“理解”卡通中的个性角色和对象与他们的普通语言对象相匹配的原因。一旦理解了这种关系,它就能够基于新颖的文本输入生成视频剪辑,这看起来很像它训练的卡通。
训练集仅包含长度为75帧或约三秒长的剪辑。虽然人工智能并不总能输出可辨识的东西,但它经常以惊人的准确度模仿原始动画片的风格。
领取专属 10元无门槛券
私享最新 技术干货