【新智元导读】Science 专访了 Magenta 项目负责人 Douglas Eck ,谈到了谷歌大脑正在进行的包括 AI 音乐、绘画、笑话生成在内的多个项目,已经创造性 AI 的过去、现在和未来。
计算机能否具有创造力,这个问题也许还没有答案。但 AI 能创作出富有趣味的音乐和画作,则已经成为了现实。去年,谷歌大脑推出了名为 Magenta 的项目,旨在推进 AI 在艺术领域的发展。日前,Science 对 Magenta 项目负责人 Douglas Eck 进行了专访,谈到了创造性 AI 的过去、现在和未来。
Q:Magenta 是如何创作音乐的?
A:学习是关键。传统的人工智能使用规则方法,我们则尝试了很多机器学习技术,包括RNN、CNN、变分方法、对抗训练方法和强化学习。解释这些词汇要花些时间,简单来说,这些都是通过样本进行学习,最终生成某些结果的技术。
音乐家在利用谷歌 Magenta 项目开发的 A.I. Duet 软件即兴创作
Q:Magenta 所学习的样本都是些什么呢?
A:我们训练了 NSynth 算法,使用了神经网络来合成出新的声音,所用样本是多种不同乐器发出的乐音。SketchRNN 算法则是在我们推出的 Quick,Draw! 游戏上训练得到的。我们最新的音乐算法,Performance RNN 的训练样本则是录自一位钢琴家的现场演奏。我希望音乐家们可以在自己的音乐创作中轻松训练自己的模型,并能从生成的音乐中得到乐趣,并进一步改善它。
Q:计算机创作这几年的发展怎么样?
A:目前研究焦点是放在从样本学习的算法上,也就是机器学习,代替了过去的硬编码规则。还有一种趋势是,计算机创作更多地作为人类创作的辅助,而不是一种替代性技术了,我们目前一些工作就是这样,另外还有索尼的“Daddy’s Car”这首歌,它是一首计算机创作的歌曲,但在很多程度上受到了披头士的启发。
Q:计算机生成的歌曲是否曾让你感到过震惊?
A:是的,一直以来都是这样。Ian Simon 和 Sageev Oore 最近的 Performance RNN 算法创作了一些短作品,其表现力让我深感惊讶。却因为它训练所用样本来自Disklavier(由雅马哈公司生产的可由计算机控制的数码钢琴)所演奏的 MIDI,其模型能够生成带有真实节奏和动感的序列。
Q:Magenta 项目还在做些什么?
A:我们试着做了幽默生成,但没生成什么真正好笑的笑话。我们也在进行图像和草绘生成。未来,我们希望更多尝试设计领域。不知道我们是否能为建筑师或网页设计师提供一些工具。
Magenta 软件能从人类绘画中学习艺术风格,并应用到新图像中
Q:对于计算机生成的艺术作品,你会做出什么样的反应?
A:我在蒙特利尔计算机科学学院时,听到过音乐学院Jean Piché 创作的计算机音乐。他写了一个程序,能够生成类似爵士乐的音乐作品,有点儿想爵士乐演奏家 Keith Jarrett 的作品,当然,远没有 Keith Jarrett 那么打动人,但我还是很喜欢听,因为编写算法本身就是一项创造性的活动。我想认识 Jean 并了解他的这段超酷的程序,使我受益良多。
Q:某些能力曾被认为是人类独有的,如果算法也具有了这样的能力,我们应该如何重新认识这些能力呢?
A:AI 现在已经是下棋的高手了,但我不认为这会让下棋这件事失去价值。人们仍然会喜欢去下棋。计算机已经成为了人类学习下棋的好工具。另外,我想比较人类大师和 AI 下棋方式的不同,这本身就是非常有意思的事情。
Q:人类和机器如何合作,才能变得更富创造力呢?
A:我想这是一个迭代的过程。每种为艺术带来变革的技术,都需要时间去展现其价值。我愿意把Magenta 想成是一把电吉他。Rickenbacker 和 Gibson 把吉他电气化,是为了让吉他更大声,从而可以和台上其他的乐器相配。Jimi Hendrix、Joni Mitchell、Marc Ribot、 St. Vincent 还有其他很多吉他手都开始使用电吉他,而有人说,他们甚至使用电吉他的方式都是错的,包括各种各样演奏的技巧,但这却是人类创造力的体现。不管机器学习在生成模型上进展得有多快,人类艺术家会更快地去适应并使用这项技术,并不断推陈出新,用它玩出新花样。
原文地址:http://www.sciencemag.org/news/2017/08/how-google-making-music-artificial-intelligence