近来最火的科技概念,非人工智能莫属。人工智能,可以实现工厂生产流程的全自动化,可以代替人类驾驶汽车,可以在围棋比赛中碾压人类,可以将普通照片渲染成大画家的绘画风格……
在作曲领域,人工智能也早有涉足。早在1981年,加州大学圣克鲁兹分校音乐教授大卫·科普(David Cope)就完成了音乐人工智能“音乐智能实验”(Experimentsin Musical Intelligence,后文统一缩写为EMI)的开发,最初版本的EMI能够自动创作一些短小的音乐片段;游戏《古墓丽影:崛起》中,游戏的背景音乐由AI即时调整,能够随着游戏人物移动或场景不同随时变化;在我国,清华大学x-lab的小伙子们开发的DeepMusic能够通过简单勾选风格、乐器、情绪、时长等标签,自动生成个性化的音乐;百度的人工智能团队开发了能够“看图作曲”的人工智能,并现场演示了针对梵高《星月夜》、徐悲鸿的《奔马图》以及罗伯特·劳森伯格《四分之一英里画作》等画作进行的配乐;产品化的音乐人工智能AmperMusic可以按照你选择的曲风、情绪等,输出为你量身定做的主题音乐,该项目已获得李嘉诚旗下维港投资(Horizons Ventures)总金额400万美元的种子轮投资。
然而,音乐人工智能,并没有引起人们的广泛讨论。人们会认真考量人工智能在多大程度上能够替代人类医生的诊断,会导致多少技术工人失业,可是在音乐领域,人工智能仿佛是一个禁忌。我曾就人工智能是否有一天能与人类作曲家并驾齐驱这个问题与不少朋友进行过讨论,绝大多数朋友的观点都非常一致——绝不可能。
是的,艺术和音乐,是人类思想灵魂深处最不可接近的神圣领域,我们本能的否认AI能够成为哪怕是及格水平的作曲家,更不用提超越我们,可仔细分析我们否认这个问题的观点,却似乎并不怎么站得住脚。
总结下来,人工智能在作曲领域不可能超越人类的观点主要有三个。其一,组成音乐的音符、节奏等基本元素,可能的排列组合是无穷的,是靠穷举机械运算的计算机所不可能遍历的;其二,是人工智能不具备人类的感情,不可能创作出激发人类情感的音乐;其三,就算人工智能可以创作基础的音乐旋律,可以模仿人类作曲,但计算机没有生活经历,没有喜怒哀乐,所以它无法创作诸如交响曲那样的大部头的、复杂的音乐作品。
我们逐一来看这些观点,首先,关于计算机只能靠穷举进行机械运算这个说法,本身就是不准确的。这个说法的主要来源是1997年5月11日IBM的超级电脑“深蓝”战胜人类国际象棋冠军卡斯帕罗夫的那场世纪大战。在那时,这样的解释还是基本合理的,“深蓝”的思考方式,相当于一个拥有无限记忆的人背过了所有可能的棋谱,对弈时所有可能出现的局面它都见过,自然知道最优策略是什么。我们可以说“深蓝”的计算基本靠蛮力推演,可以说非常人工,但并没有多么智能(极小极大策略及剪枝算法)。
可是在围棋领域战胜人类的AlphaGo,所采用的算法就非常不同了,虽然它也需要在之前录入大量的棋谱,但它并不分析这些棋谱的具体意义,只是将其模式抽象为数字信息存储(卷积神经网络与深度学习)。落子时,阿尔法狗并不确切知道下一步怎么落子是绝对优势选择,它也不关心(也没这个能力)若干手之后局面会是个什么样子,它只是知道把子落在哪里赢的概率会更大一些(蒙特卡洛树搜索)。
好了,有了这些知识,我们就可以继续讨论第二个问题,即人工智能不具备人类的感情,不可能创作出激发人类情感的音乐这个说法了。
我们沿着刚才的观点继续思考,AlphaGo战胜人类时,关心的只是赢棋的概率,我们甚至可以说它根本不懂围棋的规则,同理,在作曲领域,人工智能也完全不需要了解人类的情绪是什么,只需要将你喜欢的曲子输入计算机,它会自动分析抽象其中的特征,并依据这些特征生成你喜欢的音乐。
以开头提到的音乐人工智能EMI为例。30多年来,它一直在发展进化,如今EMI所创作的肖邦风格的钢琴曲,已经达到以假乱真的程度,就连研究肖邦的专家也很难将其分辨出来。著名认知神经学家、《哥德尔、埃舍尔、巴赫: 集异璧之大成》的作者侯世达(Douglas Hofstadter)曾经坚定地认为计算机不可能创作出优秀的音乐作品,他曾说:“用一台批量生产的、花20块钱邮费邮购获得的装满贫乏电路的盒子,创作出肖邦或是巴赫活到今日写出的曲子,这种念头,哪怕只是想想就已经是对人类心智深度最荒诞可耻的误估。”
他会演奏钢琴,非常喜欢巴赫与肖邦的音乐,自认为“没有什么伪造的肖邦的曲子能骗过他的耳朵”,可是听过EMI的创作后(1995年),他完全分辨不出AI与肖邦的差别。他受到了极大的震撼:“如此饱含感情的音乐,怎么能从一个从未听过一个音符、从未活过一分一秒、从未有过一丝一毫情感的程序中谱写出来?”他也曾用这两段音乐测试伊士曼音乐学院的讲师教授,几乎没有人能准确的分辨人工智能与肖邦的创作。
再来看第三个论点,就算计算机可以生成一些短小的曲子,但它只能模仿人类作曲,且无法创作诸如交响曲那样的大部头的、复杂的音乐作品。
关于人工智能可以出色地模仿人类这点,并没有什么争议。在经过足够的训练后,人工智能可以将任意图像转化为某位大画家的绘画风格,EMI模仿肖邦的音乐创作,也是很好的例子。可如果说人工智能只能模仿人类进行创作,这就有些偏颇了。
AlphaGo最初的版本,就是以人类棋谱为基础进行训练的,这个版本表现并不出色,基本只能达到人类普通棋手的水准,距离战胜职业高手,还差得远。而它实现围棋能力的飞跃,恰恰是因为它脱离了人类棋局的束缚,科学家们以人类棋局为基础,让AlphaGo以左右互搏的方式,自行训练自己,也正是经历了人类对局中绝不会出现的盘面后,AlphaGo最终登上了围棋冠军的宝座。而与其对弈的人类棋手,普遍都有这样一个评价:“人类绝对不会这么下,但它下得真妙!”
所以理论上,让人工智能自行训练自己,生成全新的音乐风格,也并不是不可能的事情。事实上,已经有人如此在做了,而且人工智能也已经可以创作复杂的交响乐作品,EMI就有两位数的交响乐创作;由法国人工智能团队开发的音乐人工智能Aiva,甚至已经被正式吸收为法国与卢森堡作曲家协会的首位非人类会员。
尽管如此,人工智能所创作的交响曲作品,基本都是单乐章的交响乐,其复杂程度和规模还是远远无法与贝多芬、马勒等人的作品相提并论。这是由于人工智能不具备如此的能力吗?
到这里,我们可以总结一下,人工智能可以作曲,这已经是客观事实,没有什么争议。而人工智能的作品是否能达到与人类作曲家并驾齐驱的程度,可以说,技术条件已经具备,但现实中,却有两个主要的限制条件。
客观上,对于人工智能作曲的投入,并没有什么看得到的实在价值;而主观上,我们也绝不愿意接受人工智能在音乐创作上可以与我们并肩。
我的观点是,技术的高速发展,是不可抗拒的客观事实。IBM深蓝的运算能力,放到今天,可能还不及你手中的智能手机,许多我们认为只可能被人类掌握的领域,正一个接一个被人工智能突破。但是,这并不代表我们要把一切都交于人工智能。
如今已不可能有人在国际象棋或是围棋领域战胜计算机,但人类并没有从此放弃这些游戏,因为胜负从不是人类对弈的唯一目的,更何况从不以胜负作为判断标准的艺术。人工智能也许能够作曲,或许有一天也能创作出伟大的音乐作品,但这并不代表它能够替代人类的创作。
我们与人工智能的不同,在于我们会质疑和探索音乐与人生的意义,因为我们每人只有唯一一段独特的人生,因为我们会欣赏音乐。一方面,人工智能可以人类望尘莫及的效率完成各种任务,但是对于计算机而言,一件任务只有初始状态、处理过程和终止状态,它永远不会去检视自己完成任务的意义。
反观人类音乐的发展,当人们质疑为何音乐只能是教堂中的人声吟诵时,音乐走出了中世纪;让人们思考如何才能让音乐更富于细节和层次感时,巴洛克时代来临了;当我们开始反思我们的音乐中充斥的精致浮华时,音乐开始走向古典主义;当我们想要通过音乐抒发自己的激情时,浪漫主义到来了……
对于人类,音乐不光是音符与旋律,也是一段可以回溯的历史,更是许多记忆与故事,这也正是音乐对于我们的意义,这一切,人工智能无法体会。
另一方面,我们每个人,都是不同的个体。我们出生、成长、成熟、衰老……我们每个人的人生经历都各不相同。正因如此,同一段音乐,对于不同人而言,具有不同的意义。它可以让一些人痛哭流涕,另一些人对其却无动于衷。音乐并不因它被创作出来而赋予意义,音乐由于被人欣赏才有了价值。
而对于人工智能而言,我们也应该抱着开放的心态看待其发展。在一些场景中,人工智能是能够做出一些有意思的突破的,比如AmperMusic所提供的个人化的音乐定制就非常有意思;我自己也曾设想过训练人工智能学习某位作曲家——如莫扎特或贝多芬的创作风格,然后将其迁移至一些新的情境,相当于让这些伟大艺术家,在数字的海洋中复活,为我们继续创作。
我还是有些期待某天能欣赏到这样的人工智能的作品的,你呢?
(解磊/文,原载于《爱乐》2018年第10期)
领取专属 10元无门槛券
私享最新 技术干货