一幅画所体现出的创造性可以用人工智能(AI)来进行量化吗?
编者按:
艺术史家向来是艺术作品价值评估的标杆。而在机器尝试复制人类能力的今天,机器学习也尝试介入这一领域,Elgammal所领导的团队就此创建了一个评估画作革新性的算法模型,它给出了和艺术史家稍有出入的答案。这样的尝试也为我们提供了重新审视艺术史的可能性。
从毕加索的《亚维农的少女》到蒙克的《呐喊》,究竟是什么让这些画作牢牢吸引住看客的眼球,又是什么让它们成为艺术史上的不朽之作?在很多时候,这是因为画家采用了前所未有的作画技巧、形式或是风格。他们展示出了一种富有创造性的艺术才华,并引得无数后生的模仿。
在人类历史上,专家们经常以这些艺术上的创新来强调一幅画作的相对价值。但是,一幅画所体现出的创造性可以用人工智能(AI)来进行量化吗?
在罗格斯艺术与人工智能实验室(Rutgers’ Art and Artificial Intelligence Laboratory),我和我的同事提出了一个新奇的想法。我们做到了结合整个艺术史的发展背景,通过一个算法来评估任意一幅画作的“创造性”。
本文作者,来自罗格斯大学的Ahmed Elgammal
在处理分析了大量的画作数据后,我们发现这个算法已经可以成功甄选出那些艺术界公认的杰作。这个结果说明对“创造性”具有评判能力的不再只有人类了。电脑也可以做到,甚至可能更客观。
如何定义“创造性”?
显而易见,这个算法的核心就在于如何解决这个问题——“创造性”能被怎样定义和评估?
如何定义创意这个问题由来已久,而且人们仍然对此争论不休。我们常常用“很有创造性”形容一个人(比如一位诗人或是一个CEO),一个产品(比如一座雕塑或是一本小说)或一个想法。在我们的算法中,关注的重点是产品的创造性。我们也由此采用了对“创造性”最普遍的一个定义,即强调产品的原创性和它所能带来的长期影响。
这套评判标准与各时期对艺术天才的定义颇有异曲同工之妙。譬如康德认为一个艺术天才需要满足两个条件:原创性和典范性。
《判断力批判》 康德 著
当代的玛格丽特·博登(Margaret A. Boden)提出的历史性创造力(Historical Creativity,即H-Creativity)和个人/心理性创造力(Personal/Psychological Creativity,即P-Creativity)也是一个很好的概念模型。前者评判一件作品相对于人类历史发展所体现出的新意和实用价值,而后者则侧重于作者在个人层面上所展现出的创造力。
建造算法模型
我们利用计算机视觉(指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图像处理,用计算机处理成为更适合人眼观察或传送给仪器检测的图像),构建了一个从15世纪到20世纪的画作网络。借助过这个网络,我便可以推测出一件作品的原创性和其影响力的持续性。
通过一系列的数学建模,我们发现量化“创造性”其实可以被简化为网络中心性问题(network centrality problem)的一种,即一种广泛应用于社交关系分析,瘟疫传播分析和网页搜索的算法。比如说,当你用Google搜索网页时,Google会用这样的算法预先浏览大量网页,并拣选出最符合你搜索指令的网页。
任何算法的输入结果都由它的输入内容和参数设定所决定。在这项工作中,我们输入的内容就是算法所看到画作的内容:颜色、质地、视角的应用和题材。我们的参数则来自定义创造性的两大元素:原创性和影响力。
值得一提的是,这个算法在分析时,并无任何关于艺术或是艺术史的知识背景。除了辅以作品的创作时期外,它仅仅是通过视觉分析来对这些作品进行评判。
识别革新
在对这1700幅画作进行评分的时候,我们得到了一些有趣的发现,比如说,这个算法给爱德华·蒙克的《呐喊》(1893)打了一个比它同时代的作品高出很多的评分。当然这有情可原:这幅画被评最杰出的表现派画作之一,而且也是20世纪被复刻最多的作品之一。
爱德华·蒙克 代表作《呐喊》
在这个算法评估的1904至1911年间画作中,毕加索的《亚维农的少女》(1907)得分最高。这个发现与艺术史学者的看法一致。他们指出这幅画采用的平面视图(flat picture plane)和原始主义(Primitivism)使其成为一幅极具创造性的艺术品,属于毕加索立体主义风格的先导。
《亚维农少女》(Ladies of Avignon),毕加索1907年绘制
卡济米尔·马列维奇(俄国画家,1879年2月23日-1935年5月15日)在1915年创作的第一批绝对主义(Suprematism)作品,也被这个算法认定为极具创造性。在那个立体主义盛行的时期,它独特的风格可谓是一个异类。在1916至1945年这段时期,皮特·蒙德里安和乔治亚·欧姬芙贡献了大多数高分作品。
当然,这个算法并不总是和主流艺术史学家的观点相同。例如,多米尼哥·基兰达《最后的晚餐》(1476年)的得分要比列奥纳多·达芬奇与之同名的的画作高得多,后者的创作时间比前者晚了20年左右。同时,相对于达芬奇其它的宗教主题作品,算法更偏爱达芬奇的《施洗者圣约翰》(1515)。有趣的是,达芬奇的《蒙娜丽莎》并没有拿到高分。
《最后的晚餐》,基兰达约 (Domenico Ghirlandaio,1449-1494,意大利洛伦萨画派画家) 绘制
《最后的晚餐》,达芬奇 绘制
下图展示了该算法认的最具创意的一些作品。
图片来源:原作者
接受时间的检验
鉴于以上这些与艺术史学主流观点的分歧(尤其是对于达芬奇的作品的评估),我们怎么知道这个算法是真的管用呢?作为测试,我们进行了“时间机器实验“”——我们把某一幅画作的时间改成其创造之前或之后的某一时间,再重新计算它的创造性分数。
我们发现如果把印象主义、后印象主义、表现主义和立体主义的创作时间改为公元1600年前后,它们的分数会得到显著的提升。相比较而言,新古典主义的作品即使是放在1600年也不会有很大的改变,毕竟新古典主义常常被认定为是文艺复兴的再现。同时,文艺复兴时期和巴洛克风格的作品如果被放在公元1900年的时间点上,它们在创造力上的得分也会相应的降低。
说到底,我们做这项研究的目的并不是希望它能够代替艺术史学家们,也不认为电脑在鉴定作品价值这方面比人眼更好。
更确切地说,人工智能(AI)才是我们做这项研究的动力。研究AI的终极目标是赋予机器近似于人类的感知能力、认知能力和思考能力。我们相信,评判创造性是一项极具挑战的任务,而且这三项能力缺一不可。
在这一层面,我们的研究结果提供了一个重要的突破:它证明了机器可以像人类一样感知,并从视觉上分析和思考艺术作品。
讨论:把作品放在历史的坐标去分析各风格的系谱,这是一个相对容易的工作,譬如文末提及的现代主义中各流派,它们相对传统绘画的革新是是明晰的,也是公认的。然而,鉴于当代作品形式更多元,题材更广泛,风格也更包容,加之没有此后的作品进行对比参照,机器学习如何基于过去的数据集给出自己的判断?这是对AI的感知、认知和思考能力更进一步的考验。
作者:Ahmed Elgammal
罗格斯大学计算机视觉教授
图片来源:网络
文章来源:the conversation
译者:崔牧云
编辑:王一丹
校对:子 川
排版:来红兵
领取专属 10元无门槛券
私享最新 技术干货