版本记录:
2020-06-18 美学技术、通用语言
2020-05-01 量化美学、计算美学
2019-03-15 人工智能美学 算法美学 指南v1.0
这篇文章在草稿箱里待了很久了,断断续续,有了一点灵感就写一点,代表着我对「人工智能」VS「美学」的 一些思考,今天整理成文,分享给大家~
文末有活动
本文有2个主要观点:美学技术、通用美学语言。
美学技术指的是使用人工智能、计算机等技术,用于创造具有美学思想(精神)的美学作品。通用美学语言指的是创作者与机器沟通美学的一套技术标准,其载体是美学技术。
- 通用美学语言
我们以约翰·希尔勒的《Minds, Brains, and Programs》一书中介绍的著名思想实验「Chinese Room」(中文屋子)为例,尝试阐述这一观点。
这是一个关于中国人、外国人、说明书的故事。有这么一间封闭的房间,注意,这房间是封闭的,并且这个房间只有一个窗户。
房间里锁了一位对中文一窍不通的,母语是英语的老外。房间里有一本用英文写的说明书,说明书解释了中文的句法和文法组合规则,以及一大堆中文符号。这时候,房间外有位中国人不断地往房间内传递用中文写成的问题。房间里的老外按照说明书,将问题翻译成英文,然后对问题进行解答,再翻译回中文,写成答案,传递给房间外的中国人。大家觉得房间外的中国人,能不能看懂答案?能不能发现房间里其实是一名外国人?
在上面的交流过程中,房间外的中国人所扮演的角色相当于艺术家,房间里的外国人相当于计算机,而说明书是一本关于“艺术品的美学解读指南”。房间里的外国人是不可能理解中文的,必须借助说明书才能理解,同样的道理,计算机也不可能通过“美学解读指南”来获得理解力。但是,房间外的中国人误以为计算机具有理解力,能读懂“美学解读指南”。
我们需要一本可以指导计算机的 「美学解读指南」——通用美学语言。
数据驱动
艺术家通过喂养机器大量的数据(名画),从而让机器具备了美学创作能力。
GANism
一种艺术趋势
创作这幅画的团队 obvious-art,表达了一个观点:
GANism Is The New Art Trend
GANism是什么?一种新的艺术趋势,是艺术家利用人工智能技术创造的一种艺术风格。在没有相机之前,画家需要以手工的方式描绘生活。在摄影技术被发明之后,人类通过物理光学和化学的手段,终于将转瞬即逝的时光固定并保留了下来,从而使画家告别了以手工方式描绘自然的时代,开启了通过机器快速将自然转化影像的新历史。
摄影,一种新的美学语言诞生。
在智能时代,随处可见的数据、算法的普及,新型艺术创作工具的诞生,是否会诞生适应智能技术的美学语言?
Facebook的CAN(Creative Adversarial Network,创造性对抗网络)。CAN与传统的GAN的不同在于,它在鉴别器中设置了两种标准,一个是“是否是艺术”,另一个是“所生成的艺术属于什么风格类型”,这两种标准被设置成对抗性的,即既要生成属于艺术范畴的图像,又要设置不同于既定风格的图像。
在分析过程中,需要借助大数据,包括美学家、艺术理论家对艺术品和艺术家的情感分析。
数学方法
前面介绍的是一种数据驱动的转化语言的方法,还有一种是在数学上进行转化的方法。
举上图这个经典的智能设计案例,为了完成根据显著图自动调整布局的算法,我们首先需要知道如何把设计语言转化为数学语言。
图像本质上是一个二维的矩阵,于是,我们可以把问题转化为寻找二维矩阵中的最大子矩阵这么一个数学问题:
我们可以进一步把数学问题具体化,把问题转化为任务:
已知矩阵的大小定义为矩阵中所有元素的和。给定一个矩阵,你的任务是找到最大的非空(大小至少是1 × 1)子矩阵。
比如,如下4 × 4的矩阵:
0 -2 -7 0
9 2 -6 2
-4 1 -4 1
-1 8 0 -2
的最大子矩阵是:
9 2
-4 1
-1 8
这个子矩阵的大小是15。
这样转化就可以直观地理解问题本身。找到了这个问题所属的“数学问题”,从而达到把设计语言转化为数学语言的目的。
分类的方法
再举另一个转化语言的方法,分类的方法,使用三分构图法,黄金分割法,三角形法则等规则判断图中主体位置是否合适,可以使用这4张构图,去判断任意的图片是否符合此构图方式,让机器可以通过简单的“判断题”的方式,达到让机器理解构图这件事。
目前人工智能可以告诉我们哪些事物具有相关性,但是无法把事物的前因后果描述清楚。比如在烹饪艺术领域,我们可以基于大数据挖掘到美食风味网络,但是无法表达食材搭配背后所隐藏的因果逻辑关系。
美食风味网络
每个节点代表一种食材,颜色代表所归属食物种类。节点大小反映了一种食材在菜谱中的普遍性。如果两种配料有显著数量风味的化合物共享,则表示它们之间有关联,链接的粗细代表两种配料之间共享化合物的数量。
机器是擅长完成分类任务的,只要有足够的数据,我们可以设计一种指标,根据阈值就可以很好地分类不同风格的艺术作品。
艺术之树
艺术风格的组织层级
早在1933年,美国数学家 George D. Birkhoff 就出版了他的《美学度量》(Aesthetic Measure)一书。在这本书中,他提出利用图像中发现的秩序数与图像元素总数之比,即秩序 O 和复杂度 C 对则一个事物进行审美度量,审美值 M= O/C。
利用审美值,以最小方差法计算矩阵距离,通过在距离阈值0.03处切割,获得由彩色树枝表示的14组风格的树形图。
情感弧线
自然语言处理和计算叙事学的最新进展使科学家们能够显著提升对于故事构成的情感分析。美国黑色幽默作家库尔特·冯内古特,创造了故事的“情感弧线”这个术语,定义为在x轴上显示故事时间(开始—结束),在y轴上显示情感轨迹(消极-积极)。
《哈利·波特》的情感弧线分析抓住了故事的主要高潮和低谷。以10000字窗口滑动文本,然后使用 hedonometer.org 与 labMT 数据集对每个窗口的情感倾向进行评估。
所有故事的情感弧线都不超过六种基本模式:“飞黄腾达”(上升)、"悲剧 "或 "家道中落"(下降)、"人在洞穴"(下降—上升)、"伊卡洛斯"(上升—下降)、"灰姑娘"(上升—下降—上升)、"俄狄浦斯"(下降—下降—下降)。
除了文学作品,对应社交网站上的用户评论,我们也可以采用情感弧线进行分析 :
还有对电影进行情感弧线的分析,总结出电影的故事模式:
- 创作工具,美学技术的载体
新的艺术创作工具,其实并不遥远,mixlab曾经介绍过一款runway的工具。最大的特点就是底层封装了很多的神经网络模型,用户只要像使用word一样,点选图形化界面,操作各种按钮,就可以完成模型的训练跟调试。
这款工具贴近用户习惯,适合现有的工作流,提供了非常多的插件,比如grasshopper、photoshop、unity3d等都有插件。同时,保持易用性足够强,完全图形化的界面,不需要敲代码即可训练我们的神经网络模型,内置了许多主流的模型,我们只需导入自己的数据,调参训练即可。
通过runway,链接了艺术创作者与机器。
综上,美学技术包括数据驱动、数学、分类等构造语言的方法,相关近似因果,分类即审美。而创作工具作为美学技术的载体,一个全新的领域正在形成,让我们期待美学技术、通用美学语言的诞生。
To Be Continued
……