这几天你有没有发现身边的人开始这样画蒙娜丽莎:
这样画炮台:
千万不要担心。并不是大家审美一起在沦陷,而是大家都在玩Google AI的一款小程序“猜画小歌”。
01
小歌,谷歌的歌。
“猜画小歌”是谷歌开发的一款关于绘画的微信小程序,在小程序中的分类是在线教育,除了给大众娱乐消遣外,也可帮助孩子认识一些新事物。
游戏玩法很简单,点击「开始作画」,根据提示的物体(比如狗、钟表或鞋子)进行自由创作,小程序会使用Google AI 的神经网络去识别你的画作,如果被识别为正确,则进入下一关。游戏期间还可以分享,并不断收集新的题目和图画。
02
游戏虽然简单,但一上线就成功占领了朋友圈话题榜,实属不简单。更不简单的是“猜画小歌”让许多平日里没有绘画经验的人开始画画,甚至培养了一批“灵魂画手”,“艺术创作”之余,画手与画手之间的battle也不断上演。
然而,这并不是一场公平的battle。在排行榜里,连续猜出几百题的画手里鲜少有真正擅长画画的,那些被AI小歌认可的画作,都是很简单,甚至让人不能理解的。这着实让有一定绘画基础的朋友愤愤不平,他们纷纷抛出质疑:既然喂了这么多数据,为什么我的小歌还是表现得像个智障?
比如,你画的斑马是这样的:
系统认可的斑马却是这样的:
为了画出“动物迁徙”你辛苦画了两只行进中的驯鹿,但实际上,小歌需要的只是几只大雁,像这样:
为什么在小歌的眼中,“随意的简笔画”反而能战胜“充满细节”的作品呢?
其实这也不能怪小歌,原因在于它背后的技术。“猜画小歌”采用的是递归神经网络(RNN)的技术。
绘画过程中,AI小歌可以知道你在涂鸦时会如何起笔、如何走笔、在哪儿停笔,却无法像人一样判断抽象的作品。打个比方,就像写字,如果你按笔画顺序写,也许只要写上几笔,AI就已经猜出你写的是什么字了,同理,如果你能在大的形体、笔画上跟常规简笔画相似就很容易被AI认可。
所以冲关诀窍其实很简单。
诀窍一:抓住特征
画猫的尖尖耳朵和三根胡须,画蚊子突出尖尖的嘴,画蒙娜丽莎先画个画框。
诀窍二:先勾勒大形状
画脸先画圆圈,画高楼大厦先画个长方形,小歌多猜几次总能猜对。
同理,想要为难小歌,你只需要反其道行之。画图时先画细节,笔划反着来,这样无论你画得有多像,AI小歌可能都识别不出了。
所以,愤愤不平的朋友可以安心了,并不是你画的不够好,只是你画得太好了。
03
2016年,谷歌曾推出网页版你画我猜——quick,draw!一经上线就风靡全球。截止今年五月,这款网页游戏已经收集了来自全球100多个国家和地区的五千万份画作。谷歌没有将其独享,而是在谷歌上开源了数据库,为开发神经网络训练的研发人员提供样本。而本次谷歌微信小程序上线,刚好弥补了中国画手的数据空白。
到底递归神经网络(RNN)是什么?
图片来源:网络
其实也挺好理解。打个比方;人类的大脑并不是空白的,在你阅读这篇文章时,你会基于已有的对词语的理解来推断当前词语的真实含义,也就是我们的思想在成长过程中拥有持久性。而RNN就是包含循环的网络,允许信息的持久化。
通俗点说,AI 通过神经网络认知世界的过程,与婴儿最初认知世界的过程颇有点异曲同工的意思。人类通过认识图片、绘画等方式培养孩子对事物的认知能力,绘画并不一定像照片一样逼真,但包含了事物的显性特征,比如鸟有翅膀、椅子有4个脚、人脸有两只眼睛一个鼻子一张嘴等。基于这些学习,人类可以逐渐理解世界练。
小歌利用RNN技术对大量涂鸦样本的学习,找到出不同事物的特征点。除了特征点,数据训练也可以给AI动态的画图过程,让AI理解人类在画某一事物时通常第一笔先画什么、如何走笔、何时停笔。这也解释了为何有时在你画第一笔时,小歌就能给出答案。数据库规模越庞大,结果准确率越高。
04
谷歌于2016 年宣布,从Mobile First(移动先行)转向AI First(人工智能先行),彻底成为一家把人工智能摆在第一位的公司。
通过机器深度学习的技术,让旗下的产品变得更加智能。研制自己的AI芯片,智能助手Google Assistant,还有基于计算机视觉的Google Lens现在的ARCore,当然还有谷歌推出的机器学习软件Tensorflow。
而“猜画小歌”则是谷歌尝试重返中国消费市场的最新行动,谷歌已经宣布将在北京设立一个人工智能研究中心,那将是其第一个位于亚洲的AI研究中心。
“猜画小歌”确实让更多人接触AI,理解AI。这是一个开始,让人们“有机会体验一下人工智能的交互现在是多么自然”。
即使,这个人工智能好像并没有那么智能···
来源:华泰期货
领取专属 10元无门槛券
私享最新 技术干货