【新智元导读】本文作者为龙星镖局。过去的2016是属于AI的,我们能透过不同渠道感受到AI浪潮。似乎经过去年的发展,AI已经取得了很大进步,那么,2017我们还能期待些什么?
1. 从人机大战到机机大战
从AlphaGo到Master,Google DeepMind引领着全球的AI浪潮,其先后战胜了全世界各大棋王,取得了令人难以忘记的颠覆性胜利。虽然面对这个结果,人类还未放弃,而且依然还有不少专家为人类棋手支招,试图偷上几场胜利,但在围棋领域,机器的智慧已经超越人类是不争的事实。 笔者在国外的朋友也告诉我说:DeepMind团队目前已经比较满意Master的表现,很可能在不久的未来不再对其投入过多的人力和资源进行更新优化。
按照先前的约定,2017上半年柯洁还会和AlphaGo(或许现在应该叫Master了)来上一战,但还有多少人期待最终的战果呢? 与其再看一场波澜不惊的机器虐人大战,何不来场还有点悬念的机机大战呢?事实上,这场机机大战很可能上演,而且对手可能离我们还不远。具体是谁虽未有定论,我们不妨借镖局当时发起的关于“Master是谁”的投票结果来大胆猜测一下吧。
2.AI原材料数据交易市场的破处?
去年继续有像FeiFei Li、Alex Smola这样的知名学者加入工业界,一方面是由于开的薪水的确不错,一方面则是由于工业界大数据的吸引力。按照当前AI work的机制来说,可谓“得数据者得天下”。所以我们会经常看到创业公司一方面四处找人才,一方面是四处找数据。事实上,一些不太在明处的数据交易已经在快速跟上, 但目前的数据交易还是非常简单粗暴,数据有多大价值、如何定价、如何合法、如何保证隐私等诸多问题都没有解决(或许可以参考计算广告领域的数据购买的一些机制)。2017年,非常期待AI数据交易市场能有好的进展。
3.AI开源大格局明朗
2016年是各种AI软件集中爆发的一年,甚至引起了圈内大咖的某些担忧,如网上爆出来的余凯老师的声明。截止目前,笔者认为AI开源趋势基本清晰,被大公司选择的那几款的大软件已经站好了队,2017的开源格局会进一步明朗。后来的开源者会更多集中在子方向的精耕细作,想再做出类似TF这样的大软件的机会不能说没有,但后来者的机会很小。
4.AI研究实验平台的发展
2017我会前所未有地期待更加接地气的研究实验平台的进展。这里的接地气不是指一定要靠近实用,而是希望有更适合科学研究的能公开、公平、公正的实验平台。希望在新的平台下, 研究者实验的代价进一步降低,把做实验很多繁琐的预处理步骤的效率提升,把实验结果的客观性做到最大。另一方面,学术界也真的急需统一实验平台的支持。不少实验室现在做实验的成本很高,比仿说要搞深度学习吧,你得买几块GPU吧,买完后你还得搭环境吧,然后你还得搞点大数据吧,诸如此类的事情会把实验的成本推的很高。很期待产学研能深度合作,搞一个这样的平台出来,解放研究者。
5.GAN继续红火
生成对抗网络(Generative Adversarial Networks, GAN) 被认为是近年来最令人amazing的突破,其在学习机制上的创新意义是异常巨大的,可以说是一场革命。但目前GAN还有诸多问题,很多人看了GAN的科普材料,不知道有几人认认真真读了GoodFellow的原始tutorial?笔者春节期间用了两天时间精读了一把,但完后的感觉是:不读不知道,一读吓一跳。GAN的坑很大,非常大,除了做法是已知外,基本剩下的都是未知了。GAN的应用肯定会继续推进,我们也不用担心其show出来的效果。但圈内人更加期待的是GAN为什么能work,就是不知道也行,你能告诉我怎么训练能保证它work也可以,我想这方面的研究2017年不会少。
6.小数据学习会有进步
深度学习+大数据俨然是当前AI的标配,但像我这样的有志之士(嘿嘿,假装一下大牛感觉还不错)一直在呼吁AI研究要回到更接近人本真智能的方式上来,小数据学习就是人类学习的一个重要方式。去年已经有文章在小数据学习上做了一些尝试,但还有很长的路要走。笔者认为,小数据学习要成功,一种目前比较靠谱途径是借助大数据学习的红利。简单来说,就是要用大数据辅助小数据学习,大家熟悉的无监督、半监督、迁移学习等等本质上都是这种思路。但这还不够,因为这些模式无法利用差异比较大的数据,一种理想的方式会是数据变成领域知识,领域知识变成通用知识,然后用通用知识+领域知识来辅助小数据的学习。
7.深度学习在NLP上的进一步突破
在前两年,人们谈论深度学习时还经常说只在语音、图像上有效果,在文本上还有待突破。这一突破很多学者认为至少在机器翻译领域已经发生:科学研究上看NLP相关的主流会议和期刊上,深度学习的占比持续走高;而实际应用中则以Google翻译上线基于深度学习的全新版本线上系统(对应论文Google`s Neural Machine Translation System: Bridging the Gap between Human and Machine Translation)为重大突破标志。但NLP领域其他子方向上深度学习还未取得如此瞩目的进展,一方面有学者理性分析深度学习应用于文本数据的一些根本问题,一方面还有更多积极的尝试在发生。相信随着两派持续对文本场景的更深理解,更适合NLP的神经网络会呼之欲出,让我们保持期待。
8.AI产品创新
AI技术在持续进步,AI产品上大的变化却稍显滞后。全球视角上,大家都看好的医疗,去年其实没有太惊喜的AI应用问世,反倒是英美科技人员研发出来的人工智能法官(使用AI技术预测审判结果)令人耳目一新。而传统的自动驾驶、下棋、知识竞赛、机器人、问答之类的应用更多也只是停留在demo阶段,离人们预期的真实产品还有一段距离。中国视角上,近一年国内比较红火的是共享单车,但严格意义上来讲,这和AI其实没太大关系,更多是上一个浪潮移动互联网下的产品创新。综合国内外,人工智能应用并没有人们预期的进展那么快,这其中有很多问题,比如技术问题、政策法规问题等等。这里着重提一个产品上的问题:基于固有的产品形态直接套用AI技术,可能会出现兼容问题。AI产业需要更多懂AI、也懂产品的同学来一起努力,把人们对AI的美好憧憬变成真正能落地的产品。
9.媒体主义AI何去何从
微博上看到有人发明“媒体主义AI”这个词,个人甚是喜欢。媒体眼里的AI,其实就是大众眼里的AI,而所谓圈内人眼里的AI,此时反而相对小众了。从朋友圈里各大专家对AI媒体的评价里能听到好声音的不多,但这并不代表AI媒体就真的做得很差。对一个科技媒体是否有价值的评判标准可能还是更多地看市场,特别是资本市场对其的评价。资本市场投不投你,就看你有没有价值,这是真金白银的点评,cost很大,更有参考意义。
个人层面,我平常也看AI媒体获取信息,甚至还在某大号的选题会里偶尔纠正个翻译。个人感觉媒体人做AI报道有他们自身的优势,知道什么大众会喜欢,什么容易引起共鸣,怎么样组织文章普通读者能看得更有意思。这类媒体对AI的宣传和普及是几篇专业论文难以比拟的。但媒体人也有自己的缺点,一篇报道专业层面的价值和作用是他们不擅长的,所以你会发现太多的报道比较雷同,深度也不够。至于现在大家一直诟病的国内科技报道多是翻译国外的,这可不能怪媒体人了,国内这方面的内容确实太少。在这里也呼吁大家别光埋头憋英语论文,可以多写点中文的文章啊,特别是给“我爱计算机”和“新智元”这样的良心媒体。
10.AI泡沫会破么
回答这个问题,要先搞明白什么是泡沫。关于泡沫论,近两年我观测了一些现象,发现泡沫论大多是这个领域的技术人员最先抛出来的。看待这个现象有两个方面:1)技术人员懂行,一般也比较理性,所以比较客观;2)技术人员懂得太窄,不了解市场,所以比较主观。其实,一个方向是否有泡沫,泡沫有多大往往不是技术人员能说了算的,更应该从市场供求这个基本点出发分析。远了不敢讲,我目前认为2017年应该还好,大家可以老老实实继续干活了。
另外一点特别想说下。一个新方向的起步刚开始需要大量资源去破冰,如果不能描绘出一个大蓝图,就争取不到足够的资源去支撑其发展。而任何事情要想做成,有很多资源的投入是其成功的一个必要条件。在某种层度上,新科技就像拍电影,一定要源于生活,又高于生活,没有泡沫,就没有泡影,没有泡影,又怎么影射出高于生活的美呢?
11.国内AI是否已和美帝看齐?
这个问题真的不好讲,不是我这一般人能说得明白的。不过,既然大家都看重数据,不妨看看开复老师微博上分享的那个资料。具体我就不贴了,材料的数据大概是说目前我国在AI领域的科研成果不差于美帝,似乎还有点领先。但这个事情吧,隐藏了两个问题:科研成果的价值不好判断,即使是发表在同一期刊上的两篇文章价值也不好说;而且一个科研成果的价值不能用当前价值,更客观应该是过些年回头来看其价值。不管怎样,这些都只是表面,我们不妨回到事情成功的要素来看。AI要想成功,市场大小、人才储备、政策法规、市场成熟度等是要齐头并进的。我不能回答国内AI是否已和美帝看齐,但我想这次我们没有在起跑线上落后太多。
12.如何赶上AI浪潮
有些人担心自己资源不多,没法投入太多精力在AI方面,但又很担心错过这波浪潮,后面追赶的成本会更大。对于这个担忧,首先你要明确AI是否真的对你的业务会产生巨大的积极影响,是否是你业务成败的关键?如果答案是yes,那么就努力去做AI,注意AI是要做的,不是看的、学的,赶紧做起来就比别人领先了一点。当前AI相关的资源开源是大趋势,基于开源的软件做些上面的应用是性价比最高的AI解决方案。但如果AI相关的人员其他资源不到位,也可以直接使用各大巨头提供的云上的AI服务。但条件再好一些的企业,还是特别建议成立自己的AI团队的,这样可以做到有的放矢,应用AI技术的效率也会提升很多。至于那些觉得AI对自己业务没多大影响的朋友,也建议你关注AI的动向,说不定哪天对AI的需求就冒出来了呢。