行万里路,读万卷书,历来是人获取知识的两种途径,机器学习也不例外。
人类的所有创造总是有意无意地外化着自身,从结构到模式到发展历程,总能在人所创造的事物中找到和人相类似的地方,这种现象反映了人类对于自身的理解,也可以看成人类的思维局限。这种相似可能是结构的相似,比如计算机的cpu是心脏,硬盘是大脑,主板是身体,电就是粮食;也可以是模式的相似,比如网络的数据中心相当于人类的社团中心,各个节点相当于社团成员。很多产品或者模式可能处于发展之初,即使一时看不出来与人类的相似之处,也会在某个时刻和人类的结构和模式重合。
人在实践中认识到规律,将规律和应对办法结合形成经验,再将经验提炼和总结形成知识。知识就成了人类除基因以外另一个种群传承的载体。人工智能机器学习能通过数据发现经验自动改进算法,从而模拟人类认识世界的能力,给人类增添了一个重要的认识世界的手段。
人类认识世界一般有两个不同的途径和起点,一个是“行万里路”在实践中总结经验,形成知识,再运用到实践中,另一个是“读万卷书”从书本中学习知识,在实践中检验知识并修正知识,最终运用到实践中。
目前人工智能机器学习主要是靠大量的数据训练,相当于“行万里路”,靠着大量的实践总结出事物的规律,获取直接知识。类比人类获取知识的历程来看,这种获取知识的途径说明人工智能技术还处于发展的初级阶段,相当于人类刚开始产生知识,从大量的实践活动中总结经验提炼知识的阶段,还未进入从知识产生知识的阶段。而比对人类获取知识的两种途径,目前人工智能机器学习也出现了少量的直接获取规律性的知识,并应用于实践的模式。
比如google的阿尔法狗与人类棋手对弈,采用的是大数据训练模式,最终战胜人类棋手,而阿尔法元不再学习人类的棋谱,而是在掌握围棋的基本规则后,通过左右互博,仅仅三天时间,对弈达490万局,即成为与Master(阿尔法狗的进阶版)平起平坐的高手,40天后,即碾压Master,成为当仁不让的世界第一高手。这说明机器学习的两种途径都已经被人工智能技术所验证。
而目前人工智能技术的现状是绝大多数完全靠大数据,大家拼的只能是数据,所有的公司看重的是场景和场景下产生的数据,并应用在场景中解决问题的能力。但是参照人类获取知识的两种途径,人工智能技术还需要大力发展直接学习知识的模式。这种模式要求人工智能公司与企业、高校、研究所合作,甚至直接学习书本知识,完成从小学中学高中的课本知识,再完成大学各个专业课程,同时博览全书,从书本直接获取知识,再运用到实践中。
人工智能的三大要素是算力、算法和数据,算力相当于大脑,算法相当于心智,数据相当于粮食。算力方面已经完全超越人类几个数量级,人类社会二十多年的数字化也为机器学习准备了充足的食物,而目前通过数据进化算法的模式只是模拟了人类获取知识的一个途径,还需要采用直接获取已有知识,并学会人类以知识创造知识的能力,才能全面超越人类。
领取专属 10元无门槛券
私享最新 技术干货