智能时代
人工智能就在你我身边
未来如何定义
是科技之光还是毁灭之剑
它会有哪些前沿应用?
基本原理是什么?
目前还存在哪些技术局限?
机器又是怎么学习的?
严洪院长做客《世纪大讲堂》
揭开人工智能的神秘面纱
【嘉宾介绍】严洪,中国香港城市大学科学及工程学院院⻓,曾在耶鲁⼤学从事医学成像研究并获得博士学位,也曾在网络公司从事研发工作。严洪教授研究⽅方向包括文字识别、图像分析技术,他也展开跨学科合作,在探索基因功能、寻找肺癌靶向治疗药物耐药性的机理等方面做了⼤量研究。严洪教授做客《世纪大讲堂》,为我们分析人工智能技术的应⽤与局限。
节目完整视频
人工智能的应用
人工智能在许多的领域,如在商业、工程、自动化、保健、娱乐等方面都有广泛的应用。人工智能究竟能做什么事情?先来看四个实验室中的例子。
口型模拟
第一个,就是将人工智能应用于语音跟口型的匹配。在做动画的时候,手工调整动画角色的口型是很困难的。而人工智能,通过数据分析、机器学习的方法,可以达到以下三点要求:首先,人工智能可以处理多种语言,不管是外语还是汉语里的方言对它来说都是小菜一碟;其次,计算机的操作更加灵敏快捷。在视频制作时,常会出现1秒钟就有20帧的情况,所以匹配口型时速度是非常必要的;第三,人工智能使能开口讲话的动画角色不再限于人物和动物,连车也可以说话。这就增加了动画的娱乐性。
表情识别
第二个应用是面部的表情识别。经过导入数据,分析数据,机器学习,人工智能就可以找出人脸位置,然后识别面部表情。基于这项技术,就可以自动为一张人像照片配上相应的音乐或符号,对这张照片进行加工或标记。
细胞分裂过程
第三个应用是对细胞分裂和基因功能的分析。要分析细胞分裂过程,就需要人工智能的帮助。在细胞分裂的过程中,实验人员用激光扫描测量其不同的深度,构成三维的图像;每隔一段时间都要对其进行扫描测量,将不同时间下得到的图像进行对比,就得到了四维信息。而在这些冗杂的四维信息中,要对每一单个细胞进行跟踪,追踪子细胞跟母细胞的关系,将子细胞与母细胞进行匹配。这就需要大数据分析,在这项研究中有20TB的数据,这一切单靠人脑是很难完成的。
此外还有在研究癌症的靶向治疗的抗药性方面的应用。肺癌是癌症当中死亡率最高的癌症。倘若此时有位肺癌患者,我们采取让他服用靶向治疗的药物的治疗方式,一开始患者的病情确实会好转,但一年以后,病情状况常又会恶化。导致这个问题的罪魁祸首就是抗药性。什么是抗药性呢?药分子与致病蛋白质结合,蛋白质就无法致病。但是蛋白质也很灵活,随着时间推移,它会变形,药分子无法再与变形后的它结合,它就可以继续致病。这就是抗药性。现在有了人工智能,研究人员就可以对不管是国外那些发表过的,还是在中国香港本地采集到的所有变体进行分析;将变体与药的匹配,它们的三维的结构都进行比较。然后按照分析出的数据,医生可以去改换药物,或者通过数据分析可以帮医生制定一个很好的治疗方案。
人工智能的原理
现在大家比较感兴趣的,用的比较多的是基于机器学习的人工智能系统。机器学习有三个主要的部分:分别是特征提取,降维,还有分类器。基本的原理都很简单,并不那么神秘。
一张图有大量像素,假如图的大小是1000×1000,那像素就有100万个。实际上,我们只需要取最重要的那一部分信息,拿这部分信息来做分类。要实现这一目的,有两个方法,一个是特征提取,另外一个就是降维。
人脸表情识别
什么是特征提取?以人的表情识别举例,表情跟头发、耳朵、脖子和衣服都没关系,实际上,这个表情只与眼睛、嘴附近点的移动有关。所以我们只需要把这些点取出来。这就是特征提取。
那什么是降维呢?如图,一些点要用两维的坐标来表示,A跟B,要用X1、X2来表示。因为你要描述位置信息。但是现在把坐标轴转一转,变成U1、U2。要描述这些点的位置就只需要U1,不需要U2,U2起不了什么作用,在U1中间划一条分界线,两类就分开了。所以这就降了一维。假如说,要处理的数据维数很高,达到百万,那么降的维数就也会很高。也就是说,数据量就会减少很多。
机器学习的第三个概念就是分类器。例如要调查天气冷不冷,在不同的温度和风速下我们收集了一些数据,A代表不冷,B代表冷。我们画一条分界线,A与B就被区分出来了,这就建立了一个分类器(如左图所示)。但如果我们调查更多的人,或者在更多的情况下去调查,数据多了(如右图所示),分界线必须调整以后,分类才会更加准确。所以结论就是,要提供很多的数据,去“训练”和“校准”分类器。准确度才会高。
A:不冷,B:冷
人工智能是无敌且万能的吗?
多层神经网这个概念在八十年代就已经出现了,现在的“深度学习”只是再进一步,可以调整更多的参数。深度学习确实会比其他的方法更好,也得到了很多的应用。但是它也是有一定的局限性的。例如,机器对因果关系,逻辑推理问题就非常难处理;有时候它还会发生莫名其妙的错误;另外机器学习必须要求有大量的数据去训练,十分繁杂。
机器人确实可以帮人做事。但是并不是每件事都可以做。
把人类智能跟人工智能进行比较,就会明白机器人不会打败人类。计算机在数值分析、加减乘除、解方程方面很厉害,而人算数字能力实际上还是有限的。在处理大数据方面,计算机的能力人类也难以企及。但是,人可以分辨低质量的图片,而计算机做不好。人类拥有灵活性,常识,和创造力。但计算机是不是有创造力仍然存在争议。其实,计算机的程序是人写的,那么创造力终归是要归结于人的。
未解决的问题
第一个问题就是图像的特征提取。在研究方面,降维跟分类器技术相对比较成熟,但是特征提取,我们知道的还是很少的。实际上,对如何实现计算机的“看”这个问题,许多领域的科学家都有研究。什么是看?你可能觉得这个问题简单得莫名其妙,但计算机去完成这个工作却是很困难的。“看”就必须把相对应的数学公式写出来,这个数学公式仅对一张图有用是不行的,即要有“普遍性”。但我们在这方面的研究还远远不够。
第二个问题是高阶数据分析。从正负数到向量再到矩阵,在上个世纪五十年代,六十年代到八十年代,计算机科学家花了很多的精力将矩阵计算研究清楚。更高阶的数据,称为张量,它们可以对机器学习提供新的模型。关于张量的许多问题还不是很清楚,值得研究和探讨。
人工智能和计算机技术发展的比较
人工智能和计算机技术发展过程有很大的不同。第一台数字计算机是1943年开始建造的,当时这个计算机占据了180个平方米的面积,重量达50吨,花费很多人力物力。但是当时人们对计算机的期望是很低的。只要做加减乘除就行了。计算机实现放音乐、看电影、做自动控制,都是后来逐渐开发的功能。
世界上第一台计算机
人工智能不一样。一开始声势浩大,概念很好。很多人去做,但是对它寄予的期望太高,希望它直接达到人类智商的水平。但事实上,人工智能几上几下都没有达到这个目的。仍然有很多的问题还没有解决,需要我们进行进一步的创造性研究,也需要在理论上或者技术上有重大的突破。
总之,为了使人工智能提高性能,我们需要超越现有的方法,进行高风险的研究;除了大数据分析之外,还需要研究与具体问题相关的基本原理。
编辑:二丫、张尧、蒙小度
领取专属 10元无门槛券
私享最新 技术干货