把视觉识别技术应用到医学里的影像识别和影像诊断,可以协助影像师做出更准确的医疗判断。
--马克·迪圣尼蒂
2018广州国际创新节
卡内基梅隆大学兼职副教授、路博特人工智能公司首席执行官--马克·迪圣尼蒂
发言主题:人工智能和道路维护的创新
根据现场发言整理,全文5433字,阅读需15分钟
道路很早以前,在人类的历史上就已经存在了。之后我们要对路况进行勘探,因为我们要了解路况的情况,让我们交通工具,比如汽车在上面更加安全、更加稳定地通行。过去其实有一个人坐在一个慢慢前行的椅子上,沿着这个道路去观察,去勘测这个道路上有没有什么问题。并且手动地记录在记录表上面:道路的哪个位置,出现了什么类型的问题。在这样一个状态,持续了大概2000年,人类在道路的勘测方面也都是保持在这样的做法,一般是工程师,坐在一个厢车里面用仪器进行道路的勘测,但是以人工操作为主的一种操作,第一就是他的判断会比较主观,去判断这个道路的问题是什么类型,什么程度。同时它很耗时,而且是一个比较危险的过程,所以大致是靠人们的视觉去进行判断。在这个过程中作为人,靠视觉来慢慢地判断,效率是非常低的,每一米的道路可能要花很长的时间去进行一个勘测。如果要去勘测现在的这些大城市,像广州,可能是2万、3万,甚至更长的道路,那么在这个过程当中,要靠人从视觉去进行判断,这样的判断不仅存在主观性,而且非常耗时。
一个X光片请五个放射科的医生来看,都可能会产生五种不同的结论,有些人可能会觉得这个人是癌症晚期,他们可能会在某些观点上达成一致,但是他们在判断癌症晚期的过程中,对癌症的一些具体症状,具体表征可能会产生不同的分歧。所以不管在欧洲、美国、日本、韩国,在道路的勘测上面,实际上都存在着这样一个问题。同时花了很大的成本去对道路进行勘测,进行维修。所以如果我们要去对道路上面的障碍或者路况进行一些预测性的勘测,大概会有三四十个,甚至五六十个的特征,能够帮助我们去进行一些预判。也就是说,它的表面是出现了问题,但这些是路面表面的问题,是我们裸眼看不到的路面底下的一个表象,一个表征,所以路面的勘测是非常重要的。不仅仅是能够找到一些路表面的问题,还能更多地告诉我们,在看不到的路面底下可能存在着什么样的潜在风险。
所以为了去提升路面勘测的效率,我们研发了道路维护和勘测的人工智能设备。我们用到的是机器的深度学习,深度学习其实跟机器的学习是有一些差异的,这里面有两个方面让我们通过机器的学习来看表面的问题。第一,自上而下的方法,假设我现在有一个拼图,我希望把这个拼图拼到一个大的版图里面,那么我就有一个图像,这个图像是一棵树的图像,按照这个树的图像去进行拼图,这是传统意义上让机器学习。但是有一个更加复杂的基于计算机辅助的一种深度学习,深度学习实际上以像素为单位来进行图像的识别和图像的拼图,所以在这样一个像素为单位的层面上,机器学习的精准度会更高,机器学习的效率也会更好。所以我们是以像素为单位,从表面去识别这个图像,然后在计算机的辅助下更加准确地进行图像的拼图和图像的识别。
而且它是客观的,不会有任何的人为的主观解读,也不存在多种可能性的风险。所以假设我今天按照传统的方式,派出10个勘测员,勘测同一条道路,他们很有可能对于同一条路况上的问题出现不同的判断,就像拿X光片给不同的医生看,他们可能也会有不同的结果。所以如果通过机器来进行识别的话,它的精准度会更高,会更加的客观。另外一个就是机器识别的效率会更高,人的裸眼来去识别的话,可能只能识别20%、30%,作为机器来学习路况的问题,它的识别率会大大地提高。所以现在机器在视觉功能上已经有了很多非常先进的技术。当我们在人工智能上赋予它这些先进视觉的技术、功能的时候,它就能够成为一个非常出色的道路勘测员。14年前的视觉判断大概只能够判断狗和马之间的区别,那个时候的视觉识别技术是非常粗糙的,非常不成熟的,但是现在视觉识别技术比过去精准了很多,能够帮助我们收集到更多的数据,并且在数据的基础上,通过算法的协助对图象识别生成更加精准的结果,所以说如果你现在想要建立你的公司,就要去看现在有何种机器技能是可以在很大程度上达到人的能力的,比如说视觉技术,它在很大层面上能够接近于人对于许多图像的识别能力。
把视觉识别技术应用到医学里的影像识别和影像诊断,可以协助影像师做出更准确的医疗判断。我们来看一下具体的步骤,首先收集数据,其实从商业模式来讲,数据是我们商业模式成功的一个重要要素。不管是大的城市的路况勘测,还是小的城市,我们都希望能够收集到数据,之后我们可以去通过安装应用程序在手机上面收集数据。如果所有的数据只是让客户来收集,而我们不去对这些数据进行深度分析,不去制造人工智能的话,我们就不能拥有成功的商业模式,所以我们这种商业模式的成功要素更多的是来自于深度的学习。不仅仅是说数据的收集,而是基于这个收集的数据,我们会有一个深度的学习,之后我们才能够对路面进行精准的勘测。
我们收集了数据后通过网络把它传到云的平台上,我们就有了一个魔法盒,这个魔法盒其实就是基于深度的学习,基于算法,对这些数据产生出以人工智能为基础的路况分析。例如这是底特律道路的数据收集,包括洛杉矶一些路况的数据,他们都是我们的终端用户,最终传送给他们的结果就是一个地图,这个地图是满分为5分一个路况评价,1、2、3、4、5分表明路况勘测的结果,这个路况是在几分的级别,比如说美国的路况相对来说差强人意,我个人觉得日内瓦的路况最好,而且美国路况参差不齐,道路的质量上会有些比较大的差异。那么从这个地图上你可以看到这条道路上一些具体的问题,存在何种路况的潜在危险。同时需要几个要素发生,才能够产生一个深度学习的平台。
首先是数据的质量必须要保证,这个要素做到位了,数据才能够去保证机器的学习是正确的。因此,第一个就是去看路面上边缘的部分,很有可能会被错误识别为道路的一个部分。如果说我们把它的边缘误识别成为道路的一部分,那么机器可能就会认为这个路面出现了一个缝隙,因此我们要做一个清晰的框架去区别哪个是天界,哪个是地界,这样不会把这些被误识别的边界作为一个路况的裂隙。我们要观察路况,以及这些资料的情况,研究数据的储存,这样可以对其地理位置以及路况有一个整体的意识。我们知道整个路况地形之后,就可以完成一个矩阵图,把收集到的数据以及图像进行归类,先前我们做过一个路况的矩形图,大概12英里的路程长度。这个评测是非常有创新性的,在美国人们经常抱怨路况,每一个美国人都认为,在美国的道路维修中存在腐败或者一些诈骗的情况,导致了不好的路况,尽管每个美国人都持有这样的想法,但这并不是真实的。从路面图可看到路面的部分数据,并且我们可以为路况的信息收集贡献我们的一部分数据。
所以我们知道这个路上哪里有路况,以及一些路面不平的情况,并且从自己家的信息网就可以看到这个路况。这些数据可以与总的系统进行一个融合和整合。这是非常具有创造性的一个融合,是高度透明的。现在我们有超过100个客户,我们产品通过直接销售给大多数的客户,许多客户是在美国或者美国以外的城市。中国现在正在创造修建自己的路况图,CCC他们项目承包给承包商,这些项目规模比整个美国的规模还要大,所以我们的项目可能会持续几个世纪,它会是一个通过整合路况以及数据去实现数据整体传播的大项目,可以从中国一直延至东欧。我们希望能够参与到这个大数据整合的流程当中,通过参与做出自己的贡献,和公司共同成长。
而世界的路况图是怎么发展的,我们现在使用不同的技术去探测机动车、汽车的移动方式,有三个传感器,它有360度激光以及用以探测路况和汽车的运行情况的探测工具。最后它们会融合到整个的数据群里面,进行自动化的处理。他们希望用三位一体的方式来进行汽车的探测,当把车去开到道路进行一个路况的探测时,他们就可以知道实时的路况,现在BNW也在使用这个技术。我们的客户都坚信系统是需要正常运作,并且能够监控到实时路况的,包括铁路和公用事业等等。在铁路方面,广州和其他城市没有什么区别,铁路围绕着城市的外围铺设而成,然而美国电线的布设则是一整条路的架构。
我们希望在电线附近能够种植绿植,约有四分之三的路在公用电线杆旁是有绿植的,但成长情况都不好。路边的一些基础设施,比如说栏杆,有很多的颗粒物附在上面,而这些颗粒物事实上会腐蚀周边的基础设施。在美国,有很多的城市出现了这种情况,我们有着大量的电线杆,所以我们需要去解决这些问题。比如在广州,我们要解决电线杆周围植被生长的问题,许多路牌会受到栏杆上颗粒物的影响。为了保护周边的基础设施,我们需要持续地进行监测,找出解决方案,而我们的系统就可以去收集到这些数据并且进行处理。这种商业模式,首先收集数据,收集数据是成本最低的,最简单的方法就是实时收集路况,收集信息并整合成一个系统,每一条路的情况相互连接在系统里,对系统进行整体的监控。如果马路上某一台车出现了异况,比如驾驶员在车上使用手机,或者司机偏离了正常运行,都可以实时地反馈给客户。我们与两个大运营商进行合作,在两个美国的大城市投放试验项目,进行一个打包式的路况整合服务,收集每一台车的实时驾驶情况去提供反馈。
所以路况的收集,是有形的,可收集的,可相互融合的。在加州,有些人会到处乱停车,甚至人行道上都会看见违章停车,这严重地干扰了交通秩序和市民生活。但找到那些违章停车的人我们现在暂时还做不到,更多的是做路面的路况勘测,识别它潜在的风险。从这个诉求可知,人们在意路况的程度是足以使其去为此付费的。我们通过人工智能深度学习去提升路况勘测,我不知道未来在中国会不会有类似的技术应用,但是在美国已经投入应用了。
大概十年前,我们觉得路上至少50%的车辆可能都并非私人拥有,而是车队所拥有的。比如说特斯拉、福特、丰田,他们会有自己的车队,并且把车队租赁作为一项服务。现在美国的道路上约有260万辆是车队所拥有的,如果将这260万辆车与车队的公司做数量比较,在美国,拥有庞大车队数量的公司有十几个。对于这些公司,如果我们能够提供更好的工具进行路面勘测,更高质量的路面能带来更低的成本,由于每一家公司拥有的车队数量足够庞大,通过更精确的路面勘测可以节省高额的车辆维修费用,损耗的成本也能大大地减少,那么他们就会愿意为此而付费。
现在,在美国已经有不少人工智能道路维护的设备被采用。对于我们来讲,作为一个私家车的拥有者,我们更在乎的可能是自己的成本,我的车在这样的道路上行驶是否给我带来了很大的成本。但一个私家车车主的影响力是有限的,因此在美国推动这个市场发展的,很可能是我刚刚说的拥有庞大车队数量的大企业。他们发现道路作为一个基础设施,如果质量差强人意的话,会带来很大的经济损失,他们会为此而付出代价。我们的客户不仅包括欧洲、美国、中国,也包括发展中国家,因为在发展中国家,其路况不好,可能不仅仅是车辆的维修成本,同时很有可能造成生命的代价。所以对于我们来讲,通过勘测来去提升道路质量,这就是我们提供的服务、技术最终想达到的目的。
您认为未来来说,对于大湾区来讲,那么人工智能发展有什么样的优劣?在中国它有什么样的优劣?
在中国来讲,中国市场最大的一个优势,就是人口众多,国土面积也非常大,这意味着我们可以收集到样本量非常大的数据,以微信为例,微信这种海量数据实际上对于机器学习,教授机器,以及测试机器是非常重要的。人工智能关于两点,在我们的业务当中,我们讲到了一个学生,一个老师。这个机器就是我们的学生,我们要去教他学会很多的东西。而老师就是那些算法的研发人员,包括大学的研发人员、我们的工程师,他们都是教师的团队,他们要去教会这个系统去学习。很多时候即便是先进的人工智能,其学习都离不开数据,实际上不管我们拥有多么聪明的、多么顶级的算法师,或者工程师,如果数据的质量不能保证,那么这个人工智能是不可能高效的、有效的学习的。其实有了大量的数据以后,加上这些专家在自己领域里面的专业技能和知识,结合起来,才能够去教会人工智能更多的技能,所以我想大数据也是中国市场中显而易见的优势。另外有的人会认为人工智能可能会去掌控人类,其实我们是很难把技术的发展局限在某一个空间。这个技术毫无疑问是会延展的,不会因为国界而受到局限。因为过去人们会觉得某个国家掌握了某个技术,就实际上给予了它一个掌控人类的先机,但看看人类历史上技术的发展,它可能先来自于某一个技术领先的国家,但是最终这个技术会延展到全世界,让全世界受益的。
对于路面图的测绘,不同的政府可能有不同的要求,政府对于这些事情可能会有不同的态度,他们是开放的态度去欢迎这些技术,还是说持比较保守,比较抵制的一个态度?
这个其实对于任何人来说都是一个需要考虑的问题,因为从市政的工程里面收集数据,假设在欧洲,在欧洲和澳大利亚,哪些是可以被我们所捕捉的,哪些是不允许我们捕捉的,他们是比较呆板的,比较保守。而另外有一些国家愿意你去收集数据,像美国政府,他希望这些数据不要离开自己的国境,比如说我们会传到云的平台上,但是要保证这个云平台的数据不会在其他的国家所应用,要保证这个国家享有对这些数据的所有权。所以不同的政府对于我们收集数据,确实是会持不同的态度。对于亚洲和欧洲而言,我觉得他们的态度还是开放的,但是他们对于数据隐私的保护是非常严格的。我们知道欧盟不久之前推出了数据隐私的保护法,所以他们更多在意的是这些收集到的数据的保护。我想在未来,国家政府也确实要意识到数据的重要性,否则,基于人工智能的一些技术比如无人驾驶就不可能得以大规模的商用。
领取专属 10元无门槛券
私享最新 技术干货