【新智元导读】长久以来,自动驾驶技术被划分为两个阵营,一个源自车企,由一群汽车电子工程师构成的“全区域部分自动驾驶”,试图将该技术以新功能的形式添加到汽车进而盈利。新智元上周的译稿“全球汽车巨头突围自动驾驶3大途径”中进行了分析,优势就在于可以利用现有汽车平台来整合并购新技术。另一个则是源自Darpa,由一群机器人学家构成的“特定区域全自动驾驶”派,以Google为首,试图通过大数据和人工智能技术来革新驾驶体验。
最近跟很多好友都探讨,在这么一个智能驾驶风口浪尖的时候,源源不断涌入的互联网企业,拿什么跟老牌车企和庞大的供应商链条抗衡?我个人的看法是,“智能驾驶”包含了智能和驾驶两个关键元素,如果在“驾驶”上暂时比不过人家的话,那就只能在“智能”上下功夫了,本文尝试通过汽车智能算法这个思路,讨论互联网企业的机会所在,谈谈方法论,谈谈可行性。
【特约编辑】小猴机器人,人工智能博士,自动驾驶技术爱好者,参与多个自动驾驶项目研发,有丰富的行业经验,尤其对决策规划控制方面了解深入。
一个绝佳的机会
我(非常主观地)觉得今天的汽车产业对互联网企业来讲是个非常好的机会。因为看到此情此景我会不由联想到几年前的手机智能化浪潮,到现在相信大多数人都会选择一个智能手机,而不是一个功能机(feature phone),那么会不会不久的将来,人人都会选择智能汽车,而非只是能开的汽车呢?
智能为王
由于缺乏对汽车本身的了解和积累,驾驶这件事情上,互联网企业看起来的确是比较怂的。长久以来互联网企业一直被问得最多也是疲于回答的一个问题就是:从技术上来讲,自动驾驶(确切来讲是全自动驾驶方案)到底靠不靠谱,为什么这么多家车企都在做也没拿出来东西你分分钟就几亿英里了?还自动上下匝道,是不是搞个噱头做一下股价?
幸好遇上了汽车智能化的浪潮,便可以利用自己大数据和智能算法的长项来尝试找到突破。一个直接的回答,技术是靠谱的,而且核心就是智能算法,扩展一点讲是,特定场景下的,现有技术基础上的,全自动驾驶。
自动驾驶是个大系统,软件和硬件都很重要,其中包括了驾驶员、车辆(底层、传感器和核心算法)、路(地图和路况场景),而难点在于对这三个核心元素的准确建模和理解,且当前都在探索阶段,不同团队侧重不同而已,接下来的看法非常非常主观。
1、Tesla、宝马和奔驰等是车企和供应商(Bosch),他们是为了卖车,因此会从车辆的角度来设计和推广自动驾驶系统,所以会存在一家供应商如Bosch和Mobileye搞定了某些模块或系统之后,很多车企就会“拥有”这项技术。我们在针对现有十几家自动驾驶技术提供方逐一分析以后,得出了它们都还是辅助驾驶阶段的结论,原因就是缺乏对三核心的把握,例如对驾驶员驾驶行为的把握,对技术所能应对场景的把握,以及对系统设计本身的把握。这会导致系统不断需要驾驶员监管并退出,反而让系统更不安全。虽然自动驾驶科目越来越多,但许多科目的实际使用窗口很小很小,因为驾驶活动充满不确定性,窗口条件太脆弱,极易被打碎。车辆行驶过程中充满不确定性,汽车如果是软件定义的机器,任何满足当前驾驶条件的自动驾驶窗口,无法知晓会维持多久,要随时随地准备切转到人工驾驶。因此,“自动驾驶”难自动,只是个陷阱而已。最近Tesla撞车比较轰动,究其原因还是因为系统对环境的感知部分缺失、驾驶员教育不到位以及决策上的失误导致,而以车企不开个百万公里不应对各种工况就不定型的思路,BBA很难说现在就推出自动驾驶量产产品,而他们的种种迟疑和反复,恰恰是互联网企业的机会所在。
2、机会既然摆在面前了,那么就有能不能吃下的问题,更是怎么吃的问题。我们毫不避讳一直参考Google的思路,确切来讲,我们是一直坚信轮式机器人的思路,源自Stanford、CMU、Berkeley和Darpa,也源自清华、北理工、西交大和无人车未来挑战赛,这些发生过且正发生的属于计算机自动化同仁而非车企的研究动向,给了我们非常好的后台支撑,让我们看到了弯道超车和以新搏旧的可能性,其中最有力的,就是智能算法。它能够很好的提供对周围环境从识别到理解再到决策甚至控制一系列的增强支持,让我们从一开始就能够奔着全自动驾驶技术而去。
3、AI不是没有问题的,机器学习也绝对不是万能的,说白了就是个相似度匹配么。对,是的,传统机器学习进行特征提取以及人工标注会耗费大量的人力,而这其实是很多车企和供应商在应用的方法,Mobileye有600个Labler,戴姆勒也采集并标记过数千小时的驾驶数据,所以,为了让手里这张王牌能够起到更好的效果,我们就需要从各个方面去促进,去约束来让它发挥最大的作用,这就是所谓的特定场景下,现有自动驾驶技术支撑下的,深度学习主导的改进版,并且会借助群体智能(Crowd Sourcing)的力量,来启发式地改进模型的效果。传统的专家系统是非常初级的,然而近年我们恰恰欣喜地看到现代围棋“专家系统”AlphaGo获得了非常令人鼓舞的结果。未来的专家系统可能不再会是规则库,哪怕是概率化模糊化的规则库,或者是一些一阶谓词乃至高阶谓词推理,而是一个非线性的复杂的难以描述的深度网络。
4、光有王牌也是不行的,要懂得打牌本身,而互联网企业的成长过程是伴随着对自动驾驶技术的深入理解的。从“传感器选型”来讲,Google的选择是可以提供附近五十米内360度无死角的环境模型,是目前比较周全和成熟的技术,而对于智能交通V2X也是时刻关注,一个问题是道路基础设施的改造是个综合性问题,需要从长计议,至少此时此刻很多的自动驾驶Demo无法用该技术全盘复现,而现阶段等待某项技术成熟是会错过时机的,当然自动驾驶框架对此是有所考虑的,它是核心元素“路”的一部分。从“驾驶经验不足”来讲,其实百年汽车设计的发展早已让车辆的人机工程学成熟,具体来讲就是三大控制量:油门、制动和转向,现有的电控系统如EPS和ESP也已能够将“速度/加速度控制”转换为“力/扭矩”,后面的事情其实是自动控制,具体可参见“车辆动力学控制 拉贾马尼著 机械工业出版社”中关于车辆动力学和车辆运动控制部分的内容。而对于多车及混合协同的问题,虚到模拟仿真,实到多车联试,少到一辆车,多到交通流,都有很多前辈的工作可以参考,如ITS 2010的“A Review of the Applications ofAgent Technology in Traffic and Transportation Systems”。互联网企业目前参与自动驾驶系统的工程师都是多年相关经验,人-》车-》路、传感-》感知-》决策-》规划-》控制都还是有一些积累,的确很多都是本科开始的,这一点并不逊色于车企。
5、说了半天技术,其实大家还是看Demo,虽说大家都做Demo,但难度有不同,更多时候车企还是面向部分自动驾驶,而互联网企业则是全自动驾驶。
最后,其实还想写一点关于互联网造车,来填补“驾驶”这块空白的事情,写不动了,过两天……
结语
最后,很多事情没做的时候大家也是想很多负面的可能性,但一旦想明白了,这些都会转化成动力督促着不断尝试前行,未来的可能性确实太多,而作为个体甚至单个的公司,也只能选择坚定一条路,我个人觉得互联网企业所选择的,应该是从智能这个长处出发的一条路。