本文由人工智能观察编译
译者:Sandy
据外媒报道,来自英国的一组研究人员在短短20分钟之内就教会了一辆自动驾驶汽车在正确车道上行驶——这是一个令人印象深刻的壮举,毕竟人类司机永远无法达到一个这样的成绩。
Wayve是一家由剑桥大学工程学院的研究人员创建的公司,该公司于6月28日在一篇博客文章中详细阐述了其“强化学习”算法。可以说,是一名人类安全驾驶员与这个算法一起,用了15-20的分钟时间,教会了一辆自动驾驶汽车如何保持在正确的车道上。
事实上,人工智能的强化学习在之前就已经被证明是非常有效的学习手段了。举个例子,DeepMind的技术显示,它可以让AI学会下围棋或象棋,而OpenAI则教会了人工智能玩Dota 2,并且每天的训练量可达人类180年的游戏量。
在围棋或者Dota 2这样的复杂游戏中击败人类玩家固然令人感到惊讶,但是教一辆车学会自动驾驶无疑是另一个重要的里程碑。该研究小组在YouTube上发布了一段视频,展示了其人工智能系统的学习过程,并表示这是“自动驾驶汽车领域利用强化学习的第一案例”。
一开始,这辆车就像一个新生儿学习在台阶上行走。当汽车逐渐偏离路线时,坐在车上的安全驾驶员就会介入,掌控方向盘,将它引回正确的轨道。对算法来说,它会发现,每次被介入都是因为自己出错了,同时还会因为不受干预的情况下行驶的距离受到“奖励”。
视频讲述了一种被用作“深度卷积神经网络”(Deep Convolution Neural Network)的模型。该模型接收单个图像输入,只使用一个GPU进行处理。与其他自动驾驶汽车不同的是,Wayve改装的雷诺汽车不需要“大量的传感器以及无尽的数据”,而是根据该公司的理念,利用了“可以快速进行有效学习的聪明的训练过程”。
Wayve的联合创始人Amar Shah今年5月接受TechCrunch的采访时表示,他们希望给汽车以更好地大脑,而不是更多的硬件。同时,根据Wayve的官方说法,这些算法正在变得越来越聪明。
接下来,他们计划进一步扩大这项技术,以完成更复杂的驾驶任务,而不仅仅是停留在车道上,最终希望这个系统可以“驾驭交通信号灯,行驶在环形车道以及交叉路口”。
(文中图片来自网络)
领取专属 10元无门槛券
私享最新 技术干货