Lantao Liu 及其在印第安纳大学伯明顿分校车辆自主与智能实验室(VAIL)的团队致力于帮助机器人更好地在复杂且有时变化的环境中导航,同时提升其评估和处理数据的能力。这项挑战在环境建模领域具有重要应用。该团队正在开发自主和机器学习方法以及开源库,以期对人工智能和机器人社区产生潜在益处。
“机器学习算法正越来越多地被开发用于机器人任务。许多关键的自主组件是数据驱动的,数据来自机载传感器,如激光雷达、声纳和摄像头,” Liu 说道,他同时也是该大学智能系统工程系的助理教授。
“由于尺寸和有效载荷有限,机器人通常计算能力较弱,却需要实时处理数据以进行在线学习,” 他补充道。“不幸的是,许多解决这些任务的方法涉及巨大的计算成本,这对机器人来说极具挑战性。关键挑战既是计算理论上的,源于随机建模复杂性的增加,也是实践上的,源于硬件和软件系统的集成以及在机器人上定制算法所需的协同。”
Liu 获得的 2019 年某机构机器学习研究奖允许 VAIL 访问并利用某中心的云计算工具和服务数千小时,从而推动了他们在机器学习和自主系统方面的工作。
“我的实验室致力于解决各类机器人(包括空中、地面和水下车辆)的各种决策问题。我们的目标是开发方法论,使自主机器人能够在环境感知与建模、搜索与救援以及其他具有社会重要性的应用中增强其自主性和智能,” Liu 解释道。
环境感知、建模与监测
VAIL 研究人员正在推进的一个项目涉及一种过程,通过从不同位置收集相应的测量样本来映射感兴趣的环境属性(例如水或空气中的污染),从而可以重建一个“分布图”(环境模型)。
“这种映射机制也称为环境状态估计,这是一个学习过程,其中必须使用机器人收集的连续传入采样数据来学习底层环境模型的参数,” Liu 解释道。
“然而,环境可能是动态的,需要映射的相关环境属性也可能是动态的。使用机器人的一个缺点是样本收集需要一系列连续、有序的采样操作(因此数据可能无法很好地代表真实地图),并且整个采样过程非常耗时,因为样本通常分布在不同的空间位置。”
“为了在任何时候都能很好地估计环境状态,机器人信息收集感知必须是持续的,以跟上不断变化的环境动态,” Liu 解释道。“我们研究的一个重点是开发原则,使用数据驱动方法来引导机器人学习时空和随机环境模型,并利用学习到的模型进行路径规划和决策制定。这反过来有利于后续建模和监测的未来环境探索与利用。”
VAIL 团队一直在开发能够准确表征时空环境的方法和软件,其方法是基于高斯过程的一种变体设计一个非平稳建模框架。
“地图并非处处相同,” Liu 说。“地图上有些位置的变化比其他位置更快,我们需要准确地建模快速变化和缓慢变化的部分。当底层地图是动态的时,例如在映射污染扩散时,挑战更大。”
“此外,”他解释道,“模型计算必须快速,以便进行即时决策。然而,感知数据是连续接收的,累积的数据很快就会压垮机器人的计算资源。为了提高学习性能,我们的研究人员最近开发了一种自适应学习方法,其核心思想是一种稀疏近似机制,能够增量地将新的传入数据与由‘总结性’旧数据支持的学习模型相结合。”
机器人异常检测
在一个相关项目中,该实验室一直在开发一个通用的机器人异常检测框架,其灵感来自现场实验。
“通常,机器人在现场会遇到感知和行为异常,” Liu 解释道。“例如,自主水面船(ASV)的一个推进器可能在操作中发生故障,导致前进运动变为转向运动。或者 ASV 可能被水生植物或其他水下障碍物卡住,这些障碍物很难通过摄像头或激光雷达感知。惯性测量单元(IMU)可能对外部干扰(如磁场)敏感并提供漂移读数。周围物体,例如岸边的树木,可能会阻挡 GPS 信号,导致定位不准确。声纳数据也可能受到动态水下物体或环境干扰的影响。”
“具有韧性和适应性的机器人系统需要认知能力来避免异常,并在最少人为干预下从故障中恢复和学习,” Liu 补充道。“为机器人配备自我检查能力以检测感知和行为故障是至关重要的一步。异常检测的直观想法是开发某种正常性的概念,并将明显偏离该概念的行为视为异常。”
“为各种应用中不同类型的机器人的预期行为手工制作模型是困难的,甚至是不可能的,” Liu 解释道。“该框架通过深度表示学习和图神经网络来学习正常性概念。我们以半监督的方式使用对比学习训练该框架,利用了大量未标记数据和(可选地)少量标记数据中的信息。在开发此框架期间,AWS EC2 实例极大地加速了原型设计、训练和测试过程。我们目前正在完成这个框架,并将开源软件。”
“希望,”他补充道,“它也能广泛惠及机器人学和机器学习社区。”
越野自主性
该机构的机器学习研究奖也帮助了 VAIL 研究越野自主性。
“一个重要挑战是意外机器人行为的随机建模,”他解释道。“基本上,在现实世界复杂环境中操作的机器人需要推理其与环境的物理交互的长期结果,但由于现实世界的高度复杂性,通常不可能以精确的方式预测未来事件。”
“例如,” Liu 说,“不平坦的路况或各种干扰对机器人运动的影响很难精确建模(或从数据中学习)。对机器人与环境之间的交互进行建模更具挑战性,尤其是在环境动态变化时。其他具有代表性的场景包括无人机在强风中飞行或潜艇在洋流下移动,其中空气和水流在空间和时间上都有显著变化。”
“因此,机器人在决策时必须考虑这些由于缺乏精确环境建模而产生的认知不确定性,”他解释道。“我们使用马尔可夫决策过程作为基础,来模拟不确定性下的自主决策问题。这些问题的解决方案是一个闭环策略,该策略在机器人与环境的概率交互模型下,最大化长期目标并满足安全约束。原则上,只要概率模型能够很好地描述世界的不确定性,并且计算方法允许机器人在合理的时间内计算策略,所得策略就能生成一系列电机命令,以完成人类分配的任务。”
“然而,” Liu 继续道,“许多现实世界的问题并非无关紧要,获得所需的世界概率模型通常是不可能的。我们的研究重点是通过开发新方法和利用 GPU 的强大计算能力来解决这两个挑战。我们当前的重点是通过开发两种规划算法来解决挑战的计算部分,这两种算法允许机器人基于核方法(无网格)和有限元方法(基于网格)来推理其在复杂地形表面的连续运动。两种方法都利用一组离散元素来表示连续空间上的价值函数。离散部分上的计算可以并行化,这使得我们的机器人能够实时推理和计算最优策略,以安全高效地导航通过复杂地形。”
VAIL 研究人员一直在研究使用采样方法来优化一类参数化策略。
“为此,我们首先需要在当前策略下采样大量机器人轨迹,这可以通过 Nvidia GPU CUDA 核心的并行架构快速计算,” Liu 解释道。“他们使用基于梯度的方法来优化策略参数:通过基于采样轨迹计算策略参数梯度来更新策略。梯度计算和策略更新涉及大型矩阵运算,这些运算也可以通过 GPU 并行化以实现实时解决方案。他们为此任务利用了某机构的计算资源。”
用于导航的可通行空间分割
Liu 指出,该机构的资源对他们团队的视觉自主研究也非常有用。视觉信息对于机器人自主性变得越来越重要,因为它可以提供有关周围环境的丰富信息,由于深度神经网络的突破,VAIL 的视觉数据处理能力得到了显著提升。为了开发处理视觉感知的深度方法,团队需要开发具有复杂学习架构、海量数据以及各种训练策略的模型。
“移动机器人在未知环境中导航的一个关键能力是构建无障碍空间,机器人可以在其中移动而不会发生碰撞,” Liu 解释道。“机器人专家一直在开发方法来检测这种自由空间,通过激光雷达射线的光线追踪来构建二维或三维空间中的占据地图。使用激光雷达的建图方法需要处理大量的点云数据,尤其是在使用高分辨率激光雷达时。作为一种便宜得多的替代方案,摄像头也被广泛用于自由空间检测,其方法是利用深度神经网络对图像进行多类或二值类分割。”
“然而,”他补充道,“大多数现有的基于深度神经网络的方法都建立在监督学习范式之上,并依赖于带注释的数据集。这些数据集通常包含大量像素级注释的分割图像,对于户外环境中的机器人应用来说,获取这些数据的成本极其高昂且耗时。为了克服完全监督学习的局限性,我们一直在开发一种基于变分自编码器的新深度模型。我们的目标是基于表示学习的框架,使机器人能够以无监督的方式学习可通行空间分割,旨在学习一种折线表示,以紧凑地勾勒出所需可通行空间的边界。这与普遍的分割技术不同,后者严重依赖监督学习策略,通常需要大量的像素级注释图像。”
“我们使用 GPU 和公开数据集中的数据训练了我们的模型,” Liu 解释道。“某机构上大量的计算核心和内存空间使我们能够快速、高效地训练模型。这一点至关重要,因为它使我们能够快速测试和重新设计模型,并为将训练好的模型部署到机器人系统提供了极大的便利。”
“然后,我们用真实任务环境中收集的一小部分未标记图像训练模型,” Liu 补充道。“早期测试表明,我们的模型能够以高精度实时检测可通行空间。某机构提供的计算资源极大地加速了我们的设计过程。”FINISHED
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。