加州大学洛杉矶分校和美国陆军研究实验室的研究人员提出了一种新的方法,通过在数据驱动技术中添加基于物理的意识来增强人工智能驱动的计算机视觉技术。
这项研究发表在《自然机器智能》杂志上,概述了一种混合方法,旨在改善基于人工智能的机器实时感知、交互和响应环境的方式,比如自动驾驶汽车如何移动和操纵,或者机器人如何使用改进的技术进行精确动作。
计算机视觉使人工智能能够通过解码数据和从图像中推断物理世界的特性来观察和理解周围环境。虽然这些图像是通过光和力学的物理原理形成的,但传统的计算机视觉技术主要集中在基于数据的机器学习上,以提高性能。基于物理学的研究已经在一个单独的轨道上发展起来,以探索许多计算机视觉挑战背后的各种物理原理。
将对物理的理解(控制质量、运动等的定律)纳入神经网络的开发中一直是一个挑战,在神经网络中,人工智能以人脑为模型,拥有数十亿个节点,以处理大量图像数据集,直到他们了解自己“看到了什么”。但现在有一些有希望的研究方向,试图将物理意识的元素添加到已经强大的数据驱动网络中。
加州大学洛杉矶分校的这项研究旨在利用数据中的深层知识和现实世界中的物理学知识,创造一种具有增强能力的混合人工智能。
“视觉机器最终是在我们的物理世界中完成任务。”该研究的通讯作者、加州大学洛杉矶分校萨穆埃利工程学院电气和计算机工程助理教授阿丘塔·卡丹比说,“感知物理的推理形式可以使汽车更安全地驾驶,或者使手术机器人更精确。”
研究团队概述了物理学和数据开始结合到计算机视觉人工智能中的三种方式:
将物理融入人工智能数据集为对象添加附加信息,例如它们的移动速度或重量,类似于电子游戏中的角色。
将物理融入网络体系结构通过网络过滤器运行数据,该过滤器将物理属性编码为相机拾取的内容。
将物理学纳入网络损失函数利用建立在物理学基础上的知识,帮助人工智能解释其观察到的训练数据。
这三条调查线已经在改善计算机视觉方面取得了令人鼓舞的结果。例如,混合方法允许人工智能更精确地跟踪和预测物体的运动,并可以从被恶劣天气遮挡的场景中生成准确、高分辨率的图像。
研究人员表示,随着这种双模态方法的不断进步,基于深度学习的人工智能甚至可能开始自己学习物理定律。
领取专属 10元无门槛券
私享最新 技术干货