近期,东京工业大学的研究团队发布了一套格斗训练系统「FuturePose」,该AI系统可以实时预判侦测对象0.5秒后的动作,颇有武侠小说中“看穿敌人动作”的风范。
小编特意去找了技术介绍视频并人工翻译加了中文字幕,方便大家了解。
实验表明,FuturePose系统可以使用普通的RGB相机实时记录下对象的运动情况,并推测其未来0.5s的动作。该系统首先用 RGB 图像推测对象2D关节的位置,然后把对象2D关节的位置输入至深度神经网络中,分析其时序特征,从而预测未来的姿态。为了加速计算,还采用了稀疏光流法。最后把预测的2D关节位置喂给线性回归网络,构筑成3D姿态。
目前,该系统主要用于格斗训练,相信该技术经过不断地完善,可以更广泛的应用于竞技体育及娱乐项目中。
本文中涉及到的知识点:
线性回归、残差网络(ResNet,2015年提出,用于解决深度网络中的副作用:梯度消失、梯度爆炸等)、LSTM(一种循环神经网络,用于处理和预测时间序列中的问题)、光流法(我也不懂是啥,查了一下是计算机视觉中常用的计算相邻帧之间物体运动信息的方法)
如果想要对本文中的知识点进一步了解,欢迎后台留言、共同探讨。