行人再识别技术,是人工智能+安防领域的新兴技术,正处于飞速发展的过程中。今天,华泰科捷给大家进行行人再识别技术的技术层面的剖析,来一起看看吧~
行人再识别的深度学习
行人再识别的深度学习方法通常有三个步骤:首先,在训练集上训练一个分类网络。然后在网络收敛之后,用它全连接层的输出作为特征表达。最后,对所有的图像特征,计算其欧氏距离,判断他们的相似性。
这个过程就出现了一个问题:卷积神经网络中全连接层的每一个权重向量,往往都高度相关。这导致了每个全连接描述中个体之间的相关性,在基于欧几里得距离时会影响检索性能。
欧几里得距离计算
SVDNet
针对卷积神经网络中相关性过高的问题,王生进教授团队用SVDNet提出了解决办法。
卷积神经网络
它也是建立在通用图像分类的深度学习网络基础上的 ,和之前的通用网络几乎没有什么差别,差别在于特征表达层会用一个具有正交权矩阵的Eigenlaye来代替传统的全连接。
2017年,王生进教授团队推出论文《SVDNet forPedestrian Retrieval》,同年,ICCV发表SVDNet。
张弛迭代法
有了SVD去相关过程后,额外设计了一个训练步骤,叫做张弛迭代法。通过严厉和放松的迭代(RPI)训练框架,我们可以在卷积神经网络训练中迭代地整合正交性约束,生成所谓的SVDNet。
在紧张训练时,性能表现提升,在松弛训练阶段下性能不变,甚至略微降低。但总体的趋势是上升。
未来的目标和挑战
王生进教授团队在两个典型行人序列数据集上,基于时空信息的行人识别准确率分别比现有最高方法提高了5.7%和16.3%,但未来还有很多需要解决的问题。
我们都会发现实验模型在有的数据集上性能表现很好,但换到另一个难度更大数据集上,性能就会大幅下降。在面对真实复杂的外界环境,运用起来往往效果会更差。
另外就是当模型在一个数据集训练完之后,去另一个数据集测试,性能会出现非常明显的下降,这个下降是不允许的。在实际运用中,我们不可能对每一个相机采集到的数据都进行一定程度的标定,我希望在十多个相机的训练结果后可以泛化到很多没有标定数据的相机下,这样我们才能部署一个非常实用的系统。
王生进教授对于行人再识别做出的贡献有目共睹,未来,我们期待着他的团队能再行人再识别技术上争取更大的突破!
领取专属 10元无门槛券
私享最新 技术干货