导语:在图像集分类的任务中,用对称正定(SPD)矩阵来描述图像集,并考虑所得到的黎曼流形(SPD流形),已被证明对许多分类任务有较好的效果。本文考虑了SPD流形的几何特性及相关黎曼度量,并与欧氏空间的经典方法相结合,实现了图像集的分类任务。
引用格式
陈凯旋,吴小俊. 面向图像集分类的切空间稀疏表示算法[J]. 中国图象图形学报, 2018, 23(7): 961-972.
DOI: 10.11834/jig.170572
专家评价
将欧氏空间的分类方法应用于解决黎曼空间上图像集的分类,得到欧氏空间中分类算法的输入。本文算法在解决图像分类问题时能够改善分类效果,提升了分类性能。
本文看点
(1) 通过SPD流形特有的LEM度量,将SPD矩阵映射到切空间中;再对切空间的样本进行分类以实现图像集的分类。
(2) 使用NYSTRÖM METHOD和(2D)2PCA (two-directional two-dimensional PCA)两种方法的降维处理,运用了Log-Euclidean kernel来得到切空间的样本的在再生和希尔伯特空间的表示形式,从而也达到了降维的效果。
本文方法
通过矩阵的对数映射将SPD流形上的样本点映射到切空间中, 切空间中的样本点与图像集是一一对应的关系, 此时, 再将切空间中的样本点作为欧氏空间中稀疏表示分类算法的输入以实现图像集的分类任务。但是切空间样本的形式为对称矩阵, 且维度较大, 包含一定冗余信息, 为了提高算法的性能和运行效率, 使用NYSTRÖM METHOD和(2D)2PCA (two-directional two-dimensional PCA)两种方法来获得包含图像集的主要信息且维度更低的数据表示形式。
▲算法流程图
本文结果
实验对人脸、物体和病毒细胞3种不同的对象进行分类, 并且与一些用于图像集分类的经典算法进行对比。
实现结果表明, 本文算法不仅具有较高的识别率, 而且标准差也相对较小。在人脸数据集上, 本文算法的识别率可以达到78.26%, 比其他算法高出10%左右, 同时, 具有最小的标准差2.71。在病毒数细胞据集上, 本文算法的识别率可以达到58.67%, 在所有的方法中识别率最高。在物体识别的任务中, 本文算法的识别率可以达到96.25%, 标准差为2.12。
与一些经典的基于图像集的分类算法对比, 本文算法的识别率有较大的提高且具有较小的标准差, 对多种数据集有较强的泛化能力, 这充分说明了本文算法可以广泛应用于解决基于图像集的分类任务。
但是, 本文是通过(2D)2PCA和NYSTRÖM METHOD对切空间中样本进行降维来获得更低维度的样本, 以提高算法的运行速度和性能。如何直接构建维度更低, 且具有判别性的SPD流形将是下一步的研究重点。
▲ETH-80数据集中的部分图像
▲YTC数据集中的部分图像
▲Virus数据集中的部分图像
第一作者
通信作者
实验室简介
江苏省模式识别与计算智能工程实验室的研究方向定位于模式识别与计算智能技术。这些技术在物联网中有着广泛的应用,是物联网中智能信息处理的基础。
实验室依托“物联网技术与应用教育部工程研究中心”、“轻工过程先进控制教育部重点实验室”,以国家特色专业“计算机科学与技术”和江苏省优势学科“物联网技术与工程”为学科基础,开展模式识别与计算智能技术与应用的研究。近年来,实验室在模式识别、机器学习、计算智能等方面的取得了可喜的成果。
实验室中方负责人吴小俊教授是教育部新世纪优秀人才、江苏省“333”工程领军人才、江南大学二级教授、科研院院长。实验室外方负责人Josef Kittler教授,2016年中国政府“友谊奖”获得者,英国萨里大学杰出教授,英国皇家工程院院士,前国际模式识别协会主席。
领取专属 10元无门槛券
私享最新 技术干货