作者 | 张泽宇 编辑 | 庞超
今天给大家介绍天津大学张长青老师等人在IEEE T-PAMI 2020上发表的文章“Deep Partial Multi-View Learning”。为了提高在视图缺失情况下的多视图学习性能,增强潜在表示的完备性,本文在给出多视图的完备性和通用性定义的基础上,基于提出的CPM-Nets算法,引入对抗策略,对缺失视图进行处理,提高了模型的完备性,并提出一种非参数分类损失进行优化。
一、研究背景
1.1 背景
1.2 相关工作
当然,也有一些方法可以不进行数据补全,如基于分组等策略的方法。
二、模型与方法
2.1 CPM-Nets模型
对于含多个视图的每个数据点,都构建一个统一表示h,用于表示该数据点在各个视图下的完备信息。对于每一个视图,构建一个分解函数f,用于将统一表示h映射回对应单视图下的数据表示。将数据标签也视为一个视图,在各视图之间条件独立的假设下,分解的条件概率如图1,其中y为数据标签,S为部分视图集合。通过最大化这个条件概率,可以得到统一表示。
对于每个视图而言,视图下的原数据与h分解回该视图下的数据相比,损失量越大,其分解概率越小,构建损失与概率关系如图2。
图3. 对数似然函数
进一步,我们构建分解损失的具体表示,其中snv为0或1,用于表示视图数据是否缺失。
在分类标签方面,则有分类损失函数如图5,其中φ为h的特征映射函数,T(y)为类别y的潜在表示。
综合来看,CPM-Nets的算法流程如图6。
2.2 CPM-GAN——引入对抗策略的CPM-Nets
生成对抗网络GAN(Generative Adversarial Networks)可用于缺失数据的补全,它一般由两部分组成,即用于学习数据分布的生成模型G和用于辨别数据为真实或为生成的判别模型D。通过两者对抗,可以使双方都逐渐表现出较好性能。一般来讲,其目标函数如图7表示。
在CPM-Nets中,对于缺失的视角采用了去除忽略的策略,而在CPM-GAN中则采用补全策略。对于缺失的视角,图8中的损失代价对其进行补全考虑。
CPM-GAN的算法流程如图10所示。
图10. CPM-GAN算法流程
三、实验结果
其中,图11为不同视图缺失度下各个算法的分类任务性能对比,图12为不同视图缺失度下各个算法的聚类任务性能对比。其它实验对比详见论文原文。
图11. 不同视图缺失度下各个算法的分类任务性能对比
图12. 不同视图缺失度下各个算法的聚类任务性能对比
四、总结
本文提出了基于各样本和各视图信息的多视图数据表示学习方法,且对于随机的视图数据缺失现象,也能够表现出较好的性能。本文引入对抗策略处理视图缺失,提高了模型的表示完备性。与现有的许多模型不同,本文的模型能够较好地处理任意数量视角的样本,并对复杂的视图缺失数据模式也有很好的效果。
参考文献
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有