隐私计算从技术机制来看,主要分为三大技术路线,即安全多方计算(密码学)、联邦学习及机密计算。简单来看,机密计算通常为数据集中式,而安全多方计算与联邦学习数据则为分布式,本篇白皮书介绍联邦学习应用的安全现状,分析了联邦学习在应用中面临的安全问题,并针对以上痛点问题,提出了联邦学习应用的未来发展建议。
个人认为本篇白皮书主要有两点价值:1、了解联邦学习技术体系与应用情况;2、了解联邦学习技术存在隐患,对业务发展过程中技术路线的选择提供参考价值。
整理三点主要内容如下:
一、联邦学习技术体系
根据参与方的性质,联邦学习可划分为跨机构 (cross-silo) 联邦学习和跨设备(cross-device)联邦学习。
根据多方训练数据样本和特征空间的异同,联邦学习可划分为横向应用与纵向应用。
根据技术架构的不同,联邦学习可以划分成中心化架构和去中心化架构。
二、联邦学习应用情况
1、跨机构应用是目前联邦学习应用最主要的应用形态;
2、中心化架构在联邦学习产品中占比最多;
3、半诚实敌手环境是当下联邦学习主要的应用环境;
4、密码技术是当下联邦学习产品的主要安全保护技术。
绝大多数联邦学习产品使用了同态加密,在各类安全保护技术中处于第一梯队;秘密分享、不经意传输、安全密钥交换等安全多方计算技术处于第二梯队;差分隐私技术、其他加密 (对称密码、非对称密码、Hash 函数)和混淆电路技术属于第三梯队,其他安全保护技术还包括如布隆过滤器、梯度扰动。
三、联邦学习应用安全现状与问题分析
白皮书对于联邦学习应用的安全风险整体如下图,然后针对每项风险又做具体解释,以第一条为例,数据泄露类风险报告从安全攻击和联邦学习流程维度两个视角进行分析,如从安全攻击角度论述,数据泄漏又细化为存储敏感信息未经加密或脱敏、用户隐私数据泄露、结果类数据泄露等。
领取专属 10元无门槛券
私享最新 技术干货