机器之心报道
参与:张倩
终于,「联邦学习」也有专著看了。
最近一段时间,某银行向「大客户」泄露用户银行流水的新闻引发了热烈讨论。对此,央视新闻点评道,「别把用户信息扔出池子」。「如果轻易将用户信息扔出池子,那任何企业和机构都『中看不中用』,势必丢掉广大用户,也要受到法律惩处」。
要做到「不把用户信息扔出池子」,除了需要依靠银行等部门严格遵守规定,还需要技术的加持。近几年兴起的联邦学习就是基于这个目标提出的。
联邦学习也叫联邦机器学习。数据是机器学习的基础。而在大多数行业中,由于行业竞争、隐私安全、行政手续复杂等问题,数据常常是以孤岛的形式存在的。即使是在同一个公司的不同部门之间,实现数据集中整合也面临着重重阻力。在现实中想要将分散在各地、各个机构的数据进行整合几乎是不可能的,所需的成本也是巨大的。
同时,各国都在加强对数据安全和隐私的保护,欧盟最近引入的新法案《通用数据保护条例》(GDPR) 表明,对用户数据隐私和安全管理的日趋严格将是世界趋势。
针对数据孤岛和隐私安全这两大问题,谷歌和微众银行分别提出了不同的联邦学习框架,而后者的背后就是微众银行首席人工智能官、香港科技大学计算机科学与工程系讲席教授杨强带领的团队。
联邦学习是多个数据拥有方组成一个联盟,共同参与全局模型的训练。各参与方之间在保护数据隐私和模型参数的基础上,仅共享加密的模型参数或者加密的中间计算结果,而无原始数据共享,让数据可用不可见,且联合构建的模型可以达到更优的模型性能。
随着数据安全方面的法律、法规不断完善,越来越多的公司、机构将隐私安全提上了日程,也有越来越多的研究者投身其中。那么,对于那些想要入门联邦学习的研究者来说,有什么系统的资料可以参考呢?
最近,杨强教授领衔出版了一本专著——《联邦学习》,这是首部全面、系统论述联邦学习理论、算法、平台及应用的中文专著。
这本书剖析了联邦学习与数据安全、隐私保护的前沿学术成果,内容涵盖隐私保护技术,联邦学习定义、分类、算法和系统,联邦学习激励机制等。此外,作者还论述了联邦学习在计算机视觉、自然语言处理和推荐系统等领域的应用,以及如何解决用户隐私、数据安全及联邦学习应用落地问题。
这本书可以作为计算机科学、人工智能和机器学习专业的学生,以及大数据和人工智能应用程序开发人员的入门参考书,也可供本科高年级学生或者研究生、大学的教员和研究机构的研究人员阅读。
杨强:国际「迁移学习」与「联邦学习」带头人
杨强教授是微众银行的首席人工智能官和香港科技大学计算机科学与工程系讲席教授。他的研究兴趣包括人工智能、机器学习和数据挖掘,特别是迁移学习、自动规划、联邦学习和基于案例的推理。
他是人工智能领域「迁移学习」、「联邦学习」的发起人及带头人之一,迄今共发表人工智能和数据挖掘方面的论文数百篇。
2013 年 7 月,杨强当选为 AAAI 院士,是首位获此殊荣的华人。2016 年 5 月,他又当选为 AAAI 执行委员会委员,也是首位出任该职位的华人。
在 1 月 11 日清华大学发布的「AI 全球最具影响力学者榜单」中,杨强与何恺明成为人工智能学科子领域 Top1 顶尖学者中仅有的两位华人学者,其中杨强教授入选的是经典 AI(AAAI/IJCAI)领域。
2018 年,杨强教授出任微众银行首席人工智能官(CAIO),带领微众银行 AI 团队开源了全球首个工业级的「联邦学习」技术框架 Federated AI Technology Enabler(FATE),并牵头推动联邦学习 IEEE 国际标准的制定。
今年 1 月初,杨强教授还当选为 AAAI 2021 大会的主席,成为 AAAI 大会历史上第二位大会主席,也是当选此职位的首位华人。
除了杨强教授之外,参与本书撰写的还包括微众银行 AI 部门的高级研究员刘洋、程勇、康焱,微众银行 AI 部门的副总经理陈天健,新加坡南洋理工大学计算机科学与工程学院助理教授、微众银行特聘顾问于涵 5 人。他们都参与了联邦智能使能器(Federated AI Technology Enabler,FATE)的联邦学习平台的开发。书中的许多思想来源于这个实践,因此具有实用性。