部署DeepSeek模型,进群交流最in玩法!
立即加群
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >只看这一篇就够:快速了解联邦学习技术及应用实践[通俗易懂]

只看这一篇就够:快速了解联邦学习技术及应用实践[通俗易懂]

作者头像
全栈程序员站长
发布于 2022-11-15 10:05:36
发布于 2022-11-15 10:05:36
6.7K0
举报

随着大数据的进一步发展,重视数据隐私和安全已经成为了世界性的趋势,同时,大多数行业数据呈现数据孤岛现象,如何在满足用户隐私保护、数据安全和政府法规的前提下,进行跨组织的数据合作是困扰人工智能从业者的一大难题。而“联邦学习”将成为解决这一行业性难题的关键技术。

今天和大家分享下咱们微众银行AI团队主导的新一代联邦学习技术及应用,并详细介绍联邦学习落地的全球首个工业级开源平台—— Federated AI Technology Enabler(FATE)。

我们在Github也发布了这一项目,地址:FederatedAI/FATE​github.com

想要进一步了解联邦学习及FATE,还可以前往官网:www.fedai.org.cn/cn/

主要内容目录:

  • 联邦学习背景介绍
  • 纵向联邦学习
  • 横向联邦学习
  • 应用案例
  • FATE:联邦学习开源平台

联邦学习背景介绍

首先和大家分享下联邦学习的背景。

1.AI落地的理想与现实

AI 落地的时候,其实并不容易,会遇到很多现实的问题,比如:

  • 现实中,我们的数据质量是非常差的,例如聊天数据中有很多噪音;
  • 数据标签,收集是比较困难的,很多场景中的数据是没有标签的;
  • 数据是分散的,(这也是最重要的一点)每家应用的数据不一样,比如腾讯用的是社交属性数据,阿里用的是电商交易数据,微众用的是信用数据,都是分散来应用的。现实中,如何进行跨组织间的数据合作,会有很大的挑战。

2.国内数据监管法律体系研究

从09年到现在的10年时间内,国家关于数据的法律条例是趋向于严格化的,同时趋向于全面化,每个细分领域都纷纷出台了相应的条例和条款。相对来讲,让之前可行的一些数据合作方案变得不太可行。

3.基于联邦学习的技术生态

针对上述问题,微众银行AI团队提出了基于联邦学习的技术生态,特点如下:

  • 数据隔离:联邦学习的整套机制在合作过程中,数据不会传递到外部。
  • 无损:通过联邦学习分散建模的效果和把数据合在一起建模的效果对比,几乎是无损的。
  • 对等:合作过程中,合作双方是对等的,不存在一方主导另外一方。
  • 共同获益:无论数据源方,还是数据应用方,都能获取相应的价值。

4.联邦学习的分类体系

联邦学习的分类体系,包括:

  • 纵向联邦学习,两个数据集的用户 ( U1, U2, … ) 重叠部分较大,而用户特征 ( X1, X2, … ) 重叠部分较小;
  • 横向联邦学习,两个数据集的用户特征 ( X1, X2, … ) 重叠部分较大,而用户 ( U1, U2, … ) 重叠部分较小;
  • 联邦迁移学习,通过联邦学习和迁移学习,解决两个数据集的用户 ( U1, U2, … ) 与用户特征重叠 ( X1, X2, … ) 部分都比较小的问题。

下面,重点分享下纵向联邦学习和横向联邦学习

纵向联邦学习

1.联合建模需求场景

举个例子:微众与合作企业进行联合建模,比如做信贷逾期模型,微众有 Y 数据,包括标签数据,逾期记录,用这样的数据可能会建一个很好的模型,但我们希望用更多的数据,比如合作方的标签数据和画像数据来更大的提升风控模型的效果和稳定性。

传统模式的问题是:

合作企业缺乏 Y 无法独立建立模型,需要微众把 Y 数据,带入到合作方的生产环境建模,但是由于国家的数据保护条款和各企业自身对数据的严格规定,得到的 X 数据不能全量的传输到微众。

针对这个问题,可以通过纵向联邦学习来解决。如上图右边部分展示,两边的数据都有共同的ID,特征是完全不一样的,可以通过一方特征来弥补另一方特征的不足。

2.同态加密技术保护隐私

纵向联邦学习的技术实现,首先应做好两点,来保护数据隐私:

  • 建模样本 ID 差集不向对方泄露,在合作之初需要进行用户匹配,需要找出用户的交集,但是不能泄露差集,因为这是企业最核心的资产。
  • 任何底层 ( X,Y ) 数据不向对方泄露,建模过程中如何保证数据不被泄露。

解决方案:

  • 通过 RSA 和 Hash 的机制,保证双方最终只用到交集部分,且差集部分不向对方泄露。
  • 采用同态加密技术,这个过程中,各方的原始数据,以及数据加密态都没有被传输。交互部分,双方通过损失中间结果,用同态加密的机制进行交互,模型训练完之后,会各自得到一个模型,各自的模型会部署在各自的一方,就是如果我只提供了3个特征,那么我只有3个特征的模型,只提供2个特征,就只有2个特征的模型,任何一方的模型都没法单独去应用,只有共同应用的时候,才能进行决策。

3.基于隐私保护的样本 id 匹配

刚才提到基于隐私保护的样本id 匹配,和大家分享下具体的技术方案。比如,A 方有 [u1,u2,u3,u4] 四个用户,B 方有 [u1,u2,u3,u5],那么整个过程中,如何保证双方知道 [u1,u2,u3],而 A 方不知道 B 方有 [u5],B 方不知道 A 有 [u4]?

这里是通过RSA 和 Hash 的机制做到的,B 方会作为公钥的生成方,会把公钥给到 A 方,A 方基于 Hash 引用一个随机数,再交互传给 B 方,B 方同时做 Hash 然后传给 A 方,A 方会最后做一个结果的交集。整个过程中,你可以看到没有任何一个明文数据传递过来,即使采用暴力或者碰撞的方式,依然解析不出原始的 id。通过这套机制,我们很好的保护了双方的差集部分。

4.同态加密

分享了匹配过程中隐私保护的问题,接下来分享一个通用的技术,同态加密。

刚才提到建模过程中,引用了同态加密技术,比如对两个数字进行加密,加密后两个数字的密文可以进行数学运算,比如加法,其结果依然是密文,对密文解密后得到的结果和它们明文的加法结果是一样的。

通过这样的同态加密技术,我们把它应用到机器学习,包括特征工程中。接下来会重点介绍,联邦机制下特征工程和机器学习建模的一些细节。

我们知道特征工程是机器学习建模中非常重要的一环,在联邦机制下,如何完成联邦特征工程?尤其 A 方只有 X 没有 Y,如果想做一个 WOE 或者 IV 值的计算是非常困难的。那么如何在联邦学习的机制下,A 方利用 B 方有 Y 的数据计算 WOE 和 IV 值,且在这个过程中 B 方没有泄漏任何数据?

首先,B 方对 y 以及 1-y 进行同态加密,然后给到 A 方,A 方会对自己的特征进行分箱处理,进而 A 方在分箱中进行密文求和的操作,再把结果给到 B 方进行解密,然后算出 A 方每个特征分箱的 WOE 值和 IV 值。在这个过程中,没有明文数据传输,A 方不知道 B 方的 y 值,同时 B 方也不知道 A 方每个特征的值是什么,从而在安全隐私保护的情况下,完成了特征工程的计算。

说完特征工程,再讲下最核心的机器学习,比如常见的逻辑回归,这是经典的 loss function 和梯度,刚才说的同态加密的特性,目前用到的是半同态的技术。所以,需要对 loss function 和梯度进行多项式展开,来满足加法操作。这样就可以把同态加密的技术应用在 loss function 和梯度中。

5.SecureBoost

在很多现实的业务应用中,树模型是非常重要的,尤其是 XGBoost,对很多应用来说,提升非常明显,因而被业界广泛使用。在联邦机制下,如何构建这样的树?这里我们提出了 SecureBoost 技术方案,双方协同共建一个 boosting 树,我们证明了整个过程中是无损的。图中为一些 paper 和链接,感兴趣的小伙伴可以查找下。

SecureBoost 的核心技术点。上图为基于 SecureBoost 构建的树,A 和 B 代表不同数据的 owner,L0,L1,L2,L3,L4 代表不同 feature 的分割点编码,整颗树由 A 和 B 共同维护,每一方只维护自己的树节点,对另外一方的树节点信息不可见(只知道编码,不知道编码具体含义),保证整个训练和预测过程都是安全的。

构建 SecureBoost 核心的关注点是如何构建分裂节点,尤其一方只有 X,另一方有 ( X,Y ) 的情况。

基于同态加密的机制,B 方会把1阶梯度和2阶梯度传递给 A 方,A 方基于分箱之后的结果算出每个分箱中的1阶梯度和2阶梯度的求和值,然后传递给 B 方,B 方会解密这个求和值,算出信息增益,然后给到 A 方。求分裂节点的核心就是如何算信息增益,通过这样的机制,就可以算出每个分裂节点,同时没有泄露任何隐私信息。

横向联邦学习

举个例子:微众和合作行共建反洗钱模型,期望优化反洗钱模型。因为,各自利用自家样本建立的反洗钱模型的效果和稳定性都不能满足现实需求。我们可以利用联邦学习的机制,充分利用多家的反洗钱样本,同时在不泄露样本的条件下,构建一个非常大的模型,可以看到横向联邦学习中,微众银行和合作行,都是有( X,Y ) 的。

技术层面上,采用了同态加密、Secret-Sharing 技术,整个过程中,双方交互的是模型和梯度,同时引入了 SecureAggregation 机制,让交互过程中的梯度也是很难被反解的。最终,大家都会得到一个相同的模型。横向联邦学习,综合多家样本,可以让模型更加稳健,效果更好。

下面分享下横向联邦学习的核心技术点,这是Google 的两篇 paper ,第一个是每个端自己训练模型,然后发给云端进行综合各个模型的效果,但是这里面会有个问题,就是模型本身也可能会泄露隐私信息,所以引入了 SecureAggregation,各方在传输模型的时候会加一些噪音,通过云端来消除这些噪音,使数据和模型得到保护。


应用案例

联邦学习目前已经赋能众多关键领域,取得了不错的效果:

  • 银行+监管,联合反洗钱建模
  • 互联网+银行,联合信贷风控建模
  • 互联网+保险,联合权益定价建模
  • 互联网+零售,联合客户价值建模

以其中的两个场景以及在视觉领域的应用来说明:

1.保险业个性化定价

对于保险公司如果想做个性化的定价,是一件非常困难的事情,保险公司只有一些业务数据、承保数据和理赔数据,通过这样的数据,对用户做千人千面的定价是非常难的。通过联邦学习机制,可以融合多个数据源,来构建这样一个千人千面的定价。

这是我们目前在做的案例,当你购买权益产品之后,如果违章了,可以帮你免赔,在这里每个人看到的价格是不一样的,这就是我们通过联邦学习帮它们做的。我们综合了出险数据和互联网数据,如标签、用户画像,构建了一个基于保险定价的联邦学习产品。

2.小微企业信贷风险管理

很多时候对小微企业我们只有央行的征信报告,想要更精准的刻画企业的信用状况,需要更多的数据,比如发票、工商、税务的数据。

这是我们的一个案例,我们利用了开票金额和央行的征信数据共建了一个联邦学习模型,来预估每个企业的风险。

3.联邦学习在视觉领域的应用

与 AI 公司探索重塑机器视觉市场,利用联邦学习的机制,相对于本地建模,进一步提升算法准确率,并且形成网络效应,降低长尾应用成本,提升视觉业务总体利润率。

这是联邦视觉在城市管理上的应用。


联邦学习开源平台:FATE

通过刚刚的介绍,相信大家对联邦学习能够做什么,有了大体的认识。而联邦学习想要落地,不可避免的就是开源,接下来为大家介绍下微众银行AI团队开源的联邦学习平台——FATE:

FATE 定位于工业级联邦学习系统,能够有效帮助多个机构在符合数据安全和政府法规前提下,进行数据使用和联合建模。

设计原则:

  • 支持多种主流算法:为机器学习、深度学习、迁移学习提供高性能联邦学习机制。
  • 支持多种多方安全计算协议:同态加密、秘密共享、哈希散列等。
  • 友好的跨域交互信息管理方案,解决了联邦学习信息安全审计难的问题。

FATE 的 Github 地址:

FederatedAI/FATE​github.com

1.里程碑

介绍下 FATE 的里程碑,FATE 在今年2月份首发了0.1版本,3月份的时候有了第一位外部 Contributor,同时 GitHubStar 突破100,5月份发布了0.2版本,支持了联邦特征工程和在线推理,6月份发布了0.3版本,把主要的合作伙伴迁移到了 FATE,并把 FATE 捐献给了 Linux Fundation,8月份发布了1.0版本,支持 FATE-Flow 和 FATE-Board,还有些后续的计划,大家可以了解下。

2.挑战

联邦学习从一项技术真正成为一个关键系统和产品方案时,我们遇到了下述挑战:

  • 一站式建模过程的联邦化
  • MPC 协议下分布式算法 ( on WAN ) 易理解和易维护
  • 跨站点数据传输安全性和可管理性,如何让交互部分是可以被管理和被审计的。
  • 异构基础架构自适应,联邦学习可能会运行在 CPU、GPU 和端上,如何让上层不受底层的变化而变化。

3.技术架构

接下讲下 FATE 的整体架构:

  • EggRoll:分布式计算和存储的抽象;
  • Federated Network:跨域跨站点通信的抽象;
  • FATE FederatedML:联邦学习算法模块,包含了目前联邦学习所有的算法功能;
  • FATE-Flow | FATE-Board:完成一站式联邦建模的管理和调度以及整个过程的可视化;
  • FATE-Serving:联邦学习在线推理模块。

一站式联合建模Pipeline,其流程:在开发环境下,其流程是从联邦统计->联邦特征工程->联邦模型训练,当上线部署的时候会有联邦在线推理模块,底层则会采用多方安全计算协议去支持上层各种联邦算法。

FATE 的五大核心功能

① FATE FederatedML

  • EggRoll & Federation API:底层是 EggRoll 的算子,比如 Map 和 MapValues,Remote 和 Get 可以完成整个分布式计算的抽象;
  • MPC Protocol:包括同态加密、秘密共享等多种多方安全协议,
  • Numeric Operator:会抽象出数学算子,比如加法或者乘法;
  • ML Operator:用建好的数学算子构建机器学习算子,而不用管底层的安全协议是什么;
  • Algorithms:有了 ML 算子之后就构建各种算法模型。

② EggRoll

EggRoll,是整个分布式计算和存储的抽象。面向算法开发者,通过 API 实现分布式计算和存储。上面为 EggRoll 的整体架构图。

③ Federated Network

Federated Network:联邦学习不仅需要分布式计算,还需要跨站点通信和交互,上层会提供一个 API 给到开发者,通过 Remote 和 Get 就可以完成数据点的收发。具体模块,如上图。

④ FATE-Flow

整个一站式联合建模 Pipeline 需要统一的调度管理。右边为 A、B 双方的建模流程,某些步骤是 A、B 双方共有的,某些步骤可能只有一方有,所以 FATE-Flow 完成了下述管理:

  • 联邦机制下多方非对称 DAG 图 Paser
  • 联邦建模生命周期管理
  • 联邦建模实验管理
  • 联邦建模模型管理
  • 联邦多方任务调度

⑤ FATE-Board

FATE-Board 的目的是实现整个联合建模 Pipeline 可视化追踪,记录联邦学习的全过程,可以监控建模进行到哪个步骤,以及模型效果如何。

4.FATE 部署架构

这是FATE 的部署架构,每一方都是差不多的,是一个对称的结构,通过 EggRoll实现分布式计算和存储,通过 Federation Service 和外部交互。

5.FATE 应用

现实中,FATE 是如何应用的呢?这里和大家分享一个示意图,会在每一方部署一套 FATE 系统,双方都是在各自部署的 FATE 系统中进行交互。

6.开发流程

如果对 FATE 感兴趣,作为开发者利用联邦学习框架实现算法,只需要四步:

  1. 选择一个机器学习算法,设计多方安全计算协议
  2. 定义多方交互的数据变量
  3. 构建算法执行工作流
  4. 基于 EggRoll & Federation Api 实现算法工作流中各个功能组件

7.目前 FATE 项目中的算法和案例

如上图,这是目前FATE 项目中的算法和案例,会根据需求,不断增加各种各样的算法。

最后,如果想进一步了解联邦学习的话,还可以添加小助手微信号:

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/226726.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年10月30日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
李开复口中的“联邦学习” 到底是什么?| 技术头条
近日,在百大人物峰会上,创新工场创始人李开复谈及数据隐私保护和监管问题时,表示:“人们不应该只将人工智能带来的隐私问题视为一个监管问题,可尝试用‘以子之矛攻己之盾’——用更好的技术解决技术带来的挑战,例如同态加密、联邦学习等技术。”
AI科技大本营
2019/05/13
1.4K0
李开复口中的“联邦学习” 到底是什么?| 技术头条
微众银行AI团队开源联邦学习框架,并发布《联邦学习白皮书1.0》
【导语】2019年,联邦学习成为业界技术研究与应用的焦点。近日,微众银行 AI 项目组编制并发布了《联邦学习白皮书1.0》,并开源了自研的联邦学习框架。白皮书中对联邦学习的背景、概述、分类、研究、应用案例与发展路径进行了全面的介绍,总结了联邦学习技术发展至今取得的成果以及对未来的展望。
AI科技大本营
2019/10/08
5.2K0
微众银行AI团队开源联邦学习框架,并发布《联邦学习白皮书1.0》
小白也能通俗易懂的联邦学习!
知乎 | https://www.zhihu.com/people/xu-xiu-jian-33
Datawhale
2021/12/09
3.3K0
小白也能通俗易懂的联邦学习!
字节跳动破局联邦学习:开源Fedlearner框架,广告投放增效209%
作为分布式的机器学习范式,联邦学习能够有效解决数据孤岛问题,让参与方在不共享数据的基础上联合建模,挖掘数据价值。
深度学习与Python
2020/11/06
1.8K0
字节跳动破局联邦学习:开源Fedlearner框架,广告投放增效209%
破解数据孤岛壁垒,三篇论文详细解读联邦学习
AI 科技评论按:香港科技大学讲席教授、微众银行首席人工智能官(CAIO)杨强教授是机器学习领域内活动积极的学者,也是大家非常熟悉的机器学习研究人员之一。
AI科技评论
2019/05/15
1.5K0
破解数据孤岛壁垒,三篇论文详细解读联邦学习
怎样扩充大数据?你需要了解的第一个联邦学习开源框架FATE
近日,微众银行将联邦学习开源框架 FATE(Federated AI Technology Enabler)贡献给 Linux 基金会,并希望通过多方维护令该项目更加强大。同时,中国人工智能开源软件发展联盟(AIOSS)发布了我国第一个关于联邦学习规范标准,这些都表明联邦学习从理论到实践都在快速提升。
机器之心
2019/07/19
1.3K0
怎样扩充大数据?你需要了解的第一个联邦学习开源框架FATE
对话腾讯大数据团队:自研联邦学习系统的技术实践和难点
作者 | 蔡芳芳 近两年,联邦学习发展迅速,开始从理论研究迈向批量应用的落地阶段,越来越多企业尝试引入联邦学习,用它来解决人工智能大规模落地过程中遭遇的数据瓶颈问题。但现成的联邦学习工具和框架并非拿来即用的“灵丹妙药”,联邦学习要真正在企业实际业务场景中发挥作用,仍有许多问题需要摸索,比如如何匹配业务的实际需求、如何兼容现有业务流程、如何尽可能减少对已有训练系统的改动等。为此,InfoQ 采访了腾讯 TEG 数据平台部的智能学习团队,深入了解联邦学习在腾讯的实践情况,以及他们对联邦学习技术难点的解决思
腾讯大数据
2020/03/19
1.2K0
腾讯 AngelFL 联邦学习平台揭秘
作者:AI前线 数据里蕴含着价值。在人工智能时代,机器学习尤其深度学习模型的获得需要大量的训练数据作为前提。但是在很多业务场景中,模型的训练数据往往分散在各个不同的业务团队、部门、甚至是不同的公司内的。由于用户隐私,这些数据无法直接使用,形成了所谓的“数据孤岛”。近两年,联邦学习技术 (Federated Learning)迅速发展,为跨团队数据合作,打破“数据孤岛”提供了新的解决思路,并开始从理论研究迈向批量应用的落地阶段。本文系统的介绍了联邦学习的发展历程以及业界情况,并重点介绍了TEG数据平台
腾讯技术工程官方号
2020/03/19
3.8K0
重磅!全球首个可视化联邦学习产品与联邦pipeline生产服务上线
【导读】作为全球首个联邦学习工业级技术框架,FATE支持联邦学习架构体系与各种机器学习算法的安全计算,实现了基于同态加密和多方计算(MPC)的安全计算协议,能够帮助多个组织机构在符合数据安全和政府法规前提下,有效和协作地进行数据使用和联合建模。
AI科技大本营
2019/08/23
1K0
重磅!全球首个可视化联邦学习产品与联邦pipeline生产服务上线
FATE / KubeFATE v1.8重磅发布:增强生产可用性,丰富并完善多项功能
我们的团队一直在参与开源项目的贡献和社区运营。除了之前的 Harbor 开源社区外,我们近期在深度参与联邦学习领域 FATE 开源项目,感兴趣的朋友会议来交流和合作。本篇转发 FATE 开发专委会的文章。
Henry Zhang
2022/05/18
8710
联邦学习 OR 迁移学习?No,我们需要联邦迁移学习
海量训练数据是现代机器学习算法、人工智能技术在各个领域中应用获得成功的重要条件。例如,计算机视觉和电子商务推荐系统中的 AI 算法都依赖于大规模的标记良好的数据集才能获得较好的处理效果,如 ImageNet 等。然而在一些应用领域中,例如医学领域、经济学领域以及一些政务信息化领域中,海量的可用训练数据往往是非常有限的。存在这些问题的主要原因:一是,针对机器学习算法的数据标注任务需要专业的知识和经验才能完成,这种预处理任务的成本非常高,往往无法获得机器学习所需要的足够的标注数据。二是,各个行业对数据隐私和数据安全的保护越来越强,在一定程度上也限制了对训练数据的共享,也就进一步加剧了可用的标注数据缺乏的问题。
机器之心
2020/11/20
1.1K0
联邦学习 OR 迁移学习?No,我们需要联邦迁移学习
揭秘京东超大规模联邦学习平台,如何打破信息孤岛、实现安全共建!
数据是AI的石油,加速了AI的高速发展,但是同时多维度高质量的数据是制约其进一步发展的瓶颈。由于用户隐私、商业机密、法律法规监管等原因,造成大量信息孤岛,导致各个组织与机构无法将原始数据整合在一起,进而联合训练出一个效果更好、信息密度更大、能力更强的大模型,严重制约了AI的发展。联邦学习是新的机器学习模式,它让多个参与者可以在不泄露明文数据的前提下,用多方的数据共同训练模型,实现数据可用不可见,开拓新的业务模式与场景,提升整体AI水准。9N-FL作为超大规模的工业化联邦学习的代表,将在未来推动联邦学习的蓬勃发展。 本文分享的是京东零售-技术与数据中心的联邦学习9N-FL项目在电商营销领域的实践,分享共分为六个部分:联邦学习背景、联邦学习简介、应用场景、9N-FL、隐私保护、规划总结。希望通过对9N-FL项目中联邦学习这一新的机器学习模式的分享,在未来隐私管控更加严格的场景下,发挥其重要的作用。联邦学习也将通过安全多方数据建模,开拓了新的业务模式与场景,给广大算法从业者提供了更加广阔的应用场景,促进大数据与AI的蓬勃发展与业务的突破。
京东技术
2021/04/22
1.8K0
揭秘京东超大规模联邦学习平台,如何打破信息孤岛、实现安全共建!
杨强教授:希望2022年实现从联邦学习到可信联邦学习的跨越
题图摄于北京景山:CBD远眺 本期转发杨强教授关于“可信联邦学习”的演讲内容,来自可信联邦学习最新论文,从信息论角度,提出隐私与模型性能的 No-free lunch 定理,值得大家学习。 关注联邦学习的朋友,推荐使用 FATE 开源项目开发联邦学习应用。 导读 随着隐私计算相关政策的落地和商业化进程加快,隐私计算技术也在需求端推动下快速迭代。可预见 2022 年将是一个新的分水岭。近日,加拿大工程院及加拿大皇家科学院两院院士、微众银行首席人工智能官、FATE开源社区技术指导委员会主席杨强教授受邀出席了机器
Henry Zhang
2023/04/04
6110
杨强教授:希望2022年实现从联邦学习到可信联邦学习的跨越
产业安全专家谈丨企业如何应用“联邦学习”打破数据孤岛,助力业务创新?
随着云计算和大数据技术的不断发展,以人工智能为基础的数据分析与数据挖掘让大数据释放出巨大价值,已成为企业业务创新、业绩增长的重要手段。
腾讯安全
2020/05/07
8880
产业安全专家谈丨企业如何应用“联邦学习”打破数据孤岛,助力业务创新?
联邦学习,究竟能为大数据行业带来何种可能?
没有哪一项技术像人工智能一样,绵延数十年,引领数次风口。从60年前的达特茅斯会议到深蓝国际象棋再到AlphaGo,人工智能一直在持续着迭代、创新。联邦学习,就是人工智能与大数据行业一个新兴的技术,它的出现,有望解决数据孤岛的难题。
TVP官方团队
2020/04/08
1.4K0
联邦学习在腾讯微视广告投放中的实践
分享人:宋凯 博士 整理者:林宜蓁 导读: 本文从广告主的角度,分享联邦学习实践的经验跟思考。 先介绍业务与技术选型背景:团队项目为用户增长及成本控制,方式为广告渠道投放,投放目标分为拉新、拉活两类。 拉新时,微视侧端内用户特征稀疏,而广告平台积累大量信息,但仅有有限性的oCPX标准化数据回传。 拉活时,微视侧具备用户行为序列等宝贵画像数据,与广告平台特征有互补性,但又无法直接粗暴的与广告平台共享数据。 所以,希望微视侧能与广告平台侧利用双方数据,实现收益共赢,但保证数据的安全不出域。在这种背景下我
腾讯大数据
2021/09/06
2.5K0
微众银行首席人工智能官杨强:可信联邦学习让隐私计算既安全又可用
近来,微众银行在IJCAI 2022、TPAMI 2022、ACM TIST等顶级学术期刊和顶会上接连发表了联邦学习领域最新进展的前沿论文。究竟哪些理论实践为产业界带来了新的研究和落地视角?为此,我们采访了微众银行首席人工智能官杨强教授,看他是如何带领团队取得这一领域研究的突破性进展。
AI科技大本营
2022/12/10
1K0
微众银行首席人工智能官杨强:可信联邦学习让隐私计算既安全又可用
联邦学习企业级解决方案(附视频和PPT)
题图摄于北京北三环 相关信息: 招聘云原生开发工程师 联邦学习:保护隐私安全以及克服数据孤岛的机器学习 视频及PPT:云原生联邦学习平台、实践与应用 在国庆前举行的 2021 AceCon 智能云边开源峰会上,星云 Clustar CTO 张骏雪和我一起做了个分享:《联邦学习企业级实现》,并且一同发布了星云联邦学习企业级产品基于 VMware VCF Tanzu 的联合解决方案。 在数据融合交互与数据隐私安全愈演愈烈的当下,「联邦学习」技术为基于跨领域的企业级数据合作提供了新的范式。FATE 是国内首个开
Henry Zhang
2023/04/04
7610
联邦学习企业级解决方案(附视频和PPT)
笔记︱联邦学习与隐私计算的案例集锦(一)
Federated Learning - 联邦学习 参考文献: 小白也能通俗易懂的联邦学习! 关于联邦学习建模过程中算法交互内容的研究
悟乙己
2022/06/06
4.2K1
笔记︱联邦学习与隐私计算的案例集锦(一)
解密Angel PowerFL联邦学习平台中的纵向GBDT算法
导语:  GBDT(或XGBoost)算法是一种十分流行的树集成学习算法,不但是数据科学竞赛的常胜工具,在工业界的具体业务场景也有广泛的落地场景。然而,近年来用户隐私数据保护条例逐渐完善,“数据孤岛”逐渐形成,不但数据难以收集,不同公司或团队之间的数据也难以共享,这直接影响着机器学习模型的效果。为了应对这个问题,联邦学习技术逐渐进入人们的视线。本文聚焦腾讯自研的联邦学习平台Angel PowerFL中纵向联邦GBDT算法实现,介绍纵向联邦GBDT算法的原理和流程,并讲解相关的优化技术。 梯度提升决策树算法
腾讯大数据
2020/09/09
4.3K0
推荐阅读
李开复口中的“联邦学习” 到底是什么?| 技术头条
1.4K0
微众银行AI团队开源联邦学习框架,并发布《联邦学习白皮书1.0》
5.2K0
小白也能通俗易懂的联邦学习!
3.3K0
字节跳动破局联邦学习:开源Fedlearner框架,广告投放增效209%
1.8K0
破解数据孤岛壁垒,三篇论文详细解读联邦学习
1.5K0
怎样扩充大数据?你需要了解的第一个联邦学习开源框架FATE
1.3K0
对话腾讯大数据团队:自研联邦学习系统的技术实践和难点
1.2K0
腾讯 AngelFL 联邦学习平台揭秘
3.8K0
重磅!全球首个可视化联邦学习产品与联邦pipeline生产服务上线
1K0
FATE / KubeFATE v1.8重磅发布:增强生产可用性,丰富并完善多项功能
8710
联邦学习 OR 迁移学习?No,我们需要联邦迁移学习
1.1K0
揭秘京东超大规模联邦学习平台,如何打破信息孤岛、实现安全共建!
1.8K0
杨强教授:希望2022年实现从联邦学习到可信联邦学习的跨越
6110
产业安全专家谈丨企业如何应用“联邦学习”打破数据孤岛,助力业务创新?
8880
联邦学习,究竟能为大数据行业带来何种可能?
1.4K0
联邦学习在腾讯微视广告投放中的实践
2.5K0
微众银行首席人工智能官杨强:可信联邦学习让隐私计算既安全又可用
1K0
联邦学习企业级解决方案(附视频和PPT)
7610
笔记︱联邦学习与隐私计算的案例集锦(一)
4.2K1
解密Angel PowerFL联邦学习平台中的纵向GBDT算法
4.3K0
相关推荐
李开复口中的“联邦学习” 到底是什么?| 技术头条
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档