2021腾讯犀牛鸟开源人才培养计划
开源项目介绍
滑至文末报名参与开源人才培养计划
报名提交项目Proposal
Angel项目介绍
Angel-高性能分布式机器学习平台,是腾讯研发并开源的面向企业级应用的高性能分布式机器学习平台。
Angel支持特征工程、模型构建、参数训练、AutoML、模型服务Serving等全栈机器学习服务,提供机器学习、深度学习、图神经网络等多种算法,支持级万亿级超大规模参数模型的训练,已在生产业务系统中大规模部署。
Angel项目导师介绍
欧阳文、李晓森
Angel开源项目技术负责人
导师寄语:
“Angel是腾讯自研的高性能分布式机器学习和图计算平台。通过学习这个项目,你将了解顶级分布式机器学习平台架构设计原理以及AI算法落地细节,轻松玩转机器学习和图计算,对之后的学习和工作都大有益处。”
Angel相关资料
?Angel项目地址:https://github.com/Angel-ML/angel
?PyTorch on Angel:https://github.com/Angel-ML/PyTorch-On-Angel
?Angel简介、设计、算法文档:https://github.com/Angel-ML/angel/blob/master/README.md
Angel项目实战任务
编程任务
【题目一】
基于PyTorch On Angel实现S-GCN图神经网络算法;
参考论文 :https://arxiv.org/pdf/1902.07153.pdf
内容: S-GCN通过简化GCN非线性计算从而提高训练速度,在许多超大规模图场景中得到了广泛应用。
预备知识: 1.S-GCN论文 https://arxiv.org/pdf/1902.07153.pdf 2.Java , Python, Scala 3.PyTorch /Spark / Angel
预期结果: 1.基于PyTorch On Angel实现S-GCN算法 2.在多种数据集如cora.cites上有高效的训练性能以及F1-Score等关键指标 3.文档和测试
你将收获: 1.理解图神经网络算法的实现逻辑,熟悉PyTorch、Angel、Spark等组件功能 2.分布式系统的性能优化实践经验
【题目二】
基于PyTorch On Angel实现MMoE多任务学习算法模型
内容:
MMoE模型可以从数据中学习建模任务间的相关性,在许多真实场景中得到大规模的应用,如在电影推荐中不仅推荐用户可能观看的电影,还需要优化用户对电影的喜爱程度的预估;结合两个任务推荐的电影,最有可能满足用户需求和推荐目的。
预备知识: 1.MMoE论文 https://dl.acm.org/doi/pdf/10.1145/3219819.3220007 2.Java , Python, Scala 3.PyTorch /Spark / Angel
预期结果: 1.基于PyTorch On Angel实现MMoE算法 2.在多种数据集(例如MMoE论文中的数据集)上有高效的训练性能、正确的AUC等关键指标
3.文档和测试
你将收获: 1.理解图神经网络算法的实现逻辑,熟悉PyTorch、Angel、Spark等组件功能 2.分布式系统的性能优化实践经验
扫码填写问卷报名,提交项目proposal
加入开发实战
与导师一起成长这一夏
Angel开源项目交流群
更多开源项目信息,
尽在“腾讯犀牛鸟开源人才社区”
扫码加入,解锁所有学习资料
?学生指南Q&A:https://github.com/Tencent/OpenSourceTalent/issues/14
?官方QQ群:859260607 (加群请备注学校+专业)
腾讯犀牛鸟开源人才培养计划官网
https://opensource.tencent.com/summer-of-code
(点击文末阅读原文直接访问)
合作或疑问欢迎联系:tencentopen@tencent.com