某中心云服务赞助了本次挑战赛,并为参赛者提供了数据准备、处理以及模型训练、部署和测试所需的资源。
竞赛是年度NeurIPS会议计划的重要组成部分。今年接受的16个竞赛中,有四分之一专注于推动深度强化学习的科学进展。近年来,强化学习在游戏、自动驾驶、电网管理等领域取得了突破性进展。
某中心SageMaker RL团队很荣幸与AIcrowd合作,为Procgen挑战赛提供训练和评估支持。该挑战赛要求参赛者开发新的强化学习模型,以最大化样本效率和泛化能力。
某中心SageMaker RL团队开源了基于AnyScale的Ray RLlib的入门笔记本,这是一个使用Ray分布式学习框架实现强化学习应用的库。通过某中心SageMaker笔记本实例,参赛者能在不到一小时内获得结果,成本仅为几美元。
挑战赛设有两个赛道——泛化能力和样本效率,包含三轮比赛,吸引了82个团队的500多名参与者。在整个比赛期间,使用某中心SageMaker评估了172,000个模型。
泛化能力赛道获胜团队:Dipam Chakraborty和Nhat Quang Tran
样本效率赛道获胜团队:Adrien Gaidon和Blake Wulfe
该挑战赛基于OpenAI Procgen基准测试,包含16个程序生成的gym环境,直接衡量强化学习代理学习可泛化技能的速度。每个Procgen环境都是程序生成的,要求代理泛化到从未见过的情况。
Procgen环境设计轻量且易于使用,计算资源有限的参与者可以轻松复现基线结果并运行新实验。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。