人工智能挑战棋牌游戏,一直是极为热门的研究方向。 此前,人工智能在围棋、德州扑克、麻将等游戏上已经取得极大的成功。斗地主也因其极大的状态空间、丰富的隐含信息、复杂的牌型和并存的合作与竞技,同样是一项极具挑战的棋牌类游戏。 近日,机器之心报道了快手AI平台部开源的斗地主人工智能系统——斗零(DouZero),引起了极大的关注。 团队将传统的蒙特卡罗方法与深度学习相结合,并提出了动作编码机制来应付斗地主复杂的牌型组合。在效果上,DouZero在不借助任何人类知识的情况下,通过自我博弈学习,在几天内战胜了所有已知的斗地主打牌机器人,并达到了人类玩家水平。 快手团队也将此研究的相关论文与代码公开,同时开放了在线演示平台供研究者和斗地主爱好者体验。 为了让大家细致了解快手开源的斗地主AI,机器之心邀请到了该研究的作者之一、快手AI平台部研究科学家谢静如来做线上分享,为大家做细致解读。
分享主题:DouZero: 首个达到人类水平的开源斗地主AI
嘉宾简介:谢静如,2020年从美国密歇根大学获得物理学博士学位,现在是快手AI平台部Research Scientist,目前主要从事游戏AI和强化学习框架的开发和研究。 分享摘要:人工智能在很多棋牌类游戏中取得了很大的成功,例如阿法狗(围棋)、Libratus(德扑)、Suphx(麻将)。斗地主却因其极大的状态空间、丰富的隐含信息、复杂的牌型和并存的合作与竞技,一直以来被认为是一个极具挑战性的领域。近日,快手AI平台部在斗地主上取得了突破,提出了首个从零开始的斗地主人工智能系统DouZero。将蒙特卡洛算法与深度学习相结合,DouZero在不借助任何人类知识的情况下,通过自博弈学习,在几天内战胜了所有已知的斗地主打牌机器人,并达到了人类玩家水平。相关论文已被国际机器学习顶级会议ICML 2021接收,开源代码在GitHub上获得近千星。同时,论文作者开放了在线演示平台供研究者和斗地主爱好者体验。
直播间:https://jmq.h5.xeknow.com/s/5hrF6(点击阅读原文直达)
加入机动组,一起看直播
「机动组」是机器之心人工智能技术社群,将持续提供技术公开课、论文分享、热门主题解读等线上线下活动,同时「机动组」也将不定期组织人才服务、产业技术对接等活动,欢迎所有 AI 领域技术从业者加入。
识别二维码,加入本次直播交流群。如群已超出人数上限,请添加小助手syncedai5或syncedai6,备注「推荐」即可加入。
点击阅读原文,收藏直播间。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有