前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >铁汁,来和AI斗地主!快手开源DouZero技术解读

铁汁,来和AI斗地主!快手开源DouZero技术解读

作者头像
机器之心
发布于 2023-03-29 09:10:52
发布于 2023-03-29 09:10:52
1.6K0
举报
文章被收录于专栏:机器之心机器之心

人工智能挑战棋牌游戏,一直是极为热门的研究方向。 此前,人工智能在围棋、德州扑克、麻将等游戏上已经取得极大的成功。斗地主也因其极大的状态空间、丰富的隐含信息、复杂的牌型和并存的合作与竞技,同样是一项极具挑战的棋牌类游戏。 近日,机器之心报道了快手AI平台部开源的斗地主人工智能系统——斗零(DouZero),引起了极大的关注。 团队将传统的蒙特卡罗方法与深度学习相结合,并提出了动作编码机制来应付斗地主复杂的牌型组合。在效果上,DouZero在不借助任何人类知识的情况下,通过自我博弈学习,在几天内战胜了所有已知的斗地主打牌机器人,并达到了人类玩家水平。 快手团队也将此研究的相关论文与代码公开,同时开放了在线演示平台供研究者和斗地主爱好者体验。 为了让大家细致了解快手开源的斗地主AI,机器之心邀请到了该研究的作者之一、快手AI平台部研究科学家谢静如来做线上分享,为大家做细致解读。

分享主题:DouZero: 首个达到人类水平的开源斗地主AI

嘉宾简介:谢静如,2020年从美国密歇根大学获得物理学博士学位,现在是快手AI平台部Research Scientist,目前主要从事游戏AI强化学习框架的开发和研究。 分享摘要:人工智能在很多棋牌类游戏中取得了很大的成功,例如阿法狗(围棋)、Libratus(德扑)、Suphx(麻将)。斗地主却因其极大的状态空间、丰富的隐含信息、复杂的牌型和并存的合作与竞技,一直以来被认为是一个极具挑战性的领域。近日,快手AI平台部在斗地主上取得了突破,提出了首个从零开始的斗地主人工智能系统DouZero。将蒙特卡洛算法与深度学习相结合,DouZero在不借助任何人类知识的情况下,通过自博弈学习,在几天内战胜了所有已知的斗地主打牌机器人,并达到了人类玩家水平。相关论文已被国际机器学习顶级会议ICML 2021接收,开源代码在GitHub上获得近千星。同时,论文作者开放了在线演示平台供研究者和斗地主爱好者体验。

  • 论文地址: https://arxiv.org/abs/2106.06135
  • 开源地址: https://github.com/kwai/DouZero
  • 在线体验: https://douzero.org/

直播时间:北京时间6月29日晚上8:00-9:00

直播间:https://jmq.h5.xeknow.com/s/5hrF6(点击阅读原文直达)

加入机动组,一起看直播

「机动组」是机器之心人工智能技术社群,将持续提供技术公开课、论文分享、热门主题解读等线上线下活动,同时「机动组」也将不定期组织人才服务、产业技术对接等活动,欢迎所有 AI 领域技术从业者加入。

识别二维码,加入本次直播交流群。如群已超出人数上限,请添加小助手syncedai5或syncedai6,备注「推荐」即可加入。

点击阅读原文,收藏直播间。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-06-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
快手开源斗地主AI,入选ICML,能否干得过「冠军」柯洁?
机器之心报道 机器之心编辑部 AI 打斗地主,除了信息不完全,还要学会合作与竞争。 众所周知,AI 在围棋上的实力是人类所不能及的。不过斗地主还不一定。在 2017 年 AlphaGo 3 比 0 战胜中国棋手,被授予职业九段之后,柯洁决定参加斗地主比赛,并获得了冠军。在当时的赛后采访中,柯洁表示,「很欢乐,希望以后再多拿一些冠军,无论什么样的冠军都想拿!」 但是好景不长,在这种随机性更高的游戏上, AI 紧随而至。 近日,快手 AI 平台部的研究者用非常简单的方法在斗地主游戏中取得了突破,几天内就战胜了所
机器之心
2023/03/29
8460
快手开源斗地主AI,入选ICML,能否干得过「冠军」柯洁?
7 Papers & Radios |快手开源斗地主AI,微软提出DyHead、打破COCO记录
机器之心 & ArXiv Weekly Radiostation 参与:杜伟、楚航、罗若天 本周论文主要包括微软研究者提出的动态头(Dynamic Head),其采用注意力机制将不同的目标检测头进行统一,将 COCO 指标推到一个新记录;快手 AI 平台部在斗地主上取得了突破,提出了首个从零开始的斗地主人工智能系统——斗零(DouZero)等研究。 目录 OoD-Bench: Benchmarking and Understanding Out-of-Distribution Generalization
机器之心
2023/03/29
5810
7 Papers & Radios |快手开源斗地主AI,微软提出DyHead、打破COCO记录
卡牌游戏八合一,华人团队开源强化学习研究平台RLCard
在过去的两三年中,我们经常听说人工智能在棋牌类游戏(博弈)中取得新的成果,比如基于深度强化学习的 AlphaGo 击败了人类世界冠军,由 AlphaGo 进化而来的 AlphaZero 还一并搞定了国际象棋和日本象棋;基于博弈论的冷扑大师(Libratus)也在无限注德州扑克比赛中击败了人类职业选手;今年在澳门举行的 IJCAI 2019 上我们也发现了一篇斗地主 AI 论文。
AI研习社
2019/10/14
1.7K0
卡牌游戏八合一,华人团队开源强化学习研究平台RLCard
AI杀入斗地主领域,快手开发DouZero对标AlphaZero,干掉344个AI获第一
快手团队开发的斗地主AI命名为DouZero,意思是像AlphaZero一样从零开始训练,不需要加入任何人类知识。
量子位
2021/07/19
9690
我玩《王者荣耀》、斗地主、打麻将,但我是正经搞AI的北大教授
金磊 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一位导师下载好了《王者荣耀》,还鼓励她的博士生们去玩一玩。 真的很难想象,这种“名场面”就真真儿的发生在了国内顶级学府——北京大学。 …… 这位导师叫李文新,是北大信息科学技术学院的一名教授。 △ 李文新教授 但她和学生们打《王者荣耀》可是真的正儿八经的,因为李文新的研究方向,正是游戏AI: 其实“游戏”这个词,并不应该是刻板印象中的手游、端游等等,我们对它的理解是更泛化的。 “游戏”是对“现实”的抽象和模仿。我们期望在游戏中获得与现实
量子位
2023/03/01
5150
我玩《王者荣耀》、斗地主、打麻将,但我是正经搞AI的北大教授
雀神,微软亚研推出超级麻将AI Suphx,还上了专业十段水平
麻将无疑是我国最家喻户晓,老少咸宜的一项棋牌游戏。近年来,随着人工智能在围棋、德州扑克、Dota、星际争霸等众多游戏中获得亮眼的成绩,AI 在麻将领域却一直缺少跨越性的突破。
机器之心
2019/08/30
7580
雀神,微软亚研推出超级麻将AI Suphx,还上了专业十段水平
牺牲睡眠、耽误论文,三周开发出「斗地主」AI,他们拿下了今年 DeeCamp 最佳团队奖
8 月 16 日,由创新工场主办的 2019 DeeCamp 人工智能训练营正式结营。
AI研习社
2019/08/27
9810
牺牲睡眠、耽误论文,三周开发出「斗地主」AI,他们拿下了今年 DeeCamp 最佳团队奖
这次 AI 突破的是麻将!
围棋AlphaGo点燃的AI之火渐渐降温之际,微软今天上午发布了他们在麻将游戏中取得的重大突破:麻将AI “Suphx”在国际知名专业麻将平台“天凤”上荣升十段。
AI科技评论
2019/08/30
7610
这次 AI 突破的是麻将!
游戏AI领域,机器人技术的研究与应用
内容来源:2018 年1月5日,深奇智慧联合创始人高扬在“2018移动技术创新大会”进行《游戏机器人的研究与应用》演讲分享。IT 大咖说(微信id:itdakashuo)作为独家视频合作方,经主办方和讲者审阅授权发布。
IT大咖说
2018/07/30
7320
游戏AI领域,机器人技术的研究与应用
来呀!AI喊你斗地主——首个搞定斗地主的深度神经网络
【导读】近年来,从围棋到 Dota 团战赛,深度神经网络应用在各种游戏竞赛中不断取得突破。这一次,有人把这种方法用到斗地主游戏的研究中,可以说真的很接地气了!
AI科技大本营
2018/11/08
5.6K2
第3届腾讯棋牌盛典:全民化专业化并存 围棋AI“绝艺”加入对战
导语 很显然,腾讯在棋牌赛事的国际化、专业化与科技化上,还有更大雄心。 2017年12月13-22日,第3届腾讯棋牌年度盛典如期在海南三亚举行。手握《欢乐斗地主》、《欢乐麻将全集》、《天天德州》等几款棋牌大手游的腾讯,近年依靠游戏庞大的用户基础,已将年度盛典办成了目前国内影响力最大的全民棋牌赛事之一。今年的赛事共包含斗地主、麻将、德州、围棋、象棋、国际象棋六大项目,在规模、嘉宾阵容、奖金额度上都全面赶超前两届。 游戏茶馆近日探访腾讯棋牌年度盛典现场,感受到腾讯在赛事中加入不少新动作:首次加入国际象棋邀请赛项
企鹅号小编
2018/02/24
9480
第3届腾讯棋牌盛典:全民化专业化并存 围棋AI“绝艺”加入对战
德州农工大学开源RLCard:帮你快速训练会斗地主的智能体
RLCard 是一个用于牌类游戏强化学习研究的开源工具包,其接口简单易用,支持多种牌类环境。RLCard 的目标是在强化学习与非完美信息博弈之间搭建桥梁,推动强化学习研究在多智能体、高维状态和动作空间以及稀疏奖励领域的进步。作者在论文中概述了 RLCard 的关键组件,探讨了其设计原则并简要介绍了接口,还给出了对这些环境的评估。
机器之心
2019/10/23
1.9K0
德州农工大学开源RLCard:帮你快速训练会斗地主的智能体
好家伙!B站竟然开源了一个Dota2 AI项目:影魔SOLO智能体
Dota 2 的人工智能击败人类,是 AI 界的一次里程碑事件。2019 年 4 月,OpenAI 提出的 AI 智能体「OpenAI Five」击败 OG 成为了第一个在电竞游戏中击败世界冠军的 AI 系统。
机器之心
2021/08/06
8810
哪类游戏AI难度更高?用数学方法来分析一下
本文来自:微软亚洲研究院,AI 科技评论 获授权转载,如需转载,请联系微软亚洲研究院。
AI科技评论
2019/08/21
1.6K0
哪类游戏AI难度更高?用数学方法来分析一下
微软麻将 AI 论文发布,首次公开技术细节
场景描述:还记得去年 8 月微软发布的「雀神AI」Suphx 吗?今天,该研究团队在 arXiv 上发布了更新版的论文,进一步介绍了 Suphx 背后的技术。
HyperAI超神经
2020/04/08
9780
微软麻将 AI 论文发布,首次公开技术细节
首家强化学习大规模落地工业应用,快手是如何做到的?
人工智能技术正被科技公司广泛应用在产品中,谷歌等公司已在搜索引擎中加入了 BERT 这样的预训练模型,而强化学习这种需要耗费大量算力的方法也已成为快手推荐系统的核心。
机器之心
2020/08/11
1.4K0
首家强化学习大规模落地工业应用,快手是如何做到的?
NeurIPS 2022 | 最强斗地主AI!网易互娱AI Lab提出基于完美信息蒸馏的方法
机器之心专栏 作者:网易互娱 AI Lab 网易互娱 AI Lab 联合上海交通大学和 CMU 提出了基于完美信息蒸馏的斗地主 AI--PerfectDou,击败了一众 AI 模型,成为目前的最强斗地主 AI。 近几年随着强化学习技术的发展,游戏 AI 技术已经成功应用在了围棋、德州扑克、星际争霸等不同种类的游戏中。斗地主是非常流行的一种纸牌游戏,它的玩法存在非完美信息 (地主和农民双方均不能看到对方的手牌) 以及策略合作(2 名农民玩家需要通过配合来击败手牌多 3 张的地主),被认为是非常具有挑战性的研究
机器之心
2022/10/08
1.3K0
NeurIPS 2022 | 最强斗地主AI!网易互娱AI Lab提出基于完美信息蒸馏的方法
人工智能当前,棋牌游戏留给人类的堡垒不多了
本文介绍了人工智能在棋类游戏中的一些进展,特别是在围棋和德州扑克这两个领域。作者分析了AlphaGo和Libratus等人工智能系统,并讨论了这些技术在未来的可能发展方向。
AlgorithmDog
2017/12/29
2.2K0
人工智能当前,棋牌游戏留给人类的堡垒不多了
JARVIS项目原作解读:连接ChatGPT和HuggingFace解决AI问题
机器之心最新一期线上分享邀请到了微软亚洲研究院研究员宋恺涛,为大家分享他们近期的开源项目 JARVIS。 在最近一段时间内,以 ChatGPT 为代表的大语言模型(Large Language Models,LLMs)在工业界和学术界掀起了巨大的关注。然而,以处理文本为主的 LLMs,在解决许多复杂并且具有挑战的 AI 任务上,依然存在着许多瓶颈: 1、受限于语言模型的输入输出形式,当下的 LLMs(如 ChatGPT)缺少能够处理复杂模态信息的能力(如图像、语音、视频等)。 2、一些复杂的 AI 任务需要
机器之心
2023/05/01
3500
JARVIS项目原作解读:连接ChatGPT和HuggingFace解决AI问题
游戏AI的缘起与进化
计算机科学家们一直对游戏 AI 乐此不疲,原因并非为了精进棋艺,而是希望在此过程中不断提升人工智能的算法和处理复杂问题的能力。实际上,游戏 AI 的历史几乎和人工智能的历史一样长,很多关于人工智能的研究,都起源于研究如何构建能够完成游戏的智能体(agent)。游戏 AI 的进化,始终与 AI 研究进展相生相伴。
AI科技大本营
2019/08/06
7090
推荐阅读
快手开源斗地主AI,入选ICML,能否干得过「冠军」柯洁?
8460
7 Papers & Radios |快手开源斗地主AI,微软提出DyHead、打破COCO记录
5810
卡牌游戏八合一,华人团队开源强化学习研究平台RLCard
1.7K0
AI杀入斗地主领域,快手开发DouZero对标AlphaZero,干掉344个AI获第一
9690
我玩《王者荣耀》、斗地主、打麻将,但我是正经搞AI的北大教授
5150
雀神,微软亚研推出超级麻将AI Suphx,还上了专业十段水平
7580
牺牲睡眠、耽误论文,三周开发出「斗地主」AI,他们拿下了今年 DeeCamp 最佳团队奖
9810
这次 AI 突破的是麻将!
7610
游戏AI领域,机器人技术的研究与应用
7320
来呀!AI喊你斗地主——首个搞定斗地主的深度神经网络
5.6K2
第3届腾讯棋牌盛典:全民化专业化并存 围棋AI“绝艺”加入对战
9480
德州农工大学开源RLCard:帮你快速训练会斗地主的智能体
1.9K0
好家伙!B站竟然开源了一个Dota2 AI项目:影魔SOLO智能体
8810
哪类游戏AI难度更高?用数学方法来分析一下
1.6K0
微软麻将 AI 论文发布,首次公开技术细节
9780
首家强化学习大规模落地工业应用,快手是如何做到的?
1.4K0
NeurIPS 2022 | 最强斗地主AI!网易互娱AI Lab提出基于完美信息蒸馏的方法
1.3K0
人工智能当前,棋牌游戏留给人类的堡垒不多了
2.2K0
JARVIS项目原作解读:连接ChatGPT和HuggingFace解决AI问题
3500
游戏AI的缘起与进化
7090
相关推荐
快手开源斗地主AI,入选ICML,能否干得过「冠军」柯洁?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档