从麻将AI上学到的知识,可以应用到金融投资市场等信息不对称的领域
如果你还在为打不赢麻将而烦恼,可能马上就会有一个人工智能系统,能助你一臂之力。8月29日-31日,上海举办第二届世界人工智能大会,微软人工智能及研究事业部负责人沈向洋在会上宣布,微软亚洲研究院在游戏AI领域取得突破,创造出史上最强的麻将AI Suphx(超级凤凰)。
微软介绍,Suphx于今年3月在日本专业麻将平台“天凤”上线,到6月,与人类进行了5000余场四人麻将对局后,已经成为该平台上首个荣升十段的AI系统。在“天凤”允许AI参赛的公开房间中,Suphx的稳定段位超越顶尖人类选手的平均水平1个段位以上。
那么,Suphx的背后,到底采用了什么技术,使其能够解决麻将所带来的挑战?
微软亚洲研究院副院长、机器学习领域负责人刘铁岩介绍,为了解决隐藏信息的问题,微软采用的是先知教练技术,以提升深度强化学习的效果。其想法是,在AI自我博弈的训练阶段,设立一个先知的角色,让教练能够看到所有信息,并在不透露底牌的前提下,不断提示AI模型的训练方向,使其不至于像一只无头苍蝇一样乱撞。
最终,这些信息将倒逼AI模型更深入地理解可见信息,从而找到最优路径。刘铁岩表示,为此,他们在Suphx上线之前,就已经让它进行了近2000万场线下自我博弈。
对于麻将复杂的计分机制,微软团队使用了全盘预测技术,让机器可以理解每轮比赛对8轮过后终盘结果的不同贡献,从而将终盘的奖励信号,合理地分配回每一轮比赛中,使AI学会一些具有大局观的技巧。
……
本文改写(或引用)自新闻原创付费阅读网站“财新网”。
领取专属 10元无门槛券
私享最新 技术干货