今天要读一篇 Amy Greenwald 的论文《Correlated-Q Learning》,先记一下论文中的基础概念,然后再去深入解读。
这篇论文的目标是:在 general-sum 马尔可夫博弈中学习均衡策略
纳什均衡:
相关均衡:
Correlated-Q:
马尔可夫博弈:
马尔可夫博弈中的Q:
Friend Q:
CE-Q:
本文分享自 作者个人站点/博客 前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!