本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。
这里讨论的问题是:玩家1是信息提供者,玩家2是决策者。 玩家1和玩家2的收益函数有一个偏差。着导致玩家1并不一定会提供真实的信息。 而玩家2则需要根据玩家1的类型来做出决策。
三个结论:
案例: 玩家1了解真实的情况,\theta \in [0, 1]为两个值中之一。 玩家2的先验知识是这两种状态的可能性一样。 玩家2的行动a_2 \in \mathbb{R},其收益函数为v_2(a_2, \theta) = -(\theta - a_2)^2,意味着玩家2的最优策略是a_2 = \theta。 玩家1的行动a_1,其收益函数为v_1(a_2, \theta) = -(\theta + b - a_2)^2, b > 0,意味着玩家2的最优策略是a_2 = \theta + b。 事件的顺序为:玩家1给玩家2一个消息,然后玩家2决定其策略。
这里增加了一个条件:玩家1只能提供两个信息a \in \{ a', a'' \}, 0 \leq a' < a'' \leq 1.中的一个。
声明 18.5
在一个两消息均衡中,玩家1一定会使用一个阀值策略:如果0 \leq \theta \leq \theta^*时选择a',如果\theta^* \leq \theta \leq 1时选择a''。
声明 18.6
在一个两消息均衡中,玩家1使用一个阀值策略,则玩家2最佳反应a_2(a'_1) = \frac{\theta^*}{2}和a_2(a''_1) = \frac{1 - \theta^*}{2}
声明 18.7
当且仅当b < \frac{1}{4}时,存在一个两消息精炼贝叶斯均衡。
案例: 在一个委员会中,玩家1是一个顾问,提供建议给政策制定者。玩家2制定政策。 玩家1了解真实的情况,\theta \in \{ -w, w\}, w > 0为两个值中之一。 玩家2的先验知识是这两种状态的可能性一样。 玩家2的行动a_2,其收益函数为v_2(a_2, \theta) = -(\theta - a_2)^2,意味着玩家2的最优策略是a_2 = \theta。 玩家1的行动a_1,其收益函数为v_1(a_2, \theta) = -(\theta + b - a_2)^2, b > 0,意味着玩家2的最优策略是a_2 = \theta + b。 事件的顺序为:玩家1给玩家2一个消息,然后政策被指定。
解决方案1: 如果玩家2根据先验条件,则会得到a_2 = 0为最大收益的行动。根据a_2 = 0行动指定的策略,称之为现状策略(status quo policy)。 我们可以理解为玩家2没有从玩家1那里得到任何信息。
替代规则
声明 18.8
在一个开放规则中,当且仅当b \leq w时,存在一个完全诚实的均衡,其中a_2 = \theta。
声明 18.9
在一个封闭规则中,当且仅当b \leq w时,存在一个完全诚实的均衡,其中a_2 = \theta + b。
声明 18.10
在一个封闭规则中,当且仅当b \leq 2w时,存在一个完全诚实的均衡,其中a_2 = \theta + w。
结论: