子博弈完美均衡(subga perfect eilibriu, spe)
子博弈完美均衡(spe)是纳什均衡(nash eilibriu)的一种强化形式,专门用于动态博弈(dynaic gas),特别是那些包含多个决策阶段的博弈。spe要求在每一个可能的子博弈(subga)中,策略都必须是一个纳什均衡。
1 子博弈完美均衡的定义
一个策略组合构成子博弈完美均衡,当且仅当它在博弈的每一个可能的子博弈中都形成纳什均衡,即:
玩家在每一步都必须选择最优策略,不论游戏是否已经按照这个路径进行。
通过逆向归纳法(backward duction)来求解spe。
spe解决了纳什均衡可能包含不可信威胁的问题。例如,在某些博弈中,某些威胁在理性情况下根本不会被执行,而纳什均衡可能会包含这些威胁。而spe要求策略在所有子博弈中都合理,因此排除了这些不可信的威胁。
2 spe的求解方法:逆向归纳法
求解子博弈完美均衡的主要方法是逆向归纳法(backward duction),步骤如下:
1从最后一个决策节点(终局)开始,找出最优策略。
2回溯到前一个决策节点,在考虑后续最优策略的情况下,找到当前的最优选择。
3依次回溯,直到回到博弈的,最终得出整个博弈的最优策略组合,即spe。
3 经典案例分析
(1) 讨价还价博弈(rubste bargag ga)
场景:
两个玩家a和b协商如何分配100元。
a先出价,b可以接受或拒绝:
接受:按a的分配方案执行。
拒绝:进入下一轮,由b出价,但总金额减少(如因折现或时间成本,变为90元)。
这个过程可以继续,直到某一方接受提议。
解法(逆向归纳法):
1在最后一轮,b必须接受任何非零金额,因为否则大家都拿不到钱。
2在倒数第二轮,a知道