言情小说网 > 都市言情 > 职场小聪明 > 第475章 逆向归纳法(1/5)
    逆向归纳法(backward duction)

    逆向归纳法是一种常用于动态博弈的求解方法,核心思想是从博弈的最后阶段开始推导,逐步回溯,找到最优策略。

    这种方法通常用于有限步博弈(fite gas),尤其是在完全信息动态博弈中,即所有参与者都知道游戏规则和其他玩家的可能选择。

    逆向归纳法的基本步骤

    1 从最后一步开始分析:假设已经到达博弈的最后一个决策节点,找出在此节点上每个玩家的最优策略。

    2 回溯至前一步:假设前一个决策者知道后续的最优选择,并据此做出最优决策。

    3 重复以上过程,直至回溯到:最终得出的策略就是整个博弈的最优均衡解。

    案例分析

    1 终局博弈(ultiatu ga)

    假设有两个玩家:

    a玩家分配100元,决定给b玩家多少钱(整数)。

    b玩家可以选择接受(aept)或拒绝(reject):

    如果接受,双方按a的分配拿钱。

    如果拒绝,双方都拿不到钱。

    逆向归纳分析

    1 b的决策(最后一步):

    如果b接受,他能获得分配到的钱。

    如果b拒绝,双方都拿不到钱。

    理性b玩家应接受任何非零金额,因为比0更好。

    2 a的决策(回溯):

    a知道b会接受任何非零金额,所以a的最优策略是给b最少的钱(如1元),自己拿99元。

    结论:a分1元,b接受,这是均衡策略。

    2 进入威胁博弈(entry deterrence ga)

    假设一个新企业(e)考虑进入市场,而已有企业(i)可以选择降价竞争(fierce)或维持高价(aodate)。

    博弈树

    1 e决定是否进入市场:

    进入(enter)

    不进入(stay out)

    2 如果e进入,i决定策略:

    降价(fierce):i