职场小聪明第475章逆向归纳法_都市言情

    逆向归纳法（backward duction）

    逆向归纳法是一种常用于动态博弈的求解方法，核心思想是从博弈的最后阶段开始推导，逐步回溯，找到最优策略。

    这种方法通常用于有限步博弈（fite gas），尤其是在完全信息动态博弈中，即所有参与者都知道游戏规则和其他玩家的可能选择。

    逆向归纳法的基本步骤

    1 从最后一步开始分析：假设已经到达博弈的最后一个决策节点，找出在此节点上每个玩家的最优策略。

    2 回溯至前一步：假设前一个决策者知道后续的最优选择，并据此做出最优决策。

    3 重复以上过程，直至回溯到：最终得出的策略就是整个博弈的最优均衡解。

    案例分析

    1 终局博弈（ultiatu ga）

    假设有两个玩家：

    a玩家分配100元，决定给b玩家多少钱（整数）。

    b玩家可以选择接受（aept）或拒绝（reject）：

    如果接受，双方按a的分配拿钱。

    如果拒绝，双方都拿不到钱。

    逆向归纳分析

    1 b的决策（最后一步）：

    如果b接受，他能获得分配到的钱。

    如果b拒绝，双方都拿不到钱。

    理性b玩家应接受任何非零金额，因为比0更好。

    2 a的决策（回溯）：

    a知道b会接受任何非零金额，所以a的最优策略是给b最少的钱（如1元），自己拿99元。

    结论：a分1元，b接受，这是均衡策略。

    2 进入威胁博弈（entry deterrence ga）

    假设一个新企业（e）考虑进入市场，而已有企业（i）可以选择降价竞争（fierce）或维持高价（aodate）。

    博弈树

    1 e决定是否进入市场：

    进入（enter）

    不进入（stay out）

    2 如果e进入，i决定策略：

    降价（fierce）：i

第475章 逆向归纳法(1/5)

第475章逆向归纳法(1/5)