和 e 都亏损 -10。
高价(aodate):i赚10,e赚5。
e不进入(stay out):i独占市场,赚15,e赚0。
逆向归纳分析
1 i的决策(最后一步):
如果e已进入,i在降价(-10)和高价(10)之间选择,高价更优,所以i会选择高价。
2 e的决策(回溯):
知道i不会降价,e进入后可以赚5(比0好),所以e会进入市场。
结论:e进入,i维持高价,这是均衡策略。
3 百吉饼博弈(centipede ga)
假设有两个玩家轮流决定“拿走(take)”还是“继续(pass)”奖金池:
初始奖金池2元,每轮增加。
如果某人“拿走”,他获得大部分奖金,另一个人获得少部分。
游戏最多持续4轮。
逆向归纳分析
1 最后一轮:
若轮到玩家b,他会“拿走”,因为这是他的最后机会。
2 倒数第二轮:
玩家a知道b会在下一轮拿走,因此他会在这一轮就拿走。
3 第三轮:
玩家b知道a会在下一轮拿走,因此他会在这一轮就拿走。
4 回溯至第一轮:
a知道b在下一轮会拿走,所以a在第一轮就拿走。
结论:尽管合作能让奖金池增大,但完全理性玩家会在第一轮就终止游戏。
总结
逆向归纳法适用于有限步动态博弈,从最后一步开始推导。
它能帮助玩家预见对手的最优策略,做出最优决策。
适用于终局博弈、市场进入、谈判、竞标等策略决策。
逆向归纳法的应用
逆向归纳法广泛应用于经济、商业、政治、军事、人工智能等领域,特别适用于动态决策问题,即决策者的选择会影响未来的结果。以下是几个典型的应用场景:
1 经济与商业
(1) 定价策略
企业在制定长期定价策略时,