逆向归纳法-管理百科

1.什么是逆向归纳法

逆向归纳法(backward induction)是求解动态博弈均衡的方法。所谓动态博弈是指博弈参与人的行动存在着先后次序，并且后行动的参与人能够观察到前面的行动。逆向归纳法在逻辑上是严密的，然而它存在着“困境”。所谓逆向归纳法是从动态博弈的最后一步往回推，以求解动态博弈的均衡结果。逆向归纳法又称逆推法。它是完全归纳推理，其推理是演绎的，即结论是必然的。^[1]

在完全且完美的动态博弈中，先行为的理性博弈人，在前面阶段选择策略时，必然会考虑后行博弈人在后面阶段中将会怎样选择策略。因而，只有在博弈的最后一个阶段，不再有后续阶段牵制的情况下，博弈人才能作出明智的选择。在后面阶段博弈人选择的策略确定后，前一阶段的博弈人在选择策略时也就相对容易。

逆向归纳法就是从动态博弈的最后一个阶段开始分析，逐步向前归纳出各阶段博弈人的选择策略。

逆向归纳法的逻辑基础：动态博弈中先行动的参与人，在前面阶段选择行为时必然会考虑后行动的参与人在后面阶段中的行为选择，只有在最后一阶段的参与人才能不受其他参与人的制约而直接做出选择。而当后面阶段的参与人的选择确定后，前一阶段的参与人的行为也就容易确定了。逆向归纳法排除了不可信的威胁或承诺。

2.逆向归纳法的运用

逆向归纳法：它的精髓就是“向前展望，向后推理”，即首先仔细思考自己的决策可能引起的所有后续反应，以及后续反应的后续反应，直至博弈结束；然后从最后一步开始，逐步倒推，以此找出自己在每一步的最优选择。^[1]

Image:逆向思维法图1.jpg

图1的求解过程如下：

（a）若2在右，2将选择进（0.3）；∵（0.3）＞（0.0）

（b）若2在左，2将选择退（3.0）；∵（3.0）＞（-1.-1）

（c）在2的选择中1的最大收益是选择进；∵（3.0）＞（0.3）

∴纳什均衡为（进（进，退））均衡解为（进，退），均衡收益为（3.0）

（2）逆向归纳法仅适合有限步动态博弈，而且要求决策者犯的可能性很小。

Image:逆向思维法图2.jpg

如果使用逆向归纳法得到的结果是A选择右边的行动，双方各得3。

如果A在第一步选择下边的行动，B该做何想？只有当A在第二步犯错误的可能性小于1/11时，B才有胆量选择让游戏继续玩下去。于是A极有可能获得10这个最大回报。

1.什么是逆向归纳法

2.逆向归纳法的运用

3.对逆向归纳法的批评[2]

4.逆向推理法的案例分析[3]