雪堆博弈纳什均衡点(雪场博弈中的纳什均衡点)

雪场博弈中的纳什均衡点

什么是雪场博弈?

雪场博弈,又称为雪堆博弈,是一个经典的博弈理论问题。在这个博弈中,两个人轮流从一堆初始为n个石子的雪堆里取石子,每人每轮只能取1至k块石子,最后取完石子者败北。

如何找到雪场博弈的纳什均衡点?

在雪场博弈中,一个稳定的决策状态叫做纳什均衡点。雪场博弈的纳什均衡点存在的基本条件是:每个人在轮到自己做出决策的时候都无法通过选择来改变自己的收益(即不能通过可行的决策获得更多的石子),在这个状态下,每个人都要依靠对手的策略。那么,如何找到这个稳定的决策状态呢?首先,我们需要定义一个函数f,它的值域为{-1,0,1},并且对于每一个状态s,f(s)等于先手(即从哪个人开始游戏)在s这个状态下的最终结果:① 若f(s) = 1,那么先手必胜。② 若f(s) = -1,那么后手必胜。③ 若f(s) = 0,那么状态s为“平局”。接着,我们需要逆推决策树。从最终状态s开始倒推,对每个能够到达s的状态(也就是s的前驱状态),根据是否是自己的回合,分别计算在这个状态下的最终收益是多少(即使用函数f来计算收益)。最后,对于每个状态,我们选择最优的决策来继续游戏,这个决策就是这个状态的纳什均衡点。

雪堆博弈纳什均衡点(雪场博弈中的纳什均衡点)

经过的分析,我们可以得出:对于雪场博弈来说,其纳什均衡点是必然存在的,而且在游戏开始之前就可以计算出来。当n为k+1的倍数时,先手必输,否则先手必胜。对于后手,只需要模仿先手的策略就可以了。这个可以通过递推来证明,就不再在此展开。