博弈论(2)-纳什均衡
又称非合作博弈均衡,是博弈论中的重要术语,以约翰·纳什(johnf nash)命名。在一个博弈的过程中,无论对手的策略如何选择,都会有一方选择某种策略,这种策略叫做最佳对策。如果两个博弈中参与人的策略组合构成了他们的最佳对策,那么这个组合就被定义为纳什均衡。
在给出纳什均衡的解释之前,我们先要搞清楚一个关于最佳对策的概念。
纳什均衡就是描述这种情况。如果在一种情况下每个参与者的策略都是其他参与者当前策略的最佳对应,这种情况称为纳什均衡。
如果一个玩家的策略是对其他玩家任何策略的最佳回应,那么这个策略就是玩家的优势策略。
在纳什均衡下,博弈中没有人会想改变,因为谁改变都可能在博弈中处于劣势。
首先,我们来看看囚徒困境中的纳什均衡。囚徒困境中的纳什均衡是双方都坦白,属于占优策略。
事实上,无论参与人2反抗还是坦白,对参与人2的最佳回应就是坦白。可见纳什均衡点不一定是整体的最优解。可能有人会说,那为什么对双方都没有好处(抵制,抵制)?这里的最佳对策是,无论对手做什么,对自己来说都是最佳策略。在maxmin的最后,他会知道他们为什么会做出坦诚的选择。这是一种规避风险的策略。
& ltimg src= "。/image _ 003/005 . jpg " & gt;
这是纯策略纳什均衡,混合策略纳什均衡,女生看舞蹈p看球的概率是1-p,男生看舞蹈q看球的概率是1-q。
妻子随意的目的是让丈夫别无选择。无论丈夫选择哪种策略,她的预期收益都是一样的。
老公给概率分布,不会让老婆看球看。
据我对我丈夫的了解,他更喜欢看足球。
参与人1的策略选择分布记为,参与人2的策略选择分布记为。假设参与人1的策略分布保持不变,参与人2的策略选择的效用为
剪刀石头布的混合纳什均衡
任何有限博弈(参与者和策略数量有限)至少有一个纳什均衡,可能是纯策略纳什均衡(如剪刀石头布),也可能是混合策略均衡,纳什均衡的多重性(如性别之战)。