什么是纳什均衡?

也称为非合作博弈均衡

来源

约翰·纳什(Johnf nash)于65438年至0948年作为一名年轻的数学博士生进入普林斯顿大学。他的研究成果可以在他的博士论文《非合作博弈》(1950)中找到。这篇博士论文促成了N人博弈中的均衡点(1950)和非合作博弈(1951)两篇论文的发表。纳什在上面的论文中介绍了合作博弈和非合作博弈的区别。他对非合作博弈最重要的贡献是明确了一个包含任意人数和任意偏好的一般解概念,即不局限于两人零和博弈。这个解的概念后来被称为纳什均衡。

编辑此段落定义

假设有n个参与博弈的人,给定其他人的策略,每个人选择自己的纳什均衡。

最优策略(个人最优策略可能依赖也可能不依赖于他人的策略),从而使自己的利益最大化。所有玩家的策略构成一个策略剖面。纳什均衡就是指这样一种战略组合,由所有参与者的最优策略组成。也就是给定别人的策略,没有人有足够的理由打破这个均衡。纳什均衡,本质上是一种非合作博弈状态。当达到纳什均衡时,并不意味着博弈双方都处于不动状态。在顺序游戏中,这种均衡是在玩家的连续动作和反应中实现的。纳什均衡并不意味着博弈双方达到了整体最优状态。下面的囚徒困境就是一个例子。

编辑此段落的标准定义

纳什均衡的定义:在博弈G = (S1,…,Sn: U1,…,UN)中,如果任一局中人在每个局中人的一个策略构成的博弈组合(s1*,…,sn*)中进行博弈,Sn*),即UI (s1*,… S * I-1,Si *,S * I+1,…,Sn *)≥UI(S 654338

编辑这个纳什均衡的经典案例:囚徒困境

(1950,数学家塔克是斯坦福大学的客座教授。在给一些心理学家做演讲时,他讲了两个囚犯的故事。假设甲、乙两个小偷共同作案,私自入室,被警察抓住。警察把这两个人放在两个不同的房间里审问。对于每一个嫌疑人,警方给出的政策是:如果一个嫌疑人供认犯罪并交出赃物,纳什均衡将被证明。

据证实,他们两人都被判有罪。如果另一名嫌疑人也供认不讳,他们各被判处8年徒刑;如果另一个犯罪嫌疑人在没有坦白的情况下否认,会以妨碍公务罪(因为有证据证明他有罪)再判两年有期徒刑,坦白者减刑八年后立即释放。如果两人都否认,警方因证据不足不能判他们盗窃罪,但可以以非法侵入罪各判1年有期徒刑。表2.2显示了这个博弈的收益矩阵。表2.2囚徒困境博弈A╲B供认否认

表白-8,-8 0,-10

拒绝-10,0 -1,-1

关于案件,很明显最佳策略是双方都否认,结果大家都只判了1年。但由于两人的隔绝,首先从心理学角度来看,双方都会怀疑对方为了自保而背叛自己,其次亚当·斯密的理论假设每个人都是“理性经济人”,都会以利己为目的做出选择。这两个人会有这样一个计算过程:如果他招供,我就否认,我要坐牢10年,招供最多也就8年;如果他否认,我可以被释放,他要坐牢10年。考虑到以上情况,无论他是否坦白,我坦白都是划算的。两个人都会用这样的脑子。最终,两人都选择了坦白,被判处有期徒刑八年。基于经济学中理性代理人的前提,两个囚徒在各自利益上的选择是忏悔,原纳什均衡

这种对双方都有利的策略是不会出现的,除非他们坦白,都被释放。就这样,两人都选择了坦白的策略,被判了八年监禁。纳什均衡首先挑战了亚当·斯密的“看不见的手”原理:根据斯密的理论,在市场经济中,每个人都是从利己的目的出发,最终整个社会达到利他的效果。但是,我们可以从纳什均衡中得出一个“看不见的手”原理的悖论:从利己目的出发,结果会是损人不利己,对自己无益。

编辑这一段的另一个简单例子。

你坐在图书馆里,一个陌生的美女过来搭讪,要求和你玩一个数学游戏。美女建议道:“让我们各自展示硬币的一面,要么正面,要么反面。如果我们都是头,那我给你3元,如果我们都是尾,我给你1元,剩下的你给我2元。”那么我们应该和这个女孩玩这个游戏吗?这基本上是废话,当然。问题是,这个游戏公平吗?根据不同的规则,每个博弈有两种纳什均衡。一种是纯策略纳什均衡,即玩家可以采取固定的策略(比如总是玩正面或者反面),让每个人赚的最多或者亏的最少;或者混合策略纳什均衡,而在这个博弈中,应该采用混合策略纳什均衡。N\m美女有头,美女有尾。

你玩正面+3,-3 -2,+2。

你玩尾数-2,+2 +1,-1。

假设我们正面的概率是x,反面的概率是1-x,为了利益最大化,我们应该在对手露出正面或者反面的时候获得相等的收益,否则对手总是可以改变正面和反面的概率来减少我们的总收益,这里列出的等式是3x+(-2)*(1-x)=(-2)* x+1 *(1-x)。将x= 3/8代入收益表达式3*x+(-2)*(1-x)可以得到每次的预期收益,计算结果为-1/8元。同样,假设美女脸的概率是y,她脸的概率是1-y,等式-3y+2(1-y)= 2y+(-1)*(1-y)等于3/8,每次对美女的期望。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采用(3/8,5/8)的方案,无论你采用什么方案,都改变不了局面。如果都是人头,每次的预期收益是(3+3+3-2-2-2-2)/8 =-1/8元;如果把所有的尾部都显示出来,那么每次的预期收益是(-2-2-2+1+1)/8 =-1/8元。任何策略无非是以上两种策略的线性组合,所以期望仍然是-1/8元。但是当你也采取最优策略的时候,至少可以保证你损失最小。否则你肯定会被美女采取的策略盯上,从而失去更多。

编辑这一段的重要影响

纳什均衡理论奠定了现代主流博弈论和经济理论的根本基础。正如克雷普斯(1990)在《博弈论与经济建模导论》中所说,“在过去的二三十年里,经济学经历了一场方法论、语言和概念的温和革命,非合作博弈论成为范式的中心...纳什均衡的重要影响可以概括为以下六个方面:1。它改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具已经渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学学科的大部分学科中,改变了这些学科的内容和结构,成为这些学科的基本研究范式和理论分析工具,从而改变了原有经济学理论体系各个分支的内涵。2.扩大了经济学研究经济问题的范围。原始经济学缺乏对不确定因素、变化的环境因素以及经济个体之间的相互作用进行建模的有效方法,因此无法解剖和分析微观层面的经济问题。纳什均衡及相关模型分析方法,包括扩展博弈方法、逆向归纳法、子博弈完美纳什均衡等概念方法,为经济学家提供了深入的分析工具。3.加强了经济研究的深度。纳什均衡理论不回避经济个体之间的直接互动,也不满足于经济个体之间复杂经济关系的简单化。在分析问题时,不仅仅停留在宏观层面,而是深入分析表象背后的深层次原因和规律,强调从微观个体行为规律的角度发现问题的根源,从而更深入、更准确地理解和解释经济问题。4.形成了基于经典博弈的研究范式体系。也就是说,我们可以将各种问题或经济关系按照经典博弈的类型或特点进行分类,按照经典博弈相应的分析方法和模型进行研究,从而方便地将在一个领域获得的经验移植到另一个领域。5.经济学与其他社会和自然科学之间的关系得到了扩大和加强。纳什均衡之所以伟大,是因为它平凡,它几乎无处不在。纳什均衡理论不仅适用于人类的行为规律,也适用于人类以外的其他生物的生存、运动和发展规律。纳什均衡和博弈论的桥梁作用使得经济学与其他社会科学和自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。6.改变了经济学的语言和表达方式。在进化博弈论方面颇有造诣的坎多里(1997)曾经对保罗·萨缪尔森的名言做了一个幽默的引申,“你甚至可以把一只鹦鹉变成一个训练有素的经济学家,因为它只需要学会两个词,那就是‘供给’和‘需求’。”他说,“现在这只鹦鹉需要。