什么是纳什均衡?这份报纸急需。谢谢你

“纳什均衡”:合作是有利的“利己策略”。它必须符合以下黄金律:你希望别人如何对待你,你就如何对待别人,但前提是别人也这样做。那就是中国人说的,“己所不欲,勿施于人”。但前提是你不要对我做你不想让我做的事。

约翰·纳什(Johnf nash),65438-0994年诺贝尔经济学奖获得者,美国普林斯顿大学。纳什因为在博弈论领域的贡献获得了诺贝尔经济学奖。他提出了“纳什均衡”理论,关于博弈论最广为人知的故事叫做“囚徒困境”:

据说有一天,一个富人在家里被杀,财物被盗;在侦破此案的过程中,警方抓获了犯罪嫌疑人张三、李四两人,并从其住处在被害人家中找到了遗失物。但是,他们否认杀了人,辩称只是偷了东西。于是民警将两人隔离,分别放在不同的房间审讯。警察分别对张三和李四说:“因为你们有盗窃的确凿证据,可以判你们1年有期徒刑。但是我可以和你做个交易。如果你单独供认杀人罪,我只判你三个月有期徒刑,但你的同伙要判10年有期徒刑。如果你拒不坦白,被伴侣举报,那么你将被判10年有期徒刑,他只判3个月有期徒刑。但是,如果你们都坦白,那么你们都将被判处五年监禁。”

张三合和李四怎么样?他们面临着一个两难的境地——坦白还是否认。很明显,最好的策略是双方都否认,结果大家都只判一年。但因为两人是隔离的,所以不能互相勾结。根据亚当·斯密的理论,每个人都是“理性经济人”,都会从利己的目的出发进行选择。这两个人会有这样一个计算过程:如果他招供了,我不招供就得蹲10年的监狱,而他招供才5年,所以划算;我坦白,他就坦白,他就得坐五年牢。如果他不坦白,我只坐三个月,他坐10年的牢,也是很划算的。考虑到以上情况,不管他有没有表白,对我来说都是一笔不错的交易。两个人都会用这种脑子。最后两个人都选择了绝招?结果,他们被判处五年监禁。原本对双方都有利的策略(否认)和结局(判1年有期徒刑)都不会出现。这就是著名的“囚徒困境”。它实际上反映了一个非常深刻的问题,就是个人理性和集体理性的矛盾。

其实如果两者都否定的话,每一句都是1年,明显比两句都5年要好,但是在实践中做不到,因为不符合个体理性的要求。作为一个理性的人,张三和李四会认为,如果我否认,对方坦白,我可能会被判10年,理性的人是不会冒这样的风险的。但理性选择的结果是,张三和李四都被判了5年,被判1年的最好结果并没有出现。换句话说,对每个人来说是理性的选择,但对整个集体来说是不理性的。

这与传统经济学的结论相反。传统经济学认为市场经济中有一只“看不见的手”,它调节的结果是每个人的理性选择最终会导致整个集体的利益最大化。其实就像囚徒困境一样,这只看不见的手在只有少数人参与选择的情况下会失去作用,因为这个时候人们的决策过程会考虑其他参与者的想法,就像赌博和象棋一样,和买卖双方数量巨大时的完全竞争一模一样,需要一套新的思路进行研究。

在上面的例子中,我们注意到一个非最优的结果,就是两个人都选择了弗兰克策略,并因此被判了五年。这个结果被称为“纳什均衡”,也叫非合作均衡。博弈论中最基本的概念是“纳什均衡”。说到博弈论,说的最多也是最有名的就是“纳什均衡”。纳什均衡就是指这样一种策略组合,由所有参与者的最优策略组成。也就是说,在给定他人策略的情况下,没有一个单一参与者有选择其他策略使自己获得更大利益的主动权,因此没有人有打破这种均衡的主动权。

当然,虽然“纳什均衡”是由单个人的最优策略组成的,但并不意味着它是一个整体最优的结果。如前所述,在个人理性和集体理性冲突的情况下,每个人对自身利益的追求导致的最终结局是一个“纳什均衡”,这也是一个对所有人都不利的结局。

从这个意义上说,纳什均衡提出的悖论实际上动摇了西方经济学的基石。同时也提醒我们,合作是一种有利的“利己策略”。事实上,如果上述两个犯人可以合谋,那么他们肯定会选择两个都不认,以盗窃罪判刑1年。当然,正是考虑到这一点,警方对他们进行隔离审查,了解真相,对犯人最有利的合作结果并没有出现。“纳什均衡”描述的是非合作博弈均衡。现实中,非合作的情况比合作的情况更常见。因此,“纳什均衡”是冯·诺依曼和摩根·斯特恩合作博弈论的重大发展,甚至可以说是一场革命。

如今,纳什均衡被广泛应用于各个研究领域,尤其是在制度分析中。应用它我们可以得出一个非常重要的结论:一个制度安排要想有效,必须是一个纳什均衡。否则,这种制度安排是无法成立的。