生活中的博弈论论文
如果在某种情况下没有参与者可以单独行动来增加收益,这种策略组合称为纳什均衡点。
经典的例子是囚徒困境,这是非零和博弈。大意是,一个案件两个嫌疑人分开审理,警员分别告诉两个犯人,如果你招供,但对方不招供,你马上被释放,对方判十年有期徒刑;如果两人都供认不讳,他们将被判处两年监禁。如果两个人都不坦白,那是最有利的,只判半年。所以两人都同时处于坦白或不坦白的两难境地。但彼此无法沟通,于是两人都从自己的利益角度出发,按照自己的理性选择了表白。这种情况叫做纳什均衡点。此时,个体的理性利益选择与整体的理性利益选择是不一致的。
学术争议和批评
首先,证明了非合作博弈的纳什均衡/不动点是非建设性的。也就是说,纳什通过角谷静夫不动点定理证明了均衡不动点解的存在性,但他无法指出如何通过任何构造算法来实现均衡不动点解。这种非结构性的发现对现实生活中的博弈作用有限,即使知道均衡不动点解存在,很多情况下也找不到,所以还是解决不了问题。【出处请求】数学意义上,纳什不是。
随着《美丽心灵》的西尔维娅·纳萨尔(书作者)和朗·霍华德(电影作者)等主流媒体的介入,角谷静夫在他们的作品中完全被忽略了。有人认为,“纳什均衡”更恰当的名称应该是“角谷静夫-纳什博弈-理论不动点”或“卡库塔尼-纳什均衡”。没有角谷静夫的不动点定理,纳什的证明就没有什么学术意义。
第二,纳什的非合作博弈论模型只是突破了博弈论的一个局限。一个更大的局限是,博弈论往往要面对由数十亿个节点的巨大物体组成的复杂社会经济行为,但冯诺依曼和纳什的研究是针对两个或三个节点的小规模博弈论(有人称之为微小规模的玩具箱)。
这个假设的不完善可能比大家都合作的假设更严重。因为在经济学中,一个庞大的社会中,所有人都是极不可能合作的,非合作的情况通常在巨大物体的情况下更为常见,但在两三个节点的小规模经济中影响较小。既然合作的前提已经改成了不合作,那还是停留在两三个节点的小范围博弈。这是一个不可忽视的缺陷。最近,香港城市大学和北京清华大学的学者邓小铁和姚期智在基于复杂性理论的大规模博弈论方面取得了进展。
麻省理工学院计算机科学博士生的博士论文(PDF http://people.csail.mit.edu/costis/thesis.pdf)认为经济学家的推测是错误的,他获得了2008年美国计算机协会论文奖。几乎不可能找到纳什均衡。Constantinos Daskalakis目前是麻省理工学院电气工程和计算机科学系的助理教授,他与加州大学伯克利分校的Christos Papadimitriou和英国利物浦大学的Paul Goldberg合作,证明了对于某些游戏来说,世界上所有计算机的能力都很差。纳什均衡点在整个宇宙生命中都是无法计算的。达斯卡拉基斯认为,计算机找不到,人类也找不到。纳什均衡属于NP问题,达斯卡拉基斯证明了它属于NP问题的子集,不是NP完全问题,而是PPAD完全问题。这项研究成果被一些计算机科学家认为是近十年来博弈论领域最大的进展。
然而,在同一篇论文中,Daskalakis也指出,如果参与者是匿名的,那么只需要多项式时间就可以逼近纳什均衡。
现实的例子
以上例子看似不自然,但在现实中,人类社会和自然界都可以找到类似囚徒困境的例子,将结果划分到同一个支付矩阵中。社会科学中的经济学、政治学、社会学,自然科学中的动物行为学、进化生物学,都可以用囚徒困境来分析。