正态分布的物理世界和超几何分布的精神世界

是不是总觉得有点不听话？

——因为以上引文有一半是作者杜撰的。

如果说人类对向量的理解意味着对时空限制的把握甚至超越，那么人类对正态分布的研究必然象征着希望控制甚至摆脱命运的摆布。

正态分布又称高斯分布，可以说是科学界最重要的基础之一。它的名字来自数学王子约翰·卡尔·弗里德里希·高。)，也就是10岁的时候，shota心算了一下1和100的总和。(但不叫正投影分布。)

对于正态分布，理工科的同学会比较熟悉。随着统计学在社会科学乃至人文科学中的应用(以及所谓的“大数据”热潮)，正态分布的应用已经突破了传统的物理世界，逼近了人类的精神世界——从机器学习到神经科学研究，从行为心理分析到思想哲学思考。

正态分布有很多优雅的性质和广泛的应用，这里就不赘述了。

其中最重要的一个叫做“中心极限定理”，指出当大量独立的随机变量相加在一起，其平均值会呈现正态分布。

题外话:虽然现实中大家都在用，但要达到富足和独立于生物这两个最根本的条件，几乎是不可能的。

高等数学、微积分、高等代数、高等几何、概率统计等。，高在哪里？

两个字:极限。

这一定是启蒙运动带给人类的最伟大的发明。不幸的是，它几乎只被科学界使用，所以也许“发现”这个词更准确。

超几何分布也在学习概率论是最基本的分布之一，但应用远不如正态分布广泛。其实它的应用几乎只和抽样有关，比如产品抽样合格率，德州扑克的赢面。

在一定条件下，也可以用正态分布来近似——本质上是上面提到的“中心极限定理”的一个应用。

作者之所以把超几何分布与人类的精神世界联系起来，是因为它的应用，或者说它的定义从一开始就更倾向于概率论的实验思维，而不是统计学的观察性和分析性。

当然，正态分布的伟大之处在于两者的实现。

在这里，我想复述一下概率论比统计更抽象的原因。

统计如下:一枚公平硬币抛1000次，发现461次是面朝上；正面出现的频率为0.461；如果你扔10000次，或者更多次，这个频率会越来越接近0.5。

概率说:每投一枚公平的硬币，被倒挂的概率是1/2。

换句话说，概率论是先验的，统计学是后验的。

对了，把两者联系起来的是贝叶斯定理。

不管现实世界是什么样的，人类对物理世界的描述往往是正态分布的。

当我们估计距离时，比如用精确到厘米的刻度测量桌子的长度，我们需要估计毫米的值。当我们向目标射击、投掷、踢球时，比如射击参加奥运会的运动员，每个人都希望枪能击中靶心...投篮命中率，赌博赔率，人均收入，预期寿命，这些都有所谓的期望值(也就是平均值)的概念——而这个概念有效需要两个条件:1。概率分布只有。2.概率分布几乎是对称的。在合格的概率分布中，正态分布是最方便、最持久的一种。

物理世界本身，由于微观粒子的随机性和大量的宏观观测，至少在经典物理中考虑随机性的时候，比如估计和控制火箭飞向太空，用正态分布来处理整个过程中的不确定性就足够了。

但是，如果火箭搭载的是宇航员，他可以通过输入一串4位数的密码来解锁一个紧急按钮(也许是为了发射核弹来清除一颗无法避免的小行星)——而且由于情况紧张，他只记得密码的前2位数，所以只能随机输入后2位数。他可能会犯很多次错误，并重复这些错误，直到他成功或死亡。

在整个过程中，最后一次密码输入和前一次密码输入并不是相互独立的，一个* *只有100种可能，正态分布介入的空间并不大。

同样，在玩德州扑克的过程中，手握黑桃J、Q、K、A，下一张牌正好是黑桃10的概率与半毛钱的正态分布无关。

作者认为超几何分布反映了战略选择等概念认知——它们属于精神世界，特点是在少数选项中非此即彼。

至于超几何分布和正态分布最大的区别，就是它有一个相当大的偏斜度，尤其是在样本基数不大的情况下。

有一个经典实验:被试阅读一篇推理小说的文本，列出他们眼中的所有嫌疑人，并标注出这个人是凶手的概率。

实验者发现，几乎没有一个被试在嫌疑人名单上，概率之和是100%——这显然是不合逻辑的。

但真的只是因为受试者缺乏或忽略了这一基本的统计学常识吗？

主体在估计嫌疑人的概率时，本能地意识到这个值本身的不确定性。换句话说，这个值本身就是一个随机数，它有自己的概率函数来描述它的分布。

当我们被要求只写下一个数值来表示这个函数时，我们本能地使用众数(对应于概率分布的峰值)而不是平均值。

——这种本能的体验是，当我们从符合这种分布的样本中取样时，得到的数更容易接近众数。

但是模式不是平均的。对于概率分布对称的随机数，众数、平均数、中位数都是一个东西，而对于超几何分布不是。

“已知一组随机数之和等于1，所以它们的平均值之和也等于1。这个命题无疑是正确的，但同样的命题对于大多数人来说是无效的。

另外，对于大多数被试来说，“嫌疑人是凶手的概率”并不是指“嫌疑人在这个群体中是凶手的概率”，而是“我对嫌疑人是凶手有多大的信心”。

很明显，又回到了贝叶斯。

现实中太多的研究对象根本达不到使用中心极限定理的要求，但它毕竟被滥用了——因为它方便易用，大多数情况下结果不会太差。

许多复杂的随机过程可以只用一个均值和一个方差来描述，这不是很奇妙吗？

然而，真的不是因为懒吗？

“记忆是不可靠的，所以你需要记住的越少越好。”——这种好听的话只是借口。作者因为懒得背，加入了相关专业。(后来发现还是要背...而且是用我可能听不懂的语言写的。)

但是数学家是严谨的，他们不会滥用任何定理。很多时候，他们是如此的严谨，以至于很多数学理论都是先有猜想，再有突破。物理学家是几个世纪以来的先锋，计算机从千年以来也加入了潮流。

所以，滥用定理的不是数学家，而是用数学工具做应用学科的家伙。

然而，作者仍然把这种虐待的原罪归咎于数学家，仿佛在推卸责任。

因为他们对应用学科如此冷漠，数学最根本的批判性和建设性都没有传承下去。数学作为所有理工科专业的必修课，无论东方还是西方，不仅没有受到广泛的喜爱，反而受到公开的鄙视。

——这一定是数学家的问题。

作者当然无法理解:当一个人真正沉浸在自己所热爱的事物中时，他不需要与人攀比，贬低他人来获得自我满足。

从单个物体到多个物体，从确定事件到随机事件，人类逐渐开始从数学上研究自己的行为。

1994年，小约翰·福布斯·纳什和另外两位博弈论专家获得了诺贝尔经济学奖。

那么诺贝尔为什么不设立数学奖呢？

因为数学家总有其他的办法——这是个笑话，但颁发诺贝尔奖最重要的条件之一就是“活着”。

英年早逝的数学家太多了，他们的数学理论能在有生之年得到广泛应用的更是凤毛麟角。纳什绝对是个幸运的人。

作为普林斯顿大学的毕业生，纳什代表了新一代数学家走向应用学科，尤其是经济相关领域的方向。

当然，博弈论的应用远不止经济学，但最后，今天全世界的经济学家都习惯了数字，开始迷信数据。根据一项统计，如今普林斯顿经济系的毕业生比二战前后的毕业生更自信——因为他们使用数学工具，而不是根据历史经验分析问题。

推动人类文明进化的不是技术，而是信仰。网络技术在互联网时代到来之前就已经成熟，但当时互联网只被一小部分人使用，没有商业化，所以全世界都缺乏基础设施和相关人才。

计算机技术进入寻常百姓家，不是因为它有用，而是因为它的有用性得到了寻常百姓家的认可。纳什在二战后进一步推动了经济学的数学化，这一趋势反过来推动了金融机构和一般产业的数字化。收集的数据越来越多，数据分析也越来越有用。整个世界被巨大的电线和光缆联系在一起，地球真的变成了一台巨大的计算机。《银河系漫游指南》已经成为一个预言。

另一方面，如果经济学没有被那几代人数学化，金融市场上跳动的数字将毫无意义，我们仍将生活在一个只能通过私人渠道获取有效信息的时代——非数字信息很难通过数字载体传递。记住音乐、视频等多媒体是近几年网络足够发展之后的东西，早期的电脑和网络只能处理数字和字符。即便如此，证券交易所仍然是第一个采用互联网的地方。

总之，纳什的贡献不仅仅是经济意义上的，更是经济意义上的。

2065438+2006年3月，AlphaGo战胜李世珍。

围棋是典型的信息完全确定的二人零和博弈。

这里我首先要强调的是完美信息和完全信息的区别。简单来说，在完全信息下，博弈的参与者都知道对方的目标；而完整的信息只是关于游戏本身。

举个例子，假设一个恐怖分子像电影里那样控制了全球网络系统，通过发射核导弹攻击韩国来威胁当时的韩国总统，那么李时珍不得不故意输掉比赛——而AlphaGo只是一个围棋AI，并不是幕后黑手；那么这个游戏就不完全是信息型的。但是只要游戏是围棋，而且你不能用魔法改变棋子的位置，那么这个游戏一定是完美的。

确定性很好理解，感动中没有遗憾。想在明星位置上移动的棋子，不会因为莫名其妙的原因，落在小眼或者三三。与随机性相比，确定性有两个优点。

第一，对于玩家来说，游戏在理论上是有确定解的。

当然，其实围棋的复杂度是非常大的，远远超过各种棋类。目前国际象棋中运用最熟练的是象棋AI，有“棋手+AI”组队对弈的职业比赛。AI给玩家提建议，玩家可以自由选择是否遵从，或者另辟蹊径。虽然大多数时候，AI给出的建议会受到青睐，但也有很多玩家顿悟，走出了两个AI都没想到会赢的招式。

围棋的复杂与棋子的移动方式无关，完全源于其庞大的19x19的棋盘。就像我们在学习围棋的早期可以使用小棋盘一样，早期的围棋AI也是从挑战小棋盘开始的。

二是黑白分明，赢了就是赢，输了就是输。AlphaGo和李世珍的对战是五战，也就是三局两胜。如果这场比赛是抛硬币，五局三胜，任何人都可以击败AI，任何人都可以获得世界冠军。

最重要的是，由于博弈的收益(无论是名字还是利润)都是和棋盘上的结果直接挂钩的，所以完美信息和完全信息几乎没有区别。就算李时珍真的要输，他输了比赛的事实也不会改变。

最后，围棋是一对一的零和游戏。

在战争游戏(或者真实战争本身)的情况下，这种游戏是零和的，所以直接战斗是不可避免的。但如果兵力众多，完全有可能结成联盟入侵歼灭敌人。

美国和苏联一直都有各自的目的，但是为了打败纳粹，最后还是联合起来了，虽然只是暂时的。但即使在那个时间和地点，他们也不可能真正合作。据说老谋深算的政客们在战争开始前必须计算好战后的利益分配。如果双方都没有这样的领导力，战后如何形成实力几乎对称的冷战格局？

但是，随机游戏会带来问题。

一般认为，随机性的问题在于运气的成分。也就是说，如果围棋是随机元素的游戏，AlphaGo五局三胜，人类可以大喊“运气不好”，然后要求再来300回合。

但是这个问题就在这个固执的要求下被解决了——就是通过很多比赛，我们可以看到平均分。

2015年，阿尔伯塔大学的迈克尔·鲍林(Michael Bowling)教授在《科学》杂志上发表了一篇论文:他和他的同事“微弱地”解决了双德州扑克——他们开发的程序仙王座(Cepheus)，在知道自己两边都有牌的情况下，可以保证不败。注意这里的“弱”是强调知道双方的牌，也就是把德州扑克这种原本是不完全信息的游戏简化成完全信息的游戏；而且“不败”不是说每场都不会输，而是从很多比赛来看，如果用仙王座赌博，平均不会输。

当然，现实中的问题是，要证明哪个更好，哪个更差，需要多少次？参加比赛的人类和AI都会发生变化，所以严格来说，没有办法进行完全重复的实验。

下一个问题是不完全信息。

从某种意义上说，不完全信息也可以是随机的。继续以扑克为例，黑桃a对自己是确定的，对对手是不确定的。

然而，这种不确定性对战略的影响与上一段提到的相互协议的随机性有很大不同。虽然对于对手来说，“这张未知牌终究是黑桃”的概率和“张新发下一张牌是黑桃”的概率是一样的；然而，“黑桃a基于该牌加注”的概率与“黑桃a基于该牌加注”的概率完全不同。牌本身的不确定性，复合了基于牌的所有可能策略的不确定性，这才是现在真正的不确定性。

在回归理论的情况下，这样的不确定性只是增加了计算量——但毫无疑问，AI破解随机游戏，因此变得更加困难。

最后是多人游戏的问题。

多人游戏在信息博弈不完美的前提下，首先增加了未知牌，直接增加了数量上的不确定性。

同时，如上一节所述，现实中多人游戏也有可能形成联盟，而游戏各方可能并未意识到类似协议的存在——即多人游戏加剧了信息的不完善，从结构上再次复合了多层次的不确定性。

最关键的问题是，我们如何测试在某个(或这类)AI上谁比人类更优秀？假设一个团队开发了一个优秀的麻将AI，让两个AI和两个人类比赛有意义吗？人类会为了人类的尊严而互相交流吗？AI也会作弊吗？

网游平台设置这样一个AI或许是合理的:进入游戏的玩家无法根据对手ID判断对手是否为AI；游戏够多了。——但为了赢，提前研究对手的牌路(棋路)才是职业棋手应该做的。这样的匿名对人性的一面是不是天生就不公平？比如AlphaGo收集了很多经典的棋谱，包括李世珍本人，但是AlphaGo自己的棋谱少得可怜。李时珍在比赛开始前就已经处于不利的局面。

在介绍不完全信息随机多人游戏的过程中，作者举了两个典型的例子:扑克和麻将。

作者的问题是:为什么这种游戏总是和赌博有直接关系？

这个问题似乎有点不合理。根据定义，几乎所有的运动都是随机游戏。

比如射击，优秀的选手可以让每一枪都接近靶心，但不可能保证每一枪都正中靶心，所以比赛不是决斗，而是一枪决定胜负。再比如径赛，成绩肯定会受到选手身体状况、天气状况等因素的影响，尤其是冲刺和“压枪战术”，为比赛增添了不少亮点。团队项目，比如足球，受到太多随机因素的影响，或者是自然的，或者是人为的。

并不是说体育和赌博无关，比如赌博。但只要运动员本人不赌输，他终究会努力赢，也就是说，原则上这项运动可以独立于赌博，只为荣誉而战。但是，就算德州扑克和麻将完全是赌博，毕竟也要用筹码等道具来表示输赢额度。

另外，信息不完善也不是问题，这在团体项目中很常见:硬球给出的一系列花式动作，排球二传手发球时在队友背后打手势的手势，2006年1/4世界杯点球大战前莱曼拿到的小纸条...

至于多人项目，体育比赛中似乎没有扑克或麻将这样的单人项目。比如F1，长跑，骑行都强调团队合作。阿姆斯特朗连续七次赢得环法自行车赛冠军，不仅仅是因为服用了药物。但是，类似的合作很容易被认为是扑克或麻将中的作弊行为。这里不探讨这个概念的区别，因为很可能是赌博在先，才催生了团队合作的禁忌，而不是相反。

基于中国和日本，世界范围的麻将比赛正在缓慢推进。

国内相关机构正在执行一个类似于“重复桥牌”的规则，即不同牌桌每局的构成与东南西北四位玩家的构成相同。和桥牌一样，目的自然是减少随机性。

但是，我认为通过增加不同牌桌同座玩家的相关性来降低随机性意义不大——或者说适得其反。随机生成的卡片数量减少，实际上减少了样本量，增加了方差。

当然，由于游戏是完全在电脑上进行的，同时玩家的卡效也被电脑记录下来，所以还是有相当大的意义的。

为了减少随机性，日本顶级比赛采用“竞技”，也叫“一个规则”，和一般的日麻区别不大，主要是减少了珍贵牌的数量。

说到减少随机性，秃鹫窝麻将大概是个好办法:

当然，最后一个是不需要的。

当作者声称运动是随机的时候，我相信很多人虽然赞同，但是并不想赞同，至少是不想完全赞同。

——只要你不断提高自己的水平，最终会碾压弱小的对手。但这种比赛并不是观众，甚至是顶尖运动员所向往的。我们从心底渴望一场载入史册的巅峰对决。

没错，这就是竞争的魅力:两个势均力敌的高手，剑和戟扬言要杀了自己，一瞬间，几分之一秒...

而像扑克或者麻将这种完全靠运气的游戏，即使是新手也有可能击败世界冠军。

如果只是一场比赛，那是肯定的，但是整场比赛呢？顶级比赛，尤其是冠军赛，不止一整天，甚至两天？-在这种情况下，如果新手能夺冠，难道真的不是其他玩家的问题吗？

整体的浩瀚洪流，辅以细节的不确定性，这就是我们的心态。

我们的祖先躲过了野兽的袭击，在动荡中幸存下来。在生殖崇拜的古代，更多的是善，更多的是神圣，更多的是赞美诗。

但是，我不知道什么时候“稀缺才是最有价值的东西”不仅仅是供求关系的自然平衡，更是直接印在了我们的文化和基因里。

我们把这个规则赋予所有我们发明的游戏，比如战争、狩猎、体育和象棋——最不容易得到，最有价值。

棋牌和其他例子最大的区别是什么？

——也就是棋牌的规则是我们制定的，不受物理规律的约束。

我们习惯了正态分布的物质世界，却只是超几何分布的精神世界里的小顽童。对于不受约束的人，管教的方法自古就有:

赌博，让参与者承担物质资料的输赢方式，是让参与者承担责任的最好方式。

在回答完本章开头的问题后，我最后会讲两个分布，或者说两个世界的区别。

在物理世界中，我们与均值和方差之间的负相关做斗争。更大的回报往往意味着昂贵的成本和高风险。

这并不是说我们制定的游戏规则中没有这种情况。把超几何分布的物体直接对应到精神世界也是作者的极端。

但是正态分布是基于事物本身，而超几何分布是基于组合，也就是事物之间的关系——这样的概括应该足够中肯。

物质世界的对象，以及我们的一般经验，都来自于事物的重复和堆积。然而，自从生物诞生以来，或者更早，自从生物大分子出现以来，进化的复杂性不仅是数量上的，而且是结构上的。而人类社会就是所谓的“上层建筑”——就像生物作为一种物理存在必须遵循所有的物理规律，但没有必要用量子力学和相对论去研究猫狗的毛色——我们的精神世界是建立在物理世界的基础上的，这并不意味着两个世界的规律是普适的。

最后，我想向整个启蒙时代致以最诚挚的敬意和最深切的遗憾。

启蒙运动提倡理性——不仅是在科学研究中，也包括对人性和整个社会文明的自我发现——但一切都只是幻想，人类只会用最古老的方式承担责任。