统计陷阱的辩证法与实践

当你掷骰子,连续掷出五个六的时候,很多人会认为6下次再次出现的几率会降低,因为在我们看来,掷出一个六本身就不容易。再加上已经连续扔了五次,下次扔个六的几率自然更低。其实投出六的概率还是1/6,这个在我们高中数学排列组合里已经学过了。独立事件不会影响彼此的概率。但是,虽然我们知道这些,我们还是会认为概率降低了,这样的事情数不胜数。

当我们经常看到飞机失事和犯罪的新闻时,会觉得飞机失事率和犯罪率越来越高,觉得坐飞机越来越不安全,觉得这个世界越来越糟糕。其实这些都只是媒体报道聚焦某一方面而造成的“假象”。某某产品真垃圾,某某网站服务态度差。这样的抱怨在网上比比皆是,几乎没有任何产品和网站能逃过。真的有那些人说的那么差吗?不一定,因为人们往往只会抱怨那些不幸的事情,而我们的眼里往往只容得下这些负面的评论,我们会对它们印象特别深刻。所以我们忘了还有很多沉默的大多数用户等正面评价。

和媒体一样,我们的记忆也会有选择性,尤其是遇到重大事件时,很容易回忆起事发前后一些我们认为“不正常”的事情,并认为这是征兆。其实这样的行为经常发生,但通常这些东西对我们没什么用,所以就忘了。这是“马后炮”。我提到了跳高引起地震的例子。因为地震比较特殊,回想起来自己也做过这种特殊的事情,所以以为是跳高导致了地震。如果没有地震,我不会记得我经常做什么。与此同时,我显然不是唯一一个也在跳高的人。我有幸成为他们中的一员,碰巧遇到了。太巧了。

电视剧里的人常说:“真巧?”我回答说,太巧了是的,太巧了。我们经常低估巧合的可能性。比如,当我们遇到和自己生活在同一个天鹅座的人,我们会感叹真是太巧了,然后感慨缘分。以一节课为例。假设这个班有60个学生,其中至少两个来自同一个Amanome的概率超过99%,50个学生也是97%,40个学生是89%。没有遇到是低概率事件。其实只有23个学生就足以让概率达到50%。需要注意的是,这只是指两个人来自同一个Amanome的概率,而不是给定的具体日期。一个篮球运动员投篮20次,连续至少进4个球,差不多是50%。另一个例子是地震预测。不要以为很难预测。事实上,我们每个人都可以很容易地做出预测。每年得到正确地震的概率非常高,太巧了。另外,也有很多人在做预测。你碰不到他们,也有遇到他们的。

同样的统计结果,用不同的方式表达,会让人感觉不一样。举个例子,如果告诉病人一个手术有10%的死亡概率,大部分病人都会犹豫。如果患者被告知有90%的存活率,患者会更有可能选择去做。

想象一下,一个电视直播节目的主持人自称拥有超能力。他说,只要观众配合并注意,他可以遥控硬币,让他们以同样的面朝上抛硬币十次。成功的观众会打电话告诉他们,因为电视观众多,假设有一百多万,那么就成功遥控了十多万观众。用几千人甚至几百人来确认就够了。这是算命常用招数的变种,总是屡试不爽。换了马甲还是会忽悠我们,我们自己也有很多变种。

以上只是隐藏在我们身上的一小部分统计骗子。因为这些骗子,我们不仅被别人骗了,还被自己骗了。不用用数字骗人。统计学的逻辑无处不在,你要学会并灵活运用统计学的思想。

关于统计数据,作者告诉我们要问五个问题:“谁说的”、“他怎么知道的”、“他漏掉了什么”、“有人改变概念了吗”、“这个数据有意义吗?”如果你看完数据很激动,有话要说,先憋着,然后提醒自己问这些问题,不要骂完才发现是假的。