辛普森悖论的出现是因为

控制碰撞因子导致了相反的相关性,数据中隐藏着一个潜在的变量。

在一定条件下,两组数据分开讨论时会满足一定的性质,但一旦放在一起考虑,就可能得出相反的结论。辛普森在他发表的论文中阐述了这一现象。

当人们试图探究两个变量(如新生录取率、性别)是否相关时,会分组单独研究。但是,在群体比较中占优的一方,有时也是在整体评价中失势的一方。1951年,这一现象在E.H .辛普森在其发表的论文中阐述之后,才得到官方的描述和解释。后来,这个悖论以他的名字命名,即辛普森悖论。