辛普森悖论简介
辛普森悖论(Simpson & amp;#39;Paradox)也被翻译成辛普森悖论(Simpson's paradox),是英国统计学家E.H.Simpson在1951中提出的,即一定条件下的两组数据在分开讨论时会满足一定的性质,但一旦放在一起考虑,就可能得出相反的结论。当人们试图探究新生录取率与性别、报酬与性别这两个变量是否相关时,会分别分组研究。辛普森悖论是这类研究在一定前提下有时会出现的现象。即在群体比较中占优势的一方,将是在整体评价中失势的一方。这个现象在20世纪初就有人讨论过,但直到E.H. Simpson在1951发表了一篇论文才得到正式的描述和解释。后来,这个悖论以他的名字命名。为了避免辛普森悖论,需要考虑每个分组的权重,并乘以一定的系数,以消除分组数据基数差异带来的影响。同时要认清形势,综合考虑是否存在潜在因素。