卡方检验怎么算?

卡方值表示观察值和理论值之间的偏差。计算这个偏离度的基本思路如下。

设A代表某一类别的观测频率,E代表基于H0计算的期望频率,A和E之差称为残差。

显然,残差可以表示某一类别的观测值与理论值之间的偏差,但如果简单地将残差相加来表示每一类别的观测频率与期望频率之间的差异,则存在一定的不足。因为有正负残差,所以相加后会互相抵消,总和还是0。因此,我们可以将残差平方并求和。

另一方面,剩余大小是一个相对的概念。当期望频率为10时,期望频率为20的残差很大,而当期望频率为1000时,残差很小。考虑到这一点,人们将残差的平方除以期望频率,然后求和,以估计观察数和期望数之间的差异。

(参考资料来源:张、匡春伟编辑。SPSS统计分析基础教程(第二版))

SPSSAU的结果如下:

卡方值计算如下:

其中a表示某一类别的观测频率,e表示基于H0计算的期望频率,ai为I级的观测频率,Ei为I级的期望频率,n为总频率,pi为I级的期望频率。当n比较大时,χ2统计量近似服从k-1自由度的卡方分布。