皮尔逊独立性卡方检验

2024-11-15
皮尔逊独立性卡方检验:

假设检验的一种。

用于检验两个变量是否独立。皮尔逊卡方统计量的重要应用。

X有R个表征值(状态)A1,A2,…,AR;Y有C个表征值:B1,B2,…,BC,二元类别变量(X,Y)定义在同一总体上。随机抽取n个个体,将观测资料汇总在R×C的列联表上(如下表)。欲检验的统计假设H0:X与Y是独立的;H1:H0不真。表中每格内数字xij是X取Ai且Y取Bj的次数,xi.=xij,x.j=xij,n=xi.=x.j=xij

检验统计量为χ2=,在n→∞时,它的极限分布是χ2分布,自由度为(R-1)(C-1)。对给定的显着性水平α,查得χ2分布的右尾α分位点(R-1)(C-1)。

当观测值>;(R-1)(C-1)时,拒绝H0。这里的检验需要大样本。

当R=C=2时,由上式给出的χ2统计量需要修正(称为雅茨连续性校正)为χ2=,或用χ2统计量的简捷算法:χ2=,式中字母含义见2×2列联表所示。注意,此时χ2分布的自由度为1。

R×C列联表

2×2列联表