卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。
卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。
它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
卡方检验的基本原理
卡方检验的基本思想
卡方检验是以χ2 分布为基础的一种常用假设检验方法,它的无效假设 H0 是:观察频数与期望频数没有差别。
该检验的基本思想是:首先假设 H0 成立,基于此前提计算出χ2 值,它表示观察值与理论值之间的偏离程度。根据χ2 分布及自由度可以确定在 H0 假设成立的情况下获得当前统计量及更极端情况的概率 P。如果 P 值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;否则就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。
卡方值的计算与意义
χ2 值表示观察值与理论值之问的偏离程度。计算这种偏离程度的基本思路如下。
(1)设 A 代表某个类别的观察频数,E 代表基于 H0 计算出的期望频数,A 与 E 之差称为残差。
(2)显然,残差可以表示某一个类别观察值和理论值的偏离程度,但如果将残差简单相加以表示各类别观察频数与期望频数的差别,则有一定的不足之处。因为残差有正有负,相加后会彼此抵消,总和仍然为 0,为此可以将残差平方后求和。
(3)另一方面,残差大小是一个相对的概念,相对于期望频数为 10 时,期望频数为 20 的残差非常大,但相对于期望频数为 1 000 时 20 的残差就很小了。考虑到这一点,人们又将残差平方除以期望频数再求和,以估计观察频数与期望频数的差别。
进行上述操作之后,就得到了常用的χ2 统计量,由于它最初是由英国统计学家 Karl Pearson 在 1900 年首次提出的,因此也称之为 Pearson χ2,其计算公式为(i=1,2,3,…,k)
其中,Ai 为 i 水平的观察频数,Ei 为 i 水平的期望频数,n 为总频数,pi 为 i 水平的期望频率。i 水平的期望频数 Ei 等于总频数 n×i 水平的期望概率 pi,k 为单元格数。当 n 比较大时,χ2 统计量近似服从 k-1(计算 Ei 时用到的参数个数)个自由度的卡方分布。
作为学术界的领袖,Pearson 先生当初发表在《哲学杂志》上的χ2 论文题目为:On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling.
由卡方的计算公式可知,当观察频数与期望频数完全一致时,χ2 值为 0;观察频数与期望频数越接近,两者之间的差异越小,χ2 值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,χ2 值越大。换言之,大的χ2 值表明观察频数远离期望频数,即表明远离假设。小的χ2 值表明观察频数接近期望频数,接近假设。因此,χ2 是观察频数与期望频数之间距离的一种度量指标,也是假设成立与否的度量指标。如果χ2 值“小”,研究者就倾向于不拒绝 H0;如果χ2 值大,就倾向于拒绝 H0。至于χ2 在每个具体研究中究竟要大到什么程度才能拒绝 H0,则要借助于卡方分布求出所对应的 P 值来确定。
卡方检验的样本量要求
卡方分布本身是连续型分布,但是在分类资料的统计分析中,显然频数只能以整数形式出现,因此计算出的统计量是非连续的。只有当样本量比较充足时,才可以忽略两者间的差异,否则将可能导致较大的偏差具体而言,一般认为对于卡方检验中的每一个单元格,要求其最小期望频数均大于 1,且至少有 4/5 的单元格期望频数大于 5,此时使用卡方分布计算出的概率值才是准确的。如果数据不符合要求,可以采用确切概率法进行概率的计算。
卡方检验的类型
1、四格表资料的卡方检验
四格表资料的卡方检验用于进行两个率或两个构成比的比较。
1)专用公式:
若四格表资料四个格子的频数分别为 a,b,c,d,则四格表资料卡方检验的卡方值=,自由度 v=(行数-1)(列数-1)
2)应用条件:
要求样本含量应大于 40 且每个格子中的理论频数不应小于 5。当样本含量大于 40 但理论频数有小于 5 的情况时卡方值需要校正,当样本含量小于 40 时只能用确切概率法计算概率。
2、行×列表资料的卡方检验
行×列表资料的卡方检验用于多个率或多个构成比的比较。
1)专用公式:
r 行 c 列表资料卡方检验的卡方值=
2)应用条件:
要求每个格子中的理论频数 T 均大于 5 或 1<T<5 的格子数不超过总格子数的 1/5。当有 T<1 或 1<T<5 的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行×列表资料卡方检验的应用条件。而多个率的两两比较可采用行×列表分割的办法。
3、列联表资料的卡方检验
同一组对象,观察每一个个体对两种分类方法的表现,结果构成双向交叉排列的统计表就是列联表。
1)R×C 列联表的卡方检验:
R×C 列联表的卡方检验用于 R×C 列联表的相关分析,卡方值的计算和检验过程与行×列表资料的卡方检验相同。
2)2×2 列联表的卡方检验:
2×2 列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。当用一般四格表的卡方检验计算时,卡方值=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d),此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值=( | b − c | − 1)2/(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。
列联表卡方检验应用中的注意事项同 R×C 表的卡方检验相同。
卡方检验的用途
卡方检验最常见的用途就是考察某无序分类变量各水平在两组或多组间的分布是否一致实际上,除了这个用途之外.卡方检验还有更广泛的应用。具体而言,其用途主要包括以下几个方面:
(1)检验某个连续变量的分布是否与某种理论分布相一致。如是否符合正态分布、是否服从均匀分布、是否服从 Poisson 分布等。
(2)检验某个分类变量各类的出现概率是否等于指定概率。如在 36 选 7 的彩票抽奖中,每个数字出现的概率是否各为 1/36;掷硬币时,正反两面出现的概率是否均为 0.5。
(3)检验某两个分类变量是否相互独立。如吸烟(二分类变量:是、否)是否与呼吸道疾病(二分类变量:是、否)有关;产品原料种类(多分类变量)是否与产品合格(二分类变量)有关。
(4)检验控制某种或某几种分类因素的作用以后,另两个分类变量是否相互独立。如在上例中,控制性别、年龄因素影响以后,吸烟是否和呼吸道疾病有关;控制产品加工工艺的影响后,产品原料类别是否与产品合格有关。
(5)检验某两种方法的结果是否一致。如采用两种诊断方法对同一批人进行诊断,其诊断结果是否一致;采用两种方法对客户进行价值类别预测,预测结果是否一致。
卡方检验的应用条件
适用于四格表应用条件:
1)随机样本数据。两个独立样本比较可以分以下 3 种情况:
(1)所有的理论数 T≥5 并且总样本量 n≥40,用 Pearson 卡方进行检验。
(2)如果理论数 T<5 但 T≥1,并且 n≥40,用连续性校正的卡方进行检验。
(3)如果有理论数 T<1 或 n<40,则用 Fisher’s 检验。
2)卡方检验的理论频数不能太小。
R×C 表卡方检验应用条件:
(1)R×C 表中理论数小于 5 的格子不能超过 1/5;
(2)不能有小于 1 的理论数。如果实验中有不符合 R×C 表的卡方检验,可以通过增加样本数、列合并来实现。
卡方检验应用实例
1.应用实例——适合度检验
实际执行多项式试验而得到的观察次数,与虚无假设的期望次数相比较,称为卡方适度检验,即在于检验二者接近的程度,利用样本数据以检验总体分布是否为某一特定分布的统计方法。这里以掷骰子为例介绍适度检验的方法。
【例 1】
(1)假设掷一骰子 120 次,各点数共出现次数为 a,b 为各点数出现的期望值 120×1/6=20,建立工作表文件,如图 1 所示。
(2)设置零假设 H0:观察分布等于期望分布。
(3)计算卡方检验统计量,如图 2 所示。
D2=(B2-C2)^2/C2
D8=SUM(D2:D7)
(4)确定自由度,(6-1)×(2-1)=5;选择显著水平α=0.05。
(5)利用 Excel 提供的 CHIINV 函数求临界值,在 D9 单元格中键入“=CHIINV(0.05,5)”按回车键,得临界值 11.07。
(6)比较临界值和统计量,11.07>2.3,即临界值大于统计量,故差异不显著,接受 H0。
2.应用实例 2——独立性检验
卡方独立性检验是用来检验两个属性间是否独立。一个变量作为行,另一个变量作为列。下面一例便是介绍卡方独立性检验的方法。
【例 2】某机构欲了解现在性别与收入是否有关,他们随机抽样 500 人,询问对此的看法,结果分为“有关、无关、不好说,,三种答案,图 3 中县调查得到的数据。
图 3
下面是利用 Excel 解决此问题的步骤。
(1)零假设 H0:性别与收入无关。
(2)确定自由度为(3-1)×(2-1)=2,选择显著水平α=0.05。
(3)求解男女对收入与性别相关不同看法的期望次数,这里采用所在行列的合计值的乘积除以总计值来计算每一个期望值,如图 4 所示,在单元格 B9 中键入“=B5*E3/E5”,同理(第一个等于号理解为在单元格中键入):
B10=“=B5*E4/E5,C9=“=C5*E3/E5”,C10=“=C5*E4/E5”,D9=“=D5*E3/E5”,D10=“=D5*E4/E5”。
图 4
(4)利用卡方统计量计算公式计算统计量,在单元格 B15 中键入“=(B3-B9)^2/B9”,其余单元格依次类推,结果如图 5 所示。
图 5
(5)利用 Excel 提供的 CHIINV 函数计算显著水平为 0.05,自由度为 2 卡方分布的临界值,在 Excel 单元格中键入“=CHIINV(0.05,2)”按回车键,得临界值为 5.9915。
(6)比较统计量度和临界值,统计量 14.32483 大于临界值 5.9915,故拒绝零假设。
3.应用实例 3——统一性检验
检验两个或两个以上总体的某一特性分布,也就是各“类别”的比例是否统一或相近,一般称为卡方统一性检验或者卡方同质性检验。下面一例便是利用卡方统一性检验的例子。
【倒 3】某咨询公司想了解南京和北京的市民对最低生活保障的满意程度是否相同。他们从南京抽出 600 居民,北京抽取 600 居民,每个居民对满意程度(非常满意、满意、不满意、非常不满意)任选一种,且只能选一种。将统计结果键入 Excel 工作表中,如图 6 所示。
下面是利用 Excel 解决此问题的步骤。
(1)零假设 H0:南京和北京居民对最低生活保障满意程度的比例相同。
(2)确定自由度为(4-1)×(2-1)=3,选择显著水平α=0.05。
(3)求解卡方检验的 l 临界值,在 Excel 单元格中键入“=CHIINV(0.05,3)”,按回车键得临界值为 7.81。
(4)计算北京和南京不同满意程度的期望值,在单元格 B11 和 C11 中分别键入“=$B$7*D3/$D$7”和“=$C$7*D3/$D$7”,选中 B11:C11,按住 C11 右下角填充控制点,填充至 C14。
(5)计算卡方统计量,在单元格 B19 中键入“=(B3-B11)^2/B11”,其余单元格依次类推,结果如图 7 所示。
(6)比较统计量和临界值,统计量 1.3875 小于临界值 7.81,故接受零假设。