文档库 最新最全的文档下载
当前位置:文档库 › 基于秩次的非参数检验

基于秩次的非参数检验

基于秩次的非参数检验
基于秩次的非参数检验

基于秩次的非参数检验

1. 问题的提出

前面学习了连续型资料两组样本均数差异的假设检验方法:

小样本用t检验,条件是变量服从正态分布和方差齐;大样本用标准正态分布的Z检验。

如果是小样本,变量的分布不清,或者已知不服从正态分布或经变量转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?

需要一种不依赖于分布假定的检验方法,即非参数检验。

2. 基本概念

前面介绍的检验方法首先假定分析变量服从特定的已知分布(如正态分布),然后对分布参数(如均数)作检验。

这类检验方法称参数检验(parametric test)。

今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量的中心位置或分布位置作比较。这类检验称非参数检验(nonparametric test),由于其对总体分布不作严格假定,所以又称任意分布检验。(distribution-free test)

非参数检验的优点:

a.不受总体分布的限制,适用范围广。

b.适宜定量模糊的变量和等级变量。

c.方法简便易学。

缺点:

如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布(如正态分布),这时人为地将精确测

量值变成顺序的秩,将丢失部分信息,造成检验功效能下降。基于秩次非参数检验(秩和检验)的基本思想

假设变量X有观察值1.1, 1.3, 1.7, 4.3, 11.4

显然这变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。但如果将变量作转换,变成秩变量

Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。然后对这秩分布的中心位置(中位数)作检验,这就是秩和检验。

7.1 配对样本的符号秩检验(Wilcoxon signed rank test)例7.1为研究出生先后的孪生兄弟间智力是否存在差异,12对孪生兄弟测试的结果见表7.3。

表7.3 12对孪生兄弟测试结果

T +=24.5,T -=41.5

符号秩检验的分布理论:假定有4个差值,如果H 0成立时,这4个差值有同等的概率取正值或负值,即每个值取正值的概率等于1/2。4个差值每种组合发生的可能性就是:

0625

.02

1

212121=???=P 。所有可能的秩和情况和T *

的分布见

表7.1。

表7.1 n=4时所有可能秩和情况和T*的分布

正差数的秩次负差值

的秩次

正秩和

T+

负秩和

T-

检验统计

量T*

概率

P

1,2,3,4 -- 10 0 0 0.0625 2,3,4 1 9 1 1 0.0625 1,3,4 2 8 2 2 0.0625 1,2,4 3 7 3 3 0.1250 3,4 1,2 7 3 3

1,2,3 4 6 4 4 0.1250 2,4 1,3 6 4 4

1,4 2,3 5 5 5 0.1250 2,3 1,4 5 5 5

1,3 2,4 4 6 4 0.1250 4 1,2,3 4 6 4

1,2 3,4 3 7 3 0.1250

3 1,2,

4 3 7 3

2 1,3,4 2 8 2 0.0625

1 2,3,4 1 9 1 0.0625

- 1,2,3,4 0 10 0 0.0625

如果零假设成立,观察的结果应该服从这分布,即出现极端的可能性很小。如果真是出现小概率,那么我们对零假设的真实性产生怀疑,拒绝零假设。

表 7.2 Wilcoxon符号秩检验的判断原则

双侧检验单侧检验(1) 单侧检验(2) 检验假设H0:Md(d)=0 H0:Md(d)=0 H0:Md(d)=0 H1:Md(d)≠0 H1:Md(d)>0 H1:Md(d)<0

统计决策:

小样本查表法若T*≤Tα/2(n),

则拒绝H0

若T-≤Tα(n),

则拒绝H0

若T+≤Tα(n),

则拒绝H0

大样本正态近似法 若│Z │>Z α/2 , 则拒绝H 0 若│Z │>Z α , 则拒绝H 0 若│Z │>Z α, 则拒绝H 0

当研究例数较大时(n>50),秩和T 的分布近似正态分布,可以用正态分布理论作假设检验。

这时正态分布的均数和标准差分别等于: μT =n(n +1)/4

24/)12)(1(++=n n n T σ 检验的公式为:

24/)12)(1(5

.04/)1(5

.0*

*

++-+-=

--=

n n n n n Z T T T

T σ

μ

具体计算步骤: a. 建立检验假设:

H0: 中位数为零; H1:中位数不等于零;α=0.05

b. 编秩、计算秩和:差数为零不参加编秩,相同差值求平均秩。分别求正号和负号的秩和,取绝对值小的为T。

c. 确定概率:查附表10,在n=11时,T0.05=11。现24.5>11,故p>0.05。

7.2 两独立样本的秩和检验(Wilcoxon rank sum test)

例7.2 在缺氧条件下,观察4只猫与12只兔的生存时间(分),结果见表7.5。试判断猫、兔在缺氧条件下生存时间的差异是否具有统计学意义。

这是生存时间资料,一般不服从正态分布,样本也较小,需考虑用非参数检验---秩和检验。

秩和检验的基本思想:两组观察值共有n例,设例数较少的组有n1例,按观察值大小顺序分别编秩为1,2,…,n。如

果零假设成立,观察的结果有较大的可能出现分布在中间的结果。如果极端的结果出现,则可能零假设不成立,我们就拒绝零假设。

表7.5 缺氧条件下猫与兔的生存时间(分)比较

当样本较大时,秩和的分布近似正态分布,可以用正态分布理论作假设检验。这时正态分布的均数和标准差分别等于:

T*=n 1(n +1)/2

????

???

?---+=

*n n t t n n n k k

T 3

32

22)(112)1(σ

检验公式为:

21*

5

.0|2/)1(|*

-+-=

T n n T Z σ

具体计算步骤: a. 建立检验假设:

H0:Md1=Md2,即两总体分布位置相同;

H1:Md1≠Md2,即两总体分布位置不同;α=0.05

b.编秩和计算秩和:

两组混合编秩,有相同值求平均秩(仅有同组相同值可忽略)。当n1<n2时,取较小样本的秩和为检验统计量T*=R1;当n1=n2时,取秩和较小者为检验统计量T*=min(R1,R2)。本例求例数较少组的秩和T*=78.5。

c.确定概率:

T值在表中两数字值之间时,p值大于相应界值,反之则小于。n1=5,n2=14,n2-n1=9,查附表11,T L0.01=22,T U0.01=78,T*>T U0.01,P<0.01,故拒绝H0,可认为猫、兔在缺氧条件下的生存时间的中位数不相等。

7.3 多个样本分布位置相同的假设检验

1.完全随机化设计资料分布位置的假设检验(Kruskal- Wallis test)

表7.7 不同吸烟习惯母亲的新生儿体重(kg)出生体重x ij相应秩次r ij

A B C D A B C D

2.7 2.9

3.3 3.5 3 4 7 11

2.4

3.2 3.6 3.6 2 5.5 12.5 12.5

2.2

3.2 3.4 3.7 1 5.5 9 14

3.4 3.4 9 9

n i 4 3 4 3

R i15 15 37.5 37.5 计算步骤:

a. 建立检验假设: H0:k个总体中位数相等;

H1:k个总体中位数不等;α=0.05。

b. 计算统计量:各组混合编秩。如不同组间出现相同值,求平均秩。计算各组的秩和。

如果H 0:成立,第i 组秩和的期望(总体均数)Ri μ与方差2

Ri σ分别为:

2

)1(+=

n n i R i

μ 12

)

1)((2+-=

n n n n i i Ri

σ 在此基础上建立检验统计量:

[]

[]

==+-+-=-=k

i i i i i k

i Ri

Ri i n n n n n n R R H 12

1

22

12

/)1)((2/)1(σ

μ

当H 0成立时,该检验统计量近似服从自由度为(k-1)的

2

分布。为简化运算,由上式推导出如下公式:

)

1(3)()1(12

12

--+=∑=n n R n n H k i i

i

375

.9)114(3)3

5.3745.37315415()114(14122

222=+-++++=H 校正:

)()(13

1

3n n t t H

H m

p p p C ---=∑= 5018.914

14)]22()33()22[(1375

.93

3

33=--+-+--=C H c. 确定概率和判断结果:自由度(df)=4-1=3,查χ2

值表得

χ20.05(3)=7.815,p<0.05,故拒绝零假设,说明不同吸烟习惯对新生儿体重有影响。

2.随机化区组设计资料分布位置的假设检验(Friedman test)

与配对设计的思想一样,为控制某些因素对试验效应的混杂影响,可以在设计时,将试验对象配成组,再随机地分配处理因素给每组中的各个对象,这种设计称随机化区组设计。

对于随机化区组设计资料,考虑k个处理组的分布差异时,可采用由M. Friedman在符号检验基础上扩展的秩和检验,称为Friedman检验(Friedman test)。令x ij为第i区组(i =1,2....b)、第j处理组(j=1,2....k)的个体观察值,数据按区组(b行)与处理组(k列)排列如表7.8。

表7.8 随机化区组设计的资料格式

区组

处理组

1 2 ... k

1 x11x12... x1k

2 x21x22... x2k

┆┆┆┆┆

b x b1x b2... x bk

其检验假设为

H0:k个处理组效应的中位数相等;

H1:k个处理组效应的中位数不全相等。

进行Friedman检验时,首先在每区组(行)内将观察值按其数值由小到大排秩,然后再按处理组(列)求秩和,最后产生一个综合区组内差异的检验统计量。

令r ij为第i区组、第j处理组观察值x ij所对应的秩次,

因为每一区组(行)内有k 个从1到k 的整数秩,所以任何区组(行)的秩和为

2)1(1

+=∑=k k r k

j ij 令R j

为第j 处理组的秩和,即R j

∑=k

j ij

r 1

,故总秩和为

2)1(1

+=

=k bk R k

j i 当H 0成立时,第j 列秩和的期望与方差分别为

2

)1(+=

k b Ri

μ, 12)1(2

2

-=k b Rj σ

大样本时,统计量 2Rj

Rj

j j R Z σμ-=

~N(0,1)

取其加权和,

[]

∑==++-=??? ??-=k

j j j k

j k kb k b R Z k k 1

2

2

12

12/)1(2/)1(1χ 近似服从自由度为(k-1)的2

χ分布,通过与2

χ分布界值的比

较便可作出判定。

与K-W 检验统计量的情况相似,可导出计算式

)

1(3)1(121

2

2+-+=∑=k b R k bk k j j χ 例7.4 三批甘蓝叶样本分别在甲、乙、丙、丁四种条件下

测量核黄素浓度,试验结果如表7.9所示。问四种条件下的

测量结果的差异是否具有统计学意义?

表7.9 甘蓝叶核黄素浓度测量值(/g)

批次

测量条件

甲乙丙丁

1 27.2(2) 24.6(1) 39.5(4) 38.6(3)

2 23.2(1) 24.2(2) 43.1(4) 39.5(3)

3 24.8(2) 22.2(1) 45.2(4) 33.0(3)

R j 5 4 12 9

解 (1) 建立检验假设

H0:四种测量条件下的测量结果的中位数相等;

H1:四种测量条件下的测量结果的中位数不全相等。

(2) 将同一批的四个测量结果由小到大排秩,持平数据取平均秩次。将各秩次列于相应测量值旁边的括号内。

(3) 计算与各测量条件相应的(列向)秩和R j ,记于表7.9的最后一行。

(4) 代入(7.19)式,计算2

χ统计量。b =3,k =4,

,

2.8)14)(3(3)91245()

14)(4(3122

2222

=+-++++=χ31=-=k v

(5) 确定P 值并判断结果。α=0.05,

χ

23

,05.0=7.815。

2

>χ2

05

.0,P <0.05,故拒绝H 0,可以认为四种条件下测量结果有统计学意义。

3.k 组秩均值的多重比较

无论是用K-W 检验,还是用Friedman 检验,当拒绝零假设时,并不能直接判断k 组中哪些组间差异具有统计学意义,

秩转换的非参数检验

秩转换的非参数检验 基本概念 1.参数检验方法(parametric test):总体分布类型已知的条件下对其参数进行估计或检验。(如t-test, F- test) 2.非参数检验方法(nonparametric test):一种不依赖总体分布的具体形式,也不对参数进行估计或检验的统计方法来分析此类资料这种方法不受总体参数的影响,检验的是分布或分布位置,而不是参数。这样的检验方法称为非参数检验(如基于秩次的检验) 3.秩次(rank)):秩统计量,是指全部观察值按某种顺序排列的位序。在一定程度上 反映了等级的高低。 4.秩和(rank sum):同组秩次之和。在一定程度上反映了等级的分布位置 非参数检验的优缺点: 优点:无严格的条件限制,且多数非参数统计方法较为简单,易于理解和掌握,应用范 围广 缺点:对适宜参数统计的资料,若用非参数统计处理,常损失部分信息,降低检验效能。总结:因此对适合参数统计条件的资料或经变量变换后适合参数统计的资料,应最好用 参数统计。但资料不具备用参数统计的条件时,非参数统计是很有效的分析方法 适用范围: (1)总体分布为偏态或分布形式未知的计量资料(尤其在n<30的情况下)。 (2)等级资料。 (3)个别数据偏大或数据的某一端无确定的数值。 (4)各总体方差不齐。 检验步骤 1、检验假设H0:差值的总体中位数Md=0 H1:差值的总体中位数Md≠0 α=0.05 2、求差值 3、编秩:依差值的绝对值从小到大编秩遇差值为0的对子,舍去不计,同时样本量减一遇差值绝对值相等则取平均秩,称为相同秩(ties)然后按差值的正负对秩次冠以正负号 4、求检验统计量:任取正秩和或负秩和为T 5、确定P值并做出统计推断(查附表9,内大外小原则)

基于秩次的非参数检验

基于秩次的非参数检验 1. 问题的提出 前面学习了连续型资料两组样本均数差异的假设检验方法: 小样本用t检验,条件是变量服从正态分布和方差齐;大样本用标准正态分布的Z检验。 如果是小样本,变量的分布不清,或者已知不服从正态分布或经变量转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢? 需要一种不依赖于分布假定的检验方法,即非参数检验。 2. 基本概念 前面介绍的检验方法首先假定分析变量服从特定的已知分布(如正态分布),然后对分布参数(如均数)作检验。

这类检验方法称参数检验(parametric test)。 今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量的中心位置或分布位置作比较。这类检验称非参数检验(nonparametric test),由于其对总体分布不作严格假定,所以又称任意分布检验。(distribution-free test) 非参数检验的优点: a.不受总体分布的限制,适用范围广。 b.适宜定量模糊的变量和等级变量。 c.方法简便易学。 缺点: 如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布(如正态分布),这时人为地将精确测

量值变成顺序的秩,将丢失部分信息,造成检验功效能下降。基于秩次非参数检验(秩和检验)的基本思想 假设变量X有观察值1.1, 1.3, 1.7, 4.3, 11.4 显然这变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。但如果将变量作转换,变成秩变量 Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。然后对这秩分布的中心位置(中位数)作检验,这就是秩和检验。 7.1 配对样本的符号秩检验(Wilcoxon signed rank test)例7.1为研究出生先后的孪生兄弟间智力是否存在差异,12对孪生兄弟测试的结果见表7.3。 表7.3 12对孪生兄弟测试结果

第十章 基于秩次的非参数检验

第十章基于秩次的非参数检验习题 一、选择题 1.两小样本均数比较,方差不齐时,下列说法不正确的是(). A. 采用秩和检验 B. 采用t′检验 C. 仍用t检验 D. 变量变换后再作决定 E. 要结合正态性检验结果方能作出决定 H是(). 2. 两样本秩和检验的 A. 两样本秩和相等 B. 两总体分布相同 C. 两样本分布相同 D. 两总体秩和相等 E. 两总体均数相等 3. 在统计检验中是否选用非参数统计方法(). A. 要根据研究目的和数据特征作决定 B. 可在算出几个统计量和得出初步结论后进行选择 C. 要看哪个统计结论符合专业理论 D. 要看哪个P值更小 E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用 4. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是(). A. T越大,P值越小 B.T越大,P值越大 C. T值在界值范围内,P值小于相应的α D. T值在界值范围内,P值大于相应的α E. T值在界值范围上,P值大于相应的α 5. 成组设计两样本比较的秩和检验,其检验统计量T是(). A. 为了查T界值表方便,一般以秩和较小者为T B. 为了查T界值表方便,一般以秩和较大者为T C. 为了查T界值表方便,一般以例数较小者秩和为T D. 为了查T界值表方便,一般以例数较大者秩和为T E. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表

多样本定量资料比较,当分布类型不清时应选择(). A. 方差分析 B. t检验 C. Z检验 D. Kruskal-Wallis检验 E. Wilcoxon检验 6. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后 H值,则会(). 的 c A.提高检验的灵敏度 B.把一些无差别的总体推断成有差别 C. 把一些有差别的总体推断成无差别 D.Ⅰ、Ⅱ类错误概率不变 E. 以上说法均不对 二、简答题 1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法? 2. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”? 3. 多组定量资料比较时,统计处理的基本流程是什么?

秩转换的非参数检验

非参数检验是相对于参数检验而言地. 参数检验——如果总体分布为已知地数学形式,对其总体参数作假设检验. 计量资料——正态分布——假设检验——检验、检验 计量资料:不满足参数检验条件地假设检验方法,一变量变换,二非参数检验(等级资料)非参数检验对总体分布不作严格假定(任意分布检验) 秩转换 ————推断一个总体表达分布位置地中位数(非参数)和已知、两个或多个总体地分布是否有差别. 秩转换地非参数检验时先将数值变量资料自小到大,或等级资料从弱到强转换成秩后,再计算检验统计量,其特点是假设检验地结果对总体分布地形状差别不敏感,只对总体分布地位置差别敏感.文档来自于网络搜索 配对样本比较地符号秩检验 符号秩检验符号秩和检验 ——用于配对样本差值地中位数和比较 ——用于单个样本中位数和总体中位数比较 配对样本差值地中位数和比较———————<——————————— ——目地是推断配对样本差值地总体中位数是否和有差别 ——即推断配对地两个相关样本所来自地两个总体中位数是否有差别. 平均秩——相同秩—————————————>——————————— 单个样本中位数和总体中位数比较——————————————————— ——目地是推断样本所来自地总体中位数和某个已知地总体中位数是否有差别 ——用样本各变量值和地差值,即推断差值地总体中为数和是否有差别 本法地原理 ()界值表制作地原理 ()正态近似法地原理 第二节两个独立样本比较地秩和检验———————— 秩和检验() ————用于推断计量资料或等级资料地两个独立样本所来自地两个总体分布是否有差别. ——————推断两个总体分布地位置是否有差别. 原始数据地两样本比较————计量资料为原始数据 频数表资料和等级资料地两样本比较 ————计量资料为频数表资料,是按数量区间分组 ————等级资料是按等级分组 本法地原理 界值表制作地原理 正态近似法地原理 、检验 第三节完全随机设计多个样本比较地检验 一、多个独立样本比较地检验 ————用于推断计量资料或等级资料地多个独立样本所来自地多个总体分布是否有差别. 原始数据地多个样本比较————计数资料为原始数据—————————— 频数表资料和等级资料地多个样本比较 ————计量资料为频数表资料,是按数量区间分组 ————等级资料是按等级分组 本法地原理 界值表制作地原理 地近似法原理

第十章基于秩次的非参数检验

第十章 1. 两样本定量资料比较的假设检验,首先应考虑。 A. 用t 检验 B. 用秩和检验 C. t检验与秩和检验 D 资料符合t检验还是秩和检验的条件 E. X2检验 2.在作等级资料的比较时,宜用。 A. t 检验 B. X2检验 C. 秩和检验 D. F检验 E. 方差分析 3. 在作两样本均数比较时,已知均小于30,总体方差不齐且呈极度偏峰的资料 宜用。 A. t ′检验 B. t 检验 C.U检验 D. 秩和检验 E t ′检验和秩和检验均可 4.非参数统计的应用条件是。 A. 样本数据来自正态总体 B.若两组比较,要求两样本方差相等 C.总体分布类型未知 D.要求样本例数很大 E.总体属于某种已知的分布类型 5.在进行成组设计两样本秩和检验时,以下检验假设中正确的是。 A. H O两样本对应的总体均数相同 B. H O两样本均数相同 C. H O两样本对应的总体分布位置相同 D. H O两样本的中位数相同 E. H O两样本差值的中位数相同 6.配对设计的符号检验的基本思路是:如果检验假设成立,则对样本来 说。 A.正秩和的绝对值与负秩和的绝对值不会相差很大 B.中的秩和为零 C.正秩和的绝对值与负绝对值不会相差很大 D.正秩和的绝对值与负绝对值相等 E.符号相同,按顺序编秩 7.秩和检验和t 检验相比,其优点是。 A.计算更简便 B.公式更为合理 C. 检验效能高 D.抽样误差小 E.不受分布限制 8.秩和检验是一种。

A.U检验 B. X2检验 C.F检验 D.非参数检验 E.以上都不对 9.非参数统计不适合。 A.正态分布且方差齐的资料 B.偏态分布的资料 C.半定量资料 D.有过大值或小值的资料 E.以上均不可 11.不同人群血清反应(- + ++)资料比较宜用: A.t检验 B.X2检验 C.秩和检验 D.F检验 E. Z检验 12.成组设计两样本比较的秩和检验,其检验统计量T是。 A.以秩和较小者为T B. 以秩和较大者为T C.以例数较小者秩和为T D. 以例数较大者秩和为T E.当两样本例数不等时,科任区一样本的秩和为T 13.请指出下列五个秩和检验的结果哪个是错误的。 A.配对计量资料n=12,T+=7,T-=71,查得T0.05=13~65,P<0.05 B.配对计量资料n=8,T+=12,T-=24,查得T0.05=3~33,P<0.05 C.两组计量资料n1=12, n2=10,T1=173,T2=80,查得T0.05=84~146,P<0.05 D.两组计量资料n1=10, n2=10,T1=55,T2=155,查得T0.05=78~132,P<0.05 E.两组计量资料n1=9, n2=13,T1=58,T2=195,查得T0.05=73~134,P<0.05 14.配对设计的符号秩合检验中,其检验假设H0为。 A 差值总体均数等于零即u d=0 B 差值总体均数不等于零即u d≠0 C 差值总体中倍数等于零即M d=0 D 差值总体中位数不等于零即M d≠0 E 以上都不对 二.是非题: 1.两样本比较的秩和检验,当n1>10,n2-n1>10时采用检验属于参数检验。 ()2.完全随机设计多组独立样本比较的秩和检验得P<0.05,X需进行两两比较。 ()3.非参数检验有称任意分布检验,其意义为与任何分布无关。 ( )

基于秩次的非参数检验

第七章基于秩次的非参数检验 前言: 1. 问题的提出: 前面学习了连续型资料两组样本均数差异的假设检验方法:★小样本用t检验,条件是变量服从正态分布和方差齐。 ★大样本用Z检验(中心极限定理)。 如果是小样本,变量的分布不清、已知不服从正态分布或经数学转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢? ★需要一种不依赖于分布假定的检验方法,即非参数检验。 2. 基本概念: 前面介绍的检验方法首先假定变量服从特定的已知分布(如正态分布),然后对分布的参数(如均数)作检验。这类检验方法称为参数检验。

今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量分布的中心位置或分布形态作检验。这类检验称非参数检验,由于其对总体分布不作严格假定,所以又称任意分布检验。 (1)非参数检验的优点:a. 不受总体分布的限制,适用范围广。 b. 适宜定量模糊的变量和等级变量。 c. 方法简便易学。 (2)缺点:对于适合用参数检验的资料,如用非参数检验会造成信息的丢失,犯第Ⅱ类错误的概率增大,造成检验功效下降。 (3)基于秩次的非参数检验(秩和检验)的基本思想: 例:假设有一组观察值为1.1, 1.3, 1.7, 4.3, 11.4 。 显然这一变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。 如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。 对秩和分布的中心位置(平均秩和)作检验,这就是秩和检验。

一.配对样本的符号秩检验(Wilcoxon signed rank test): 例7.1:研究出生先后的孪生兄弟智力是否存在差异? 表7.3 12对孪生兄弟智力测试结果 对子号兄的得分弟的得分兄弟得分差秩次 1 86 88 2 3 2 71 77 6 7 3 77 76 -1 -1.5 4 68 64 -4 -4 5 91 9 6 5 5.5 6 72 72 0 - 7 77 65 -12 -10 8 91 90 -1 -1.5 9 70 65 -5 -5.5 10 71 80 9 9 11 88 81 -7 -8 12 87 72 -15 -11

spss-非参数检验-K多个独立样本检验(-Kruskal-Wallis检验)案例解析

spss-非参数检验-K多个独立样本检验(-Kruskal-Wallis检验)案例解析

spss-非参数检验-K多个独立样本检验( Kruskal-Wallis检验)案例解析2011-09-19 15:09 最近经常失眠,好痛苦啊!大家有什么好的解决失眠的方法吗?希望知道的能够告诉我,谢谢啦,今天和大家一起探讨和分下一下SPSS-非参数检验--K 个独立样本检验( Kruskal-Wallis检验)。 还是以SPSS教程为例: 假设:HO: 不同地区的儿童,身高分布是相同的 H1:不同地区的儿童,身高分布是不同的 不同地区儿童身高样本数据如下所示: 提示:此样本数为4个(北京,上海,成都,广州)每个样本的样本量(观察数)都为5个 即:K=4>3 n=5, 此时如果样本逐渐增大,呈现出自由度为K-1的平方的

分布,(即指:卡方检验) 点击“分析”——非参数检验——旧对话框——K个独立样本检验,进入如下界面: 将“周岁儿童身高”变量拖入右侧“检验变量列表”内,将“城市(CS)变量” 拖入“分组变量”内,点击“定义范围” 输入“最小值”和“最大值”(这里的变量类型必须为“数字型”)如果不是数字型,必须要先定义或者重新编码。 在“检验类型”下面选择“秩和检验”( Kruskal-Wallis检验)点击确定 运行结果如下所示:

对结果进行分析如下: 1:从“检验统计量a,b”表中可以看出:秩和统计量为:13.900 自由度为:3=k-1=4-1 下面来看看“秩和统计量”的计算过程,如下所示: 假设“秩和统计量”为 kw 那么:

其中:n+1/2 为全体样本的“秩平均” Ri./ni 为第i个样本的秩平均 Ri.代表第i个样本的秩和, ni代表第i个样本的观察数) 最后得到的公式为: 北京地区的“秩和”为:秩平均*观察数(N) = 14.4*5=72 上海地区的“秩和”为:8.2*5=41 成都地区的“秩和”为:15.8*5=79 广州地区的“秩和”为:3.6*5=18

相关文档