文档库 最新最全的文档下载
当前位置:文档库 › 研习题-非参数(含数据)

研习题-非参数(含数据)

研习题-非参数(含数据)
研习题-非参数(含数据)

研-非参数检验习题

习题要求:

1.使用A4纸写作业,可参考上课内容写;

2.任选用手工计算或SPSS计算。

SPSS实习报告内容:

1.检验假设

2.数据库格式

3.选用方法

4.输出结果:主要的统计量、P值

5.统计结论、专业结论

手工计算实习报告内容:

1. 检验假设

2. 中间表格

3.选用公式

4.主要结果:统计量、P值

5.统计结论、专业结论

12 补充习题

(6)某医院测定10名受试者针刺穴位前后痛阈变化的数据如下。试分析针刺前后痛阈有无差异。(original-23)

针刺穴位前后痛阈的变化(g)

─────────────────

针刺前针刺后

─────────────────

600 610

600 700

685 575

1050 600

900 600

1125 1425

1400 1350

750 825

1000 800

1500 1440

─────────────────

(7)抽测克山病流行区中健康人和急性克山病人的血磷值如表。试比较两组测得值有无差别。(original-24)

克山病区健康人和患者血磷值(mg%)

──────────────────

健康人病人

──────────────────

1.67

2.60

1.98 3.24

1.98 3.73

2.33

3.73

2.34 4.32

2.50 4.73

3.60 5.18

3.73 5.58

4.14

5.78

4.17 6.40

4.57 6.53

4.82

5.78

──────────────────

(8)研究白血病时测定四组鼠脾DNA的含量如下表。试分析各组DNA含量有无差异?有差异请做多重比较。(original-25)

各组鼠脾DNA含量(mg)

────────────────────────────

正常脾自发性白血病脾移植性白血病脾移植性白血病脾

(A组)(B组)

────────────────────────────

12.3 10.8 9.3 9.5

13.2 11.6 10.3 10.3

13.7 12.3 11.1 10.5

15.2 12.7 11.7 10.5

15.8 13.5 11.7 10.5

16.9 13.5 12.0 10.9

17.3 14.8 12.3 11.0

15.4 12.4 11.5

13.6

────────────────────────────

n 8 7 9 8 ────────────────────────────

第二讲 非参数统计检验

第二讲 非参数检验 1. 实验目的 1.了解非参数假设检验基本思想; 2.会用SAS 软件中的proc npar1way 过程进行非参数假设检验和proc freq 过程进行列联表的独立性检验。 2. 实验要求 1.会用SAS 软件建立数据集,并进行统计分析; 2.掌握proc npar1way 过程进行非参数假设检验的基本步骤; 3.掌握proc freq 过程进行列联表的独立性检验的基本步骤。 3. 实验基本原理 3.1 符号检验 0:H 两种方法的处理效果无显著性差异 令10 i i I i ?=? ?第个个体中新方法优于对照方法第个个体中新方法劣于对照方法 1,2,,i N = 统计量1 N N i i S I ==∑ N S 表示新方法的处理效果优于对照方法的配对组总数。若新方法的处理效果显著的优于对 照方法,则N S 的值应明显偏大。因此,若对给定的置信水平α,有 {}N P S c α≥<, 则拒绝0H 。 0H 为真时,(1)N S 服从二项分布1(,)2 b N (),()24 N N N N E S Var S = =。拒绝域为: {}N N S S c > (2) 由中心极限定理可知,当 2 , N N S N - →∞的零分布趋于标准正态分布。

拒绝域为 :N S u α?? ????>???????? 3.2 Wilcoxon 秩和检验 (1)单边假设检验 0:H 两种方法的处理效果无显著性差异 as 1:H :新方法优于对照方法。 用于检验0H 的统计量为:1n s i i W I ==∑ 若对给定的置信水平α,有 {}s P W c α≥<,则拒绝0H 。且s W 的分布列为: 0#{;,}{}H s w n m P W w N n == ?? ??? 根据观测结果计算s W 的观测值0s W ,计算检验的p 值: 00 {}{} s H s s H s k w p P W w P W k ≥=≥= =∑ 然后将p 值与显著水平α作比较,若p α<,则拒绝0H ,否则接受0H 。 (2)双边假设检验 给定的显著水平21,c c 和α应该满足: ε=≥+≤}{}{2100c W P c W P A H A H 仅由上式还不能唯一确定21c c 和,当我们对两种方法谁优谁劣不得而知时,通常取 2 }{}{2100α = ≥=≤c W P c W P A H A H 若利用p 值进行检验,设A A W ω的观测值为 ,计算概率值 }{}{00A A H A A H W P W P ωω≤≥或 由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。例如

非参数统计题目及答案

1.人们在研究肺病患者的生理性质时发现,患者的肺活量与他早在儿童时期是否接受过某种治疗有关,观察3组病人,第一组早在儿童时期接受过肺部辐射,第二组接受过胸外科手术,第三组没有治疗过,现观察到其肺活量占其正常值的百分比如下: 这一经验是否可靠。 解: H 0:θ2≤θ1≤θ 3 H 1 :至少有一个不等式成立 可得到 N=15 由统计量H= ) 112 +N N (∑=K i i N R 1i 2 -3(N+1)=)(1151512+(32×6.4+29×5.8+59×11.8)-3×(15+1)=5.46 查表(5,5,5)在P(H ≥4.56)=0.100 P(H ≥5.66)=0.0509 即P (H ≥5.46)﹥0.05 故取α=0.05, P ﹥α ,故接受零假设即这一检验可靠。

2.关于生产计算机公司在一年中的生产力的改进(度量为从0到100)与它们在过去三年中在智力投资(度量为:低,中等,高)之间的关系的研究结果列在下表中: 值等等及你的结果。(利用Jonkheere-Terpstra 检验) 解: H 0:M 低=M 中=M 高 H 1:M 低﹤M 中﹤M 高 U 12=0+9+2+8+10+9+10+2+10+10+8+0.5+3=82.5 U 13=10×8=80 U 23=12+9+12+12+12+11+12+11=89 J= ∑≤j ij U i =82.5+80+89=251.5 大样本近似 Z= []72 )32()324 1 2 1i 22 2∑ ∑==+-+--k i i i k i n n N N n N J ()(~N (0,1) 求得 Z=3.956 Ф(3.956)=0.9451 取α=0.05 , P >α, 故接受原假设,认为智力投资对改进生产力有帮助。

非参数统计部分课后习题参考答案

课后习题参考答案 第一章p23-25 2、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。”(注意:该组均值为74.000)。你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。 答:这个结论不合理(6分)。因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。(4分) 第三章p68-71 3、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。已知1997年的索赔数额的中位数为5064元。 (1)是否1998年索赔的中位数比前一年有所变化?能否用单边检验来回答这个问题?(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。(10分) (3)找出基于符号检验的95%的中位数的置信区间。(8分) 解:(1)1998年的索赔数额的中位数为9480元比1997年索赔数额的中位数5064元是有变化,但这只是从中位数的点估计值看。如果要从普遍意义上比较1998年与1997年的索赔数额是否有显著变化,还得进行假设检验,而且这个问题不能用单边检验来回答。(4分) (2)符号检验(5分) 设假设组:H 0:M =M 0=5064 H 1:M ≠M 0=5064 符号检验:因为n +=11,n-=3,所以k=min(n+,n-)=3 精确检验:二项分布b(14,0.5), ∑=-=3 0287 .0)2/1,14(n b ,双边p-值为0.0576,大于a=0.05, 所以在a水平下,样本数据还不足以拒绝零假设;但假若a=0.1,则样本数据可拒绝零假设。查二项分布表得a=0.05的临界值为(3,11),同样不足以拒绝零假设。 正态近似:(5分) np=14/2=7,npq=14/4=3.5 z=(3+0.5-7)/5.3≈-1.87>Z a/2=-1.96 仍是在a=0.05的水平上无法拒绝零假设。说明两年的中位数变化不大。 (3)中位数95%的置信区间:(5064,21240)(8分) 7、一个监听装置收到如下的信号:0,1,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,1,1,1,1,0,1,0,0,1,1,1,0,1,0,1,0,1,0,0,0,0,0,0,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,0,0,0,1,0,0,1,0,1,0,1,0,0,0,0,0,0,0,0。能否说该信号是纯粹随机干扰?(10分)

王静龙《非参数统计分析》课后计算题参考答案

王静龙《非参数统计分析》课后习题计算题参考答案习题一 1.One Sample t-test for a Mean Sample Statistics for x N Mean Std. Dev. Std. Error ------------------------------------------------- 26 1.38 8.20 1.61 Hypothesis Test Null hypothesis: Mean of x = 0 Alternative: Mean of x ^= 0 t Statistic Df Prob > t --------------------------------- 0.861 25 0.3976 95 % Confidence Interval for the Mean Lower Limit: -1.93 Upper Limit: 4.70 则接受原假设认为一样 习题二 1.描述性统计

习题三 1.1 {}+01=1339 :6500:650013=BINOMDIST(13,39,0.5,1) =0.026625957 S n H me H me P S + ==<≤ 另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数 * **0*0+1inf :2BINOM.INV(39,0.5,0.05)=14 1sup :113 2S 1313 n m i n d i n m m i n d d m i d αα==?????? ??=≥?? ? ????????? ?????? ??≤=-=?? ? ????????? =≤=∑∑= 以上两种都拒绝原假设,即中位数低于6500 1.2

非参数统计分析方法总结

非参数统计分析方法 一单样本问题 1,二项式检验:检验样本参数是否与整体参数有什么关系。 样本量为n,给定一个实数M0(代表题目给出的分位点数),和分位点∏(0.25,0.5,0.75)。用S-记做样本中比M0小的数的个数,S+记做样本中比M0大的数的个数。如果原假设H0成立那么S-与n的比之应为∏。 H0:M=M0 H1:M≠MO或者M>M0或者M

长度长) Spss步骤:分析—非参数检验—游程 得出统计量R和p值 当p值小于0.05时拒绝原假设,没有充足理由证明该数据出现是随机的 二,两个样本位置问题 1,Brown—Mood中位数检验 给出两个样本比较两个样本的中位数或者四分位数等是否相等或者有一定关系,设一个中值为M1,一个为M2 H0:M1=M2. H1:M1≠M2或者M1>M2或者M1

王静龙非参数统计分析课后计算题参考答案Word版

王静龙《非参数统计分析》课后习题计算题参考答案 习题一 1.One Sample t-test for a Mean Sample Statistics for x N Mean Std. Dev. Std. Error ------------------------------------------------- 26 1.38 8.20 1.61 Hypothesis Test Null hypothesis: Mean of x = 0 Alternative: Mean of x ^= 0 t Statistic Df Prob > t --------------------------------- 0.861 25 0.3976 95 % Confidence Interval for the Mean Lower Limit: -1.93 Upper Limit: 4.70 则接受原假设认为一样 习题二 1.描述性统计

习题三 1.1 {}+01=1339 :6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957 S n H me H me P S +==<≤ 另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数 * **0*0+1inf :2BINOM.INV(39,0.5,0.05)=14 1sup :113 2S 1313 n m i n d i n m m i n d d m i d αα==?????? ??=≥?? ? ????????? ?????? ??≤=-=?? ? ????????? =≤=∑∑= 以上两种都拒绝原假设,即中位数低于6500 1.2

非参数统计分析

第十三章非参数统计分析 统计推断方法大体上可分为两大类。第一大类为参数统计方法。常常在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。第二大类为非参数统计方法,着眼点不是总体参数,而是总体的分布情况或者样本所在总体分布的位置/形状。 非参数统计方法大约有8种,可被划分为两大类,处理各种不同情形的数据。 单样本情形: 检验样本所在总体的位置参数或者分布是否与已知理论值相同。 ①Chi-Square过程:针对二分类或者多分类资料 例题1:见书P243。检验样本分布情况是否与已知理论分布相同。运用卡方检验过程。 ②Binomial过程:针对二分类资料或者可转变为二分类问题的资料。 例题2 :见书P246。检验某一比例是否与已知比例相等,运用二项分布过程。练习:质量监督部门对商店里面出售的某厂家的西洋参片进行了抽查。对于25包写明为净重100g的西洋参片的称重结果为(单位:克),数据见非参数。Sav,人们怀疑厂家包装的西洋参片份量不足,要求进行检验。 ③Runs过程:用于检验样本序列是否是随机出现的。二分类资料和连续性资料均可。 游程检验: 游程的含义: 假定下面是由0和1组成的一个这种变量的样本: 0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0 其中相同的0(或相同的1)在一起称为一个游程(单独的0或1也算)。 这个数据中有4个0组成的游程和3个1组成的游程。一共是R=7个游程。其中0的个数为m=15,而1的个数为n=10。 游程检验的原理 判断数据序列是否是真随机序列。该检验的原假设为数据是真随机序列,备择假设为非随机序列,在原假设成立的情况下,游程的总数不应太多也不应太少。例题3:见书P247。检验样本数据是否是随机出现的。 例题4:从某装瓶机出来的30盒化妆品的重量(单位克),数据见非参数.sav,为了看该装瓶机是否工作正常。 提示:实际需要验证大于和小于中位数的个数是否是随机的(零假设为这种个数的出现是随机的)。 ④1-Sample--K –S 过程 原理:单样本的Kolmogorov-Smirnov检验(K-S检验)方法主要针对连续性资料,是用来检验一个样本数据的观测累积分布是否是已知的理论分布。这些

非参数统计(第二版)习题测验R程序

P37.例2.1 build.price<- c(36,32,31,25,28,36,40,32,41,26,35,35,32,87,33,35 );build.price hist(build.price,freq=FALSE)#直方图 lines(density(build.price),col="red")#连线 #方法一:m<-mean(build.price);m#均值 D<-var(build.price)#方差 SD<-sd(build.price)#标准差S t=(m-37)/(SD/sqrt(length(build.price)));t#t统计量计算检验统计量 t= [1] -0.1412332 #方法二:t.test(build.price-37)#课本第38页 例2.2 binom.test(sum(build.price<37),length(build.price), 0.5)#课本40页 例2.3 P<-2*(1-pnorm(1.96,0,1));P [1] 0.04999579 P1<-2*(1-pnorm(0.7906,0,1));P1 [1] 0.4291774 > 例2.4 > p<-2*(pnorm(-1.96,0,1));p [1] 0.04999579 > > p1<-2*(pnorm(-0.9487,0,1));p1 [1] 0.3427732 例2.5(P45) scores<- c(95,89,68,90,88,60,81,67,60,60,60,63,60,92, 60,88,88,87,60,73,60,97,91,60,83,87,81,90);length( scores)#输入向量求长度 ss<-c(scores-80);ss t<-0 t1<-0 for(i in 1:length(ss)){ if (ss[i]<0) t<-t+1#求小于80的个数 else t1<-t1+1求大于80的个数 } t;t1 > t;t1 [1] 13 [1] 15 binom.test(sum(scores<80),length(scores),0.75) p-value = 0.001436<0.01 Cox-Staut趋势存在性检验P47 例2.6 year<-1971:2002;year length(year) rain<- c(206,223,235,264,229,217,188,204,182,230,223, 227,242,238,207,208,216,233,233,274,234,227,221 ,214, 226,228,235,237,243,240,231,210) length(rain) #(1)该地区前10年降雨量是否变化? t1=0 for (i in 1:5){ if (rain[i]

两个独立样本的非参数检验方法有哪四种

两个独立样本的非参数检验方法有哪四种 两独立样本的非参数检验是在对总体分布不很了解的情况下,通过分析样本数据,推断样本来自的两个独立总体分布是否存在显著差异。一般用来对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。 一、Mann-Whitney U检验 主要通过对平均秩的研究来实现推断。 将数据按照升序进行排序,每一个具体数据都会有一个在整个数据中的名次或排序序号,这个名次就是该数据的秩。 相同观察值(即相同秩,ties),取平均秩。 两独立样本的Mann-Whitney U检验的零假设 H0:两个样本来自的独立总体均值没有显著差异。 将两组样本(X1 X2 …… Xm)(Y1 Y2 …… Yn)混合升序排序,每个数据将得到一个对应的秩。 计算两组样本数据的秩和Wx ,Wy 。 N=m+n Wx+Wy= N(N+1)/2 如果H0成立,即两组分布位置相同,Wx应接近理论秩和 m(N+1)/2; Wy 应接近理论秩和n(N+1)/2)。 如果相差较大,超出了预定的界值,则可认为H0不成立。 二、两个独立样本的K-S检验 K-S检验不仅能够检验单个总体的分布是否与某一理论分布差异显著,还能够检验两个总体的分布是否存在显著差异,其零假设是两组独立样本来自的两个总体的分布无显著差异。 两个独立样本K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路大体一致。这里是以变量值的秩作为分析对象,而非变量值本身。其基本思路如下: ①首先,将这两组样本混合并按升序排序。 ②然后分别计算两组样本秩的累计频数和累计频率。

最后,计算累计频率之差,得到秩的差值序列并得到D统计量(同单样本K-S检验,但无需修正)。 三、游程检验(Wald-Wolfwitz Runs) 零假设是H0:为样本来自的两独立总体分布没有显著差异。 样本的游程检验中,计算游程的方法与观察值的秩有关。首先,将两组样本混合并按照升序排列。在数据排序时,两组样本的每个观察值对应的样本组标志值序列也随之重新排列,然后对标志值序列求游程。 如果计算出的游程数相对比较小,则说明样本来自的两总体的分布形态存在较大差距;如果得到的游程数相对比较大,则说明样本来自的两总体的分布形态不存在显著差距。 SPSS将自动计算游程数得到Z统计量,并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为两个样本来自的总体分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为两个样本来自的总体分布无显著差异。 四、极端反应检验 从另一个角度检验两独立样本所来自的两个总体分布是否存在显著差异。其零假设是来两独立样本来自的两个总体分布无显著差异。 极端反应检验的基本思想是将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现极端反应。如果试验样本没有出现极端反应,则认为两总体分布无显著差异,反之,则总体分布存在显著差异。

两个独立样本的非参数检验方法有4种

两个独立样本的非参数检验方法有4种 曼-惠特尼U检验(Mann—whitney U) 两个独立的曼-惠特尼U检验可用于对两个总体分布的比较判断。其零假设是两组独立样本来自的总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现推断秩简单的说就是变量值排序的名次。 两个独立样本的K-S检验 K-S检验不仅能够检验单个总体的分布是否与某一理论分布差异显著,还能够检验两个总体的分布是否存在显著差异,其零假设是两组独立样本来自的两个总体的分布无显著差异。 两个独立样本K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路大体一致。主要差别在于:这里是以变量值的秩作为分析对象,而非变量值本身。其基本思路如下: ①首先,将这两组样本混合并按升序排序。 ②然后分别计算两组样本秩的累计频数和累计频率。 ③最后,计算累计频率之差,得到秩的差值序列并得到D统计量(同单样本K-S检验,但无需修正)。 两独立样本的游程检验 单样本游程检验用来检验变量值的出现是否随机,而两个独立变量游程检验则用来检验两个独立样本来自的两个总体的分布是否存在显著差异。其零假设是两组独立样本来自的两个总体的分布无显著差异。 两独立样本的游程检验与单样本游程检验的基本思想相同,不同的是计算游程数的方法。两独立样本的游程检验中,又程数依赖于变量的秩。 步骤如下:首先,将两组样本混合并按升序排列,在变量值排序的同时,对应的组标记值也会随之重新排列。 然后,对组标记只序列按前面讨论的游程的方法计算游程数容易理解:如果两总体的分布存在较大的差距,那么游程数会相对比较少,如果游程数比较大,则应是两组样本充分混合的结果,那么总体的分布不会存在显著差异。 再次,根据游程数据计算Z统计量,该统计量近似服从正态分布。 极端反应检验 极端反应检验从另一个角度检验两独立样本所来自的两个总体分布是否存在显著差异。其零假设是来两独立样本来自的两个总体分布无显著差异。 极端反应检验的基本思想是将一组样本作为控制样本,另一组样本作为实验样本。以控制样本作为对照,检验实验样本相对于控制样本是否出现极端反应。如果试验样本没有出现极端反应,则认为两总体分布无显著差异,反之,则总体分布存在显著差异。 第1 页共1 页

王静龙《非参数统计分析》教案

.引言 一般统计分析分为参数分析与非参数分析,参数分析是指,知道总体分布,但其中几个参数的值未知,用统计量来估计参数值,但大部分情况,总体是未知的,这时候就不能用参数分析,如果强行用可能会出现错误的结果。 例如:分析下面的供应商的产品是否合格? 合格产品的标准长度为(±),随即抽取n=100件零件,数据如下: 表 经计算,平均长度为cm x 4958.8=,非常接近中心位置,样本标准差为 () 1047.011 2 =--= ∑=n i i n x x s cm.一般产品的质量服从正态分布,),(~2δμN X 。 这说明产品有接近三分之一不合格,三分之二合格,所以需要更换供应厂 商,而用非参数分析却是另外一个结果。 以下是100个零件长度的分布表:

这说明有90%的零件长度在)2.05.8(±cm 之间,有9%的零件不合格,所以工厂不需要换供应商。 例2 哪一个企业职工的工资高? 表两个企业职工的工资 显然,企业1职工的工资高,倘若假设企业1与企业2的职工工资分别服从正态分布),(),,(22σσb N a N ,则这两个企业职工的工资比较问题就可以转化为一个参数的假设检验问题,原假设为b a H =:0,备择假设为b a H >:0 则 ))11(,(~2σn m b a N y x +-- 若0H 为真,则 其中])()([211 212 2∑∑==-+--+= n i i m i i w y y x x n m S 拒绝域为:}325.1{)}20({90.0≥=≥t t t 检测值为:282.1=t 故不能拒绝原假设,认为两企业的工资水平无差异。 也可以用值-P 检验 由于1073.0)282.1)20((=≥t P 故不能拒绝原假设,认为两企业的工资水平无差异。

非参数统计部分课后习题参考答案

课后习题参考答案 第一章p23-25 2、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。我们对这两组数据作同样水平a=的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。第一组数据的检验结果为:df=7,t 值为,单边p 值为,结论为“拒绝H 0:u=100。”(注意:该组均值为);第二组数据的检验结果为:df=2,t 值为,单边p值为;结论为“接受H 0:u=100。”(注意:该组均值为)。你认为该问题的结论合理吗说出你的理由,并提出该如何解决这一类问题。 答:这个结论不合理(6分)。因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。(4分) 第三章p68-71 3、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。已知1997年的索赔数额的中位数为5064元。 (1)是否1998年索赔的中位数比前一年有所变化能否用单边检验来回答这个问题(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。(10分) (3)找出基于符号检验的95%的中位数的置信区间。(8分) 解:(1)1998年的索赔数额的中位数为9480元比1997年索赔数额的中位数5064元是有变化,但这只是从中位数的点估计值看。如果要从普遍意义上比较1998年与1997年的索赔数额是否有显著变化,还得进行假设检验,而且这个问题不能用单边检验来回答。(4分) (2)符号检验(5分) 设假设组:H 0:M =M 0=5064 H 1:M ≠M 0=5064 符号检验:因为n +=11,n-=3,所以k=min(n+,n-)=3 精确检验:二项分布b(14,, ∑=-=3 0287 .0)2/1,14(n b ,双边p-值为,大于a=,所以在a水平 下,样本数据还不足以拒绝零假设;但假若a=,则样本数据可拒绝零假设。查二项分布表得a=的临界值为(3,11),同样不足以拒绝零假设。 正态近似:(5分) np=14/2=7,npq=14/4= z=(3+/5.3≈>Z a/2= 仍是在a=的水平上无法拒绝零假设。说明两年的中位数变化不大。 (3)中位数95%的置信区间:(5064,21240)(8分) 7、一个监听装置收到如下的信号:0,1,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,1,1,1,1,0,1,0,0,1,1,1,0,1,0,1,0,1,0,0,0,0,0,0,0,0,1,0,1,1,0,0,1,1,1,0,1,0,1,0,0,0,1,0,0,1,0,1,0,1,0,0,0,0,0,0,0,0。能否说该

非参数检验 SPSS操作

非参数检验的SPSS操作 前面一章介绍的二项分布的比率检验、配合度检验——卡方检验和1-Sample K-S检验等都属于非参数检验。这一节我们主要结合前面参数假设检验一章讲过的t检验以及方差分析一章讲过的方差分析,来进一步分析,当参数检验的前提条件不满足时,两个样本和多个样本平均数差异的SPSS操作方法。 一、两个独立样本的差异显著性检验 两独立样本的的差异显著性检验只有在满足如下条件时才能进行T检验:变量为正态分布的连续测量数据。若数据不满足这样的条件,强行进行T检验容易造成错误的结论。在数据不能满足这种参数检验的条件下,我们可以选择非参数检验方法进行。与两独立样本差异显著性检验相对应的方法可以在SPSS主菜单Analyze / Nonparametric Tests / 2 Independent Samples…中得到。 1.数据 采用本章第一节中例2的数据(数据文件“9-4-1.sav”),具体介绍操作过程。 2.理论分析 对于数据文件9-4-1.sav中的数据,目的是检验男女生之间注意稳定性是否存在显著差异,注意稳定性测量的结果虽然是测量数据但是从总体上来看不满足正态分布的前提假设,另外不同性别的学生可以看成是两组独立的样本,因此对上述资料的检验可以用非参数的独立样本的检验方法。 2.操作过程 (1)在SPSS主菜单中选择Analyze / Nonparametric Tests / 2 Independent Samples…得到两个独立样本非参数检验的主对话框(图9-1),把因变量atten选入到检验变量表列(Test Independent-Sample

两个独立样本的非参数检验方法

两个独立样本的非参数检验方法 两个独立样本的费参数检验正是对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布是否存在显著差异的方法。 一、曼-惠特尼U检验 两个独立的曼-惠特尼U检验可用于对两个总体分布的比较判断。其零假设是两组独立样本来自的总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现推断秩简单的说就是变量值排序的名次。 二、两个独立样本的K-S检验 K-S检验不仅能够检验单个总体的分布是否与某一理论分布差异显著,还能够检验两个总体的分布是否存在显著差异,其零假设是两组独立样本来自的两个总体的分布无显著差异。 两个独立样本K-S检验的基本思想与前面讨论的单样本K-S检验的基本思路大体一致。这里是以变量值的秩作为分析对象,而非变量值本身。其基本思路如下: ①首先,将这两组样本混合并按升序排序。 ②然后分别计算两组样本秩的累计频数和累计频率。 ③最后,计算累计频率之差,得到秩的差值序列并得到D统计量(同单样本K-S检验,但无需修正)。 三、两独立样本的游程检验 单样本游程检验用来检验变量值的出现是否随机,而两个独立变量游程检验则用来检验两个独立样本来自的两个总体的分布是否存在显著差异。其零假设是两组独立样本来自的两个总体的分布无显著差异。 两独立样本的游程检验与单样本游程检验的基本思想相同,不同的是计算游程数的方法。两独立样本的游程检验中,又程数依赖于变量的秩。 步骤如下:首先,将两组样本混合并按升序排列,在变量值排序的同时,对应的组标记值也会随之重新排列。 然后,对组标记只序列按前面讨论的游程的方法计算游程数容易理解:如果

两个独立样本的4种非参数检验方法

两个独立样本的4种非参数检验方法 1、两独立样本的Mann-Whitney U检验 定义:两独立样本的非参数检验是在对总体分布不很了解的情况下,通过分析样本数据,推断样本来自的两个独立总体分布是否存在显著差异。一般用来对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。 Mann-Whitney U检验(Wilcoxon秩和检验)主要通过对平均秩的研究来实现推断。 秩:将数据按照升序进行排序,每一个具体数据都会有一个在整个数据中的名次或排序序号,这个名次就是该数据的秩。 相同观察值(即相同秩,ties),取平均秩。 两独立样本的Mann-Whitney U检验的零假设 H0:两个样本来自的独立总体均值没有显著差异。 将两组样本(X1 X2 …… X m)(Y1 Y2…… Y n)混合升序排序,每个数据将得到一个对应的秩。 计算两组样本数据的秩和W x,W y 。 N=m+n Wx+Wy=N(N+1)/2 如果H0成立,即两组分布位置相同,W x应接近理论秩和m(N+1)/2;W y 应接近理论秩和n(N+1)/2)。 如果相差较大,超出了预定的界值,则可认为H0不成立。 2、两独立样本的K-S检验 两独立样本的K-S检验与单样本K-S检验类似。 其零假设H0:样本来自的两独立总体分布没有显著差异。 检验统计量 D 为两个样本秩的累积分布频率的最大绝对差值。当D较小时,两样本差异较小,两样本更有可能取自相同分布的总体;反之,当D较大时,两样本差异变大,两样本更有可能取自不同分布。 3、两独立样本的游程检验(Wald-Wolfwitz Runs) 零假设是H0:为样本来自的两独立总体分布没有显著差异。

非参数统计和回归分析习题参考答案

非参数统计和回归分析习题参考答案 班级: 姓名: 学号: 得分 一、单项选择题: 1、相关关系是指变量间的 ( D ) A 、严格的函数关系 B 、简单关系和复杂关系 C 、严格的依存关系 D 、不严格的依存关系 2、进行简单直线回归分析时,总是假定 ( A )。 A 自变量是非随机变量、因变量是随机变量 B 两变量都是随机变量 C 自变量是随机变量、因变量是确定性变量 D 两变量都不是随机变量 3、回归方程 i i x y 5.1123?+=中的回归系数数值表明:当自变量每增加一个单位时,因变量 ( B )。 A 增加1.5个单位 B 平均增加1.5个单位 C 增加123个单位 D 平均增加123个单位 4、设某种产品产量为 1000 件时,其生产成本为 30000 元,其中固定成本 6000 元,则总生产成本对产量的一元线性回归方程为: ( B ) A 、y=6+0.24x B 、y=6000+24x C 、y=24000+6x D 、y=24+6000x 5、在回归分析中,要求对应的两个变量 ( B ) A.都是随机变量 B.不是对等关系 C.是对等关系 D.都不是随机变量 6、下列现象的相关密切程度高的是 ( B )。 A 某商店的职工人数与商品销售额之间的相关系数为0.87 B 流通费用率与商业利润率之间的相关系数为-0.94 C 商品销售额与商业利润率之间的相关系数为0.51 D 商品销售额与流通费用率之间的相关系数为-0.81 7.相关系数r =0表示 ( D ) (A )不存在相关关系 (B )存在平衡关系 (C )两变量独立 (D )不存在线性相关关系 8.若物价上涨,商品的需求量相应减少,那么物价与商品需求量之间的关系为 ( B ) A 、不相关 B 、负相关 C 、正相关 D 、复相关 9、回归估计标准误差的剂量单位与 ( B ) A 、自变量单位相同 B 、因变量单位相同 C 、相关系数单位相同 D 、自变量、因变量的单位都不同 10、在回归分析中,F 检验主要是用来检验 ( C ) A 、相关系数的显著性 B 、回归系数的显著性 C 、线性关系的显著性 D 、估计标准误差的显著性 11、下列检验中不属于非参数统计方法的是 ( B ) A 、总体是否服从正态分布 B 、总体的方差值是否为某一个值 C 、两组随机变量之间是否独立 D 、样本的取得是否具有独立性

非参数统计·王兴_第三章习题部分作业

非参数统计 3.1 (1)01:10:10e e H M H M =?≠ >t1<-c(22,9,4,5,1,16,15,26,47,8,31,7) > binom.test(sum(t1<10),length(t1),0.5) Exact binomial test data: sum(t1< 10) and length(t1) number of successes = 6, number of trials = 12, p-value = 1 alternative hypothesis: true probability of success is not equal to 0.5 95 percent confidence interval: 0.2109446 0.7890554 sample estimates: probability of success 0.5 (2)用Wilcoxon 秩和检验进行决策 根据题意,原假设和备择假设分别为: 01:10:10H H θθ=?≠ x<-c(22,9,4,5,1,16,15,26,47,8,31,7) y=10 w1=0 w2=0 z=x-y r<-rank(abs(z)) for(i in 1:length(x)){ if(z[i]>0){ w1=w1+r[i]} if(z[i]<0){ w2=w2+r[i]} if(z[i]==0){ w1=w1+0 w2=w2+0} } w=min(w1,w2) dwilcoxonfun=function(N){

a=c(1,1) n=1 for(i in 2:N){ t=c(rep(0,i),a) a=c(a,rep(0,i))+t } p=a/(2^N) p } N=length(z) pvalue=sum(dwilcoxonfun(N)[1:w+1]) pvalue >pvalue [1] 0.1503906 由Wilcoxon 秩和检验结果,P 值=0.150>0.05,不能拒绝原假设。因此可以认为顾客在超市购买的商品平均件数为10件。 符号检验的P 值过大(=1)而Wilcoxon 秩和检验的P 值较大,均不能拒绝原假设,得到的结果相同。当时Wilcoxon 秩和检验的P 值较符号检验更小,这表明在对称性的假定之下,Wilcoxon 符号秩检验采用了比符号检验更多的信息,因而可能得到更可靠的结果。 3.2 0:()()H P M P F =,该疾病得病的男女比例为1:1 1:()()H P M P F ≠,该疾病得病的男女比例不为1:1 用大样本的符号检验,设患病男性人数为S +,150S +=;患病女性人数为S -,200S -=。350n '=, 1752n '=,由于2 n S +'<,所以取负修正,于是可得检验统计量: 0.052.726 1.96Z Z ==>= 检验结果拒绝原假设,因此我们认为该疾病得病的男女比例不为1:1。 3.3 0H :该城市死亡率无逐年上升的趋势 1H :该城市死亡率有逐年上升的趋势

第09章 非参数检验练习题

第9章非参数检验练习题 选择题: 1. 与参数检验相比,非参数检验的主要特点是(B ) A. 对总体的分布没有任何要求 B. 不依赖于总体的分布 C. 只考虑总体的位置参数 D. 只考虑总体的分布 2. 如果要检验两个配对总体的分布是否相同,采用的非参数检验方法是(C ) A.弗里德曼(Friedman)检验 B. Kruskal-Wallis检验 C. Wilcoxon符号秩检验 D. Mann-Whitney检验 3. 如果要检验K个独立总体的分布是否相同,采用的非参数检验方法是(D ) A. Wilcoxon符号秩检验 B.弗里德曼(Friedman)检验 C. Mann-Whitney检验 D. Kruskal-Wallis检验 4. Mann-Whitney检验主要用于检验(A ) A. 两个独立总体的分布是否相同 B. 两个配对总体的分布是否相同 C. K个独立总体的分布是否相同 D. K个配对总体的分布是否相同 5. Kruskal-Wallis检验主要用于检验(D) A. 两个配对总体的分布是否相同 B. 两个独立总体的分布是否相同 C. K个配对总体的分布是否相同 D. K个独立总体的分布是否相同 6. 下面为来自两个总体的独立样本数据,要检验两个样本是否来自同一分布的总体,采用的非参数检验方法是(C) 样本1130146124152147 样本292160164197166 A. 弗里德曼(Friedman)检验 B. Wilcoxon符号秩检验 C. Mann-Whitney检验 D. Kruskal-Wallis检验

7. 下面是来自4个总体的独立样本数据,要检验这4个样本数据是否来自同一个总体,采用的非参数检验方法是(A ) 样本1样本2样本3样本4 14101116 1391217 1091216 10121314 A. 等方差的 B. 等均值的 C. 独立的 D. 相关的 8. K个独立样本的Kruskal-Wallis检验所对应的参数检验方法是(C ) A. 两个独立总体均值之差的检验 B. 两个配对总体均值之差的检验 C. 单因子方差分析 D. 双因子方差分析 9. 两个配对样本的Wilcoxon符号秩检验所对应的参数检验方法是(A ) A. 两个配对总体均值之差的检验 B. 两个独立总体均值之差的检验 C. 一个总体均值的检验 D. 单因子方差分析 1、4组学生成绩(优、良、中、差)比较,宜用(B )。 A 方差分析 B 秩和检验 C 卡方检验 D 四格表直接计算概率法 2、两样本秩和检验的无效假设是(B )。 A 两样本秩和相等 B 两总体分布相同 C 两样本分布相同 D 两总体秩和相等 3、(C ),应该用非参数统计方法。 A 正态分布资料n不相等时两样本均数比较 B 正态分布资料两样本方差都比较大时两样本均数的比较 C 两组等级资料的比较 D 两组百分比资料的平均数比较 4、在统计检验中是否选择用非参数统计方法,( A )。 A 要根据研究目的和数据特征作决定 B 可在算出几个统计量和得出初步结论后进行选择 C要看哪个统计结论符合专业理论

相关文档
相关文档 最新文档