文档库 最新最全的文档下载
当前位置:文档库 › 第5讲t检验与u检验(2004).

第5讲t检验与u检验(2004).

第5讲t检验与u检验(2004).
第5讲t检验与u检验(2004).

均数差异的假设检验

假设检验的具体方法,通常是以选定的检验统计量来命名的,如t检验要用特定的公式计算检验统计量t值,u检验要用特定的公式计算检验统计量u值。应用时首先要了解各种检验方法的用途、应用条件和检验统计量的计算方法。

一、单组完全随机化设计资料均数的t检验和u检验

从一个总体中完全随机地抽取一部分个体进行研究,这样的设计称为单组完

全随机化设计(completely randomized design of single group。

例题1:根据大量调查,已知健康成年男子脉搏均数为72次/分,某医生在某一

山区随机抽查了25名健康成年男子,求得其脉搏均数为74.2次/分,标准差为

6.0次/分,能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数?这两个均数不等有两个可能:(1。由于抽样误差所致;(2)由于环境条件的影响。如何作出判断呢?在统计上是通过假设检验来回答这个问题。以下介绍建设检验

(t检验)的思想方法与步骤。

1、建立检验假设和确定检验水准

H0: ^1^0 (=72 次/分):H1:円烈0 (=72 次/分):?=0.05

本例分析目的是比较山区成年男子脉搏样本均数与一般成年男子脉搏总体

均数有无差别?

J是未知的,可以假设」等于某一定值5,J与5的差等于零,这样的假

设称为无差异假设或零假设(null hypothesis)记为H。:丄1=勺

表示该山区的环境条件对脉搏数无影响,他们之间的差异是由于抽样误差所致。与零假设相对立的假设称为对立假设或备择假设(alternative hypothesis),符号为H1,它是在拒绝H0的情况下而接受的假设。假设检验所用的检验统计量一般都是建立在零假设的基础上,因为H0比较单纯明确,而H1却包含着各种情况。

检验水准(size of test亦称显著性水准(significanee level),符号为〉,在实际工作中常取0.05或0.01。

2、选定检验方法和计算统计量

本例:n=25, x=74.2 次/分, S=6.0 次/分。

检验统计量公式为:

S x

将以上数据代入公式,得:

74.2 - 72.0 6.0/ i 25

要根据研究类型和统计推断目的选用不同检验方法, 不同检验方法有相应的检验 统计量,本例的检验统计量t 服从■ = n-1的t 分布。建设检验方法通常是以检 验统计量来命名的,故,本例检验称为 t 检验。

3、确定P 值和作出推断结论

查t 界值表,得出结论为,按:=0.05水准,拒绝H o ,接受H i 认为该山区的成年男子脉搏均数高于一般的成年男子脉搏均数。

关于检验水准是取0.05、0.01或其他数值,要根据不同的实验而定。:?取值 较小,有利于提高“阳性”统计检验结果的可靠性;

「取值较大,有利于发现研

究总体可能存在的差异,但可靠性降低。较好的做法是精确地计算出 P 值,这

会对人们认识你所作的实验有很大的参考价值。

随机化配对设计资料均数的t 检验

配对设计资料分三种情况:(1)配成对子的同对受试对象分别给予两种不 同的处理;(2)同一受试对象分别接受两种不同处理;(3)同一受试对象处理前 后的比较。同对或同一受试对象分别接受两种不同处理结果的比较,

其目的是推

断两种处理的效果有无差别;自身处理前后结果的比较,其目的是推断某种处理 有无作用。 因此,应该首先计算出各对差值 d 的均数。当两种处理结果无差别 或某种处理不起作用时,理论上差值 d 的总体均数?=0。故可将配对设计资料 的假设检验视为样本均数与总体均数 J d =0的比较,配对设计资料以小样本居多, 故常用t 检验。其计算公式为:

例题2、将大白鼠配成8对,每对分别饲以正常饲料和缺乏维生素 E 饲料,测得 两组大白鼠肝中维生素 A 的含量如下表,试比较两组大白鼠中维生素 A 的含量

n -1

S d

d

S d / n

= 1.833, 24

有无差别

表 不同饲料组大白鼠肝中维生素 A 的含量(U/g )

大白鼠 配对号

正常饲料 组

维生素E 缺乏组

差数,d

d 2

1 3550 2450 1100 1210000

2 2000 2400 -400 160000

3 3000 1800 1200 1440000

4 3950 3200 750 562500

5 3800 3250 550 302500

6 3750 2700 1050 1102500

7 3450 2500 950 902500 8

3050 1750

1300 1690000 合计

6500

7370000

1) H o :七=0, H i : .2 0,

: =0.05

2)

计算统计量

d

d

6500

=812.5 (U/g)

n 8

7370000 -(6500)2 /8

| 8"8-1)

3)确定P 值下结论

查 t 界值表(双側),t > t 0.01, 7=3.499, P<0.01 结论:按-■ = 0.01水准,拒绝H 0,接受H 1。

4)题目结论:可以认为两种饲料喂养的大白鼠肝中维生素A 的含量有差别,正 常饲料组

比缺乏维生素E 饲料组的含量要高。

' d 2 _ C d)2 / n ' n(n -1)

= 193.1298(U /g)

812.5-0

193.1298

= 4.2070, - 7

例3:胃癌或巨型胃溃疡13人,在实行全胃切除术前后的体重(kg )如下:试 比较手术前后体重有无变化?

、o :丄d i .L d 屮 2、计算统计量

-1.904(kg)

3、确定P 值下结论

查 t 界值表(双側),t > t 0.05, 12 =2.179, P<0.05 结论:按:=0.05水准,拒绝H 。,接受 比。

4、题目结论:可以认为术前后体重有显著性差别。

三、 两组完全随机化设计资料均数的t 检验与u 检验

1、t 检验

将受试对象完全随机地分配到两组中,这两组分别接受不同的处理。这样 的设计称为两组完全随机化设计( completely ran domized desig n of two groups 。

有些研究设计既不能作自身对比,也不便于配对。如实验中只有把受试动物 杀死后才能获得所需数据,则不可能对动物在处理前后各进行一次测定; 再如比

较两种治疗方法对同一疾病的疗效, 每个患者一般只能接受一种方法的治疗,

受试患者配成若干对在实际工作中又非常困难,这时只能进行两组间均数的比 较。在两组比较的资料中,每个观察对象都应按照随机的原则进行分组,

两组样

56.2 13

= 4.323(kg)

4.323

1.904

= 2.27

本量可以相同,也可以不同,但只有在两组例数相同时检验效率才最高 统计量计算公式为:

1 1

Si 「

S c 2(

n i ))

'、

X

1

-(二.

X i ) /n 1 亠二

x

2

-(二

X

2) /n

2

:

n

1 + n 2—

2 M

—1)S 2 g -1)S ; 的-1) (n 2 -1)

例题某医院研究乳酸脱氢同工酶(LDH )测定对心肌梗死的诊断价值时,曾用 随机抽样方法比较了 10例心肌梗死患者与10例健康人LDH 测定值的差别,结 果如下,试冋LDH 测定值在两组间有无差别? 患者(X 1) 23.2 45.0 45.0 40.0 35.0 44.1 42.0 52.5 50.0 58.0

健康人(X 2) 20.0 31.0 30.5 23.1

24.2 38.0 35.5 37.8 39.0 131.0

(1)、H 0: .-1='-2 H 1: 」1-」2

: =0.05

本例:

n 1 =10,

Z X 1 =434.80,

'7 X 2 =19742.30, X ’ =43.48, S ’ =9.64

n

2 =10,

Z

X 2

=310.10, 、X 2 =10025.59, X 2 =31.01,

S 2 =6.74

(2)、计算统计量:

将上述数据代入公式,得:

1974.230 -434.82/10 10025.59 -310.102 /10 1 1、

V

不市

^^

3.7217(%

)

43.48 -31.01 t

3.7217

(X i -X 2)-(5 - 七)

X i —X 2

S

X 1卫

-3.3506,

丁 =10 10-2 =18

n 1 n 2

(3) 、确定 P 界作出结论 本例 t > t 0.05,18 =3.197, P<0.05

(4) 、结论:按a =0.05水准,拒绝H 。,接受H i 。可以认为乳酸脱氢同工酶测 定值在心肌梗死与健康人之间有差别,心肌梗死患者的含量比健康人的要高。

如果例3用随机样本设计的t 检验计算得到如下结果:

门勺=13、 X 勺=47 .5385

、 n 2 =13、 厂2 = 51 .8615 、

查 t 界值表(双側),t < t 0.05, 24=2.064, P > 0.05

结论:按:?二0.05水准,接受H 。,可以认为术前后体重有显著性差别

2、U 检验(两大样本均数的假设检验)

以两个正态或非正态总体独立地抽取含量分别为 n 1和n 2的样本,当n 1和 n 2均较大时,比如均大于100时,那么样本均数的和与差的分布也服从正态分布, 即:

(X 1±X 2)?N |(已-巴),(」+」)

- 厲 n 2 一

故当两样本均数较多时,即使总体分布呈偏离正态,其样本均数的分布仍近 似正态分布,且这时用S 估计匚的误差较小,故可用u 检验,即用正态分布的原 理作两个均数间的假设检验。

S t = 7.2585 S 2 = 7.0875

S x 1 -X 2

(13-1)7.25852(13-1)

7.08752 耳 13+13 — 2

(1 1

) = 2.8145(kg )

十36,

2.8145 2.8145

-13 13-2 =24

第三章 假设检验

第三章 假设检验 3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。已知这种元 件寿命服从标准差100σ=(小时)的正态分布,试在显著水平0.05下确 定这批元件是否合格。 解: {}01001:1000, H :1000 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得: 拒绝域: 本题中:0.950.950 u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。 3.4某批矿砂的五个样品中镍含量经测定为(%): 3.25 3.27 3.24 3.26 3.24 设测定值服从正态分布,问在0.01α=下能否接受假设,这批矿砂的镍含量为3.25? 解:n=5; x=zeros(1,n); x=[3.25 3.27 3.24 3.26 3.24]; x1=sum(x)/n; x2=0; for i=1:n x2=x2+(x(1,i)-x1)^2;

end x2=x2/n; S=sqrt(x2); 010110 2: 3.25 H :t 3.252, S=0.0117, n=5 0.3419 H x μμμμσ==≠==提出假设:构造统计量:本题属于未知的情形,可用检验,即取检验统计量为:本题中,代入上式得:否定域为:1-20.99512 0 V=t>t (1)0.01,(4) 4.6041, 3.25n t t t H ααα- ??-?? ?? ==<∴Q 本题中,接受认为这批矿砂的镍含量为。 3.5确定某种溶液中的水分,它的10个测定值0.452%,0.035%,X S == 2N(,),μσ设总体为正态分布试在水平5%检验假设: 0101() H :0.5% H :0.5%() H :0.04% H :0.0.4% i ii μμσσ≥<≥< {}0.95()0.452% S=0.035%-4.1143 (1)0.05 n=10 t (9) 1.833i t X n ασα==-==1-构造统计量:本文中未知,可用检验。取检验统计量为X 本题中,代入上式得: 0.452%-0.5% 拒绝域为: V=t >t 本题中,0 1 4.1143H <=∴t 拒绝

医药数理统计第六章习题(检验假设和t检验)

第四章抽样误差与假设检验 练习题 一、单项选择题 1. 样本均数的标准误越小说明 A. 观察个体的变异越小 B. 观察个体的变异越大 C. 抽样误差越大 D. 由样本均数估计总体均数的可靠性越小 E. 由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是 A. 样本不是随机抽取 B. 测量不准确 C. 资料不是正态分布 D. 个体差异 E. 统计指标选择不当 3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为 A. 正偏态分布 B. 负偏态分布 C. 正态分布 D. t分布 E. 标准正态分布 4. 假设检验的目的是 A. 检验参数估计的准确度 B. 检验样本统计量是否不同 C. 检验样本统计量与总体参数是否不同 D. 检验总体参数是否不同 E. 检验样本的P值是否为小概率 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~ 9.1×109/L,其含义是 A. 估计总体中有95%的观察值在此范围内 B. 总体均数在该区间的概率为95% C. 样本中有95%的观察值在此范围内 D. 该区间包含样本均数的可能性为95% E. 该区间包含总体均数的可能性为95%

答案:E D C D E 二、计算与分析 1. 为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L ,标准差为1.5g/L ,试计算该地小学生血红蛋白平均数的95%可信区间。 [参考答案] 样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。 101.4X =, 1.5S =,450n =,0.07450 X S n = == 95%可信区间为 下限:/2.101.4 1.960.07101.26X X u S α=-?=-(g/L) 上限:/2.101.4 1.960.07101.54X X u S α+=+?=(g/L) 即该地成年男子红细胞总体均数的95%可信区间为101.26g/L ~101.54g/L 。 2. 研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl ,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl ,标准差为30mg/dl 。问题: ①如何衡量这100名儿童总胆固醇样本平均数的抽样误差? ②估计100名儿童的胆固醇平均水平的95%可信区间; ③根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。 [参考答案] ① 均数的标准误可以用来衡量样本均数的抽样误差大小,即 30S =mg/dl,100n = 3.0100 X S n = == ② 样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。 207.5X =,30S =,100n =,3X S =,则95%可信区间为 下限:/2.207.5 1.963201.62X X u S α=-?=-(mg/dl )

第五章统计推断

第五章统计推断 ?总体与样本之间的关系 -从总体到样本的研究。 -由样本推断总体:样本统计量的分布规律一般是正态分布、t 分布、χ2分布和F分布。?对总体做统计推断的两种途径 –先对所估计的总体做一假设,然后通过样本数据推断这个假设是否接受,这种途径称为统计假设检验(statistical test of hypothesis) –通过样本统计量估计总体参数,称为总体参数估计(estimation of population parameter) ?本章重点讲解统计推断的一般原理以及对总体平均数及标准差的推断。 一、假设检验 假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种被此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。如果抽样结果使小概率发生,则拒绝假设,如抽样结果没有使小概率发生,则接受假设。 小概率原理 在一次试验中,某事件几乎是不会发生的,若根据一定的假设条件计算出来的该事件发生的概率很小,而在一次试验中它竟然发生了,则可认为原假设条件不正确,给予否定。 在生物统计的显著性检验中,通常取5%或1%小概率为显著性水平,记为“α” 例5.1 根据以往的经验,用一般疗法治疗某种疾病,其死亡率为40%,治愈率为60%。今用一种新药治疗染上该病的6名患者,这6人均治愈了,问该新药是否显著优于一般疗法? 小概率原理用于显著性检验 例5.2用实验动物作实验材料,现从一批动物(σ= 0.4)中抽取含量n = 10的样本并已经计算出平均值为10.23 g。已知这批动物饲养时间较长,不可能小于10g,问此批动物材料是否是抽自于μ=10的总体中? 解:1 样本平均数满足何种分布?

应用数理统计吴翊李永乐第三章 假设检验课后作业参考答案

第三章 假设检验 课后作业参考答案 3.1 某电器元件平均电阻值一直保持2.64Ω,今测得采用新工艺生产36个元件的平均电阻值为2.61Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为0.06Ω,问新工艺对产品的电阻值是否有显著影响?(01.0=α) 解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36 /06.064 .261.2/u 00 -=-= -= n X σμ (3)否定域???? ??>=???? ??>?? ??? ??<=--21212 αααu u u u u u V (4)给定显著性水平01.0=α时,临界值575.2575.22 12 =-=- α αu u , (5) 2 αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显著性影响。 3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件, 测得其寿命平均值为950(小时)。已知这种元件寿命服从标准差100σ=(小时)的正态分 布,试在显著水平0.05下确定这批元件是否合格。 解: {}01001:1000, H :1000 X 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得: 拒绝域: 本题中:0.950.950 u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。

3.3某厂生产的某种钢索的断裂强度服从正态分布( )2 ,σ μN ,其中()2 /40cm kg =σ。现从 一批这种钢索的容量为9的一个子样测得断裂强度平均值为X ,与以往正常生产时的μ相比,X 较μ大20(2 /cm kg )。设总体方差不变,问在01.0=α下能否认为这批钢索质量显著提高? 解: (1)提出假设0100::μμμμ>=H H , (2)构造统计量5.13 /4020 /u 00 == -= n X σμ (3)否定域{}α->=1u u V (4)给定显著性水平01.0=α时,临界值33.21=-αu (5) α-<1u u ,在否定域之外,故接受原假设,认为这批钢索质量没有显著提高。 3.4某批矿砂的五个样品中镍含量经测定为(%): 3.25 3.27 3.24 3.26 3.24 设测定值服从正态分布,问在0.01α=下能否接受假设,这批矿砂的镍含量为3.25? 解: 010110 2: 3.25 H :t X 3.252, S=0.0117, n=5 0.3419 H x μμμμσ==≠==提出假设:构造统计量:本题属于未知的情形,可用检验,即取检验统计量为:本题中,代入上式得:否定域为:1-20.99512 0 V=t>t (1)0.01,(4) 4.6041 , 3.25n t t t H ααα- ??-?? ?? ==<∴Q 本题中,接受认为这批矿砂的镍含量为。

第五章 准实验设计

第五章准实验设计 第一节单组准实验设计 一、准实验设计 (一)定义:介于真实验和非实验之间的一种设计类型,能在一定程度上控制无关变量,操纵自变量、控制实验处理,但不能随机的选择和分配被试。 准实验设计的应用:人格研究、临床心理的研究、社会心理以及教育心理研究常常采用准实验设计。 准实验设计的特点 不需要随机化程序(与实验或真实验最大的区别);研究者只能选择那些已具有了某种不同程度特征的被试。而不能像真实验那样从总体中随机选取被试或随机分组。 能有效解决生态效度和外部效度问题,但不能从准实验研究结果中作出因 果关系的结论,其主要原因是在研究的变量上缺乏严格控制,因而其内部效度较低。 现场研究中采用最多的是准实验设计,不过准实验并不一定都在现场进行。 例:霍桑实验(照明实验、福利实验、群体实验、谈话实验); ?社会心理学家所说的“霍桑效应”也就是所谓“宣泄效应”。霍桑工厂是美国西部电器公司的一家分厂。为了提高工作效率,这个厂请来包括心理学家在内的各种专家,在约两年的时间内找工人谈话两万余人次,耐心听取工人

对管理的意见和抱怨,让他们尽情地宣泄出来。结果,霍桑厂的工作效率大大提高。这种奇妙的现象就被称作“霍桑效应”。 准实验设计与实验设计的关键区别 ?它和真实验的主要区别在于,准实验中没有运用随机化程序进行被试选择和实验处理;也不能完全主动地操纵自变量。 ?在实验设计中,样本的随机分配形成了具有完全可比性的两个组别:实验组和控制组。 ?准实验设计用对照组取代了实验设计中的控制组。研究者努力创造一个与实验组在所有重要方面都尽可能相似的对照组,但与随机分配产生的控制组而言,它的可比性已经大为逊色了。 时间序列设计 【时间系列设计】 要对实验组做周期性的一系列测量,并在测 量的这一时间系列中间呈现实验变量(X),然后比 较实验变量前后的一系列测量记录是否有显著差异。 (一)模式 O1O2O3O4XO5O6O7O8 (二)应用 坎贝尔关于康涅狄格州的交通死亡人数与实施严 惩制度的关系的研究。 可能出现的结果类型

第七章 假设检验

第七章 假设检验 一、教材说明 本章主要介绍统计假设检验的基本概念和基本思想、正态总体参数的统计假设的显著性检验方法.。 1、本章的教学目的与要求 (1)使学生了解假设检验的基本概念; (2)使学生了解假设检验的基本思想; (3)使学生掌握假设检验的基本步骤; (4)使学生会计算检验的两类错误,搞清楚两类错误的关系; (5)使学生掌握正态总体参数的假设检验,主要是检验统计量及其分布,检验拒绝域的确定; (6)使学生灵活运用所学知识解决实际问题。 2、本章的重点与难点 本章的重点是正态总体参数的各种假设检验中的检验统计量及其分布,难点是假设检验拒绝域的确定。 二、教学内容 下面主要分3节来讲解本章的主要内容。 §7.1 假设检验的基本概念 对总体分布或分布中的某些参数作出假设,然后利用样本的观测值所提供的信息,运用数理统计的分析方法,检验这种假设是否成立,从而决定接受或拒绝“假设”,这一统计推断过程,称为假设检验。 1.引例 我们先举一个简单的实例来说明假设检验的基本思想及推理方法. 例1:某车间用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量, 它服从正态分布.且知标准差为0.015千克.当机器正常时, 其均值为0.5千克,某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(千克): 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常? 分析:用μ和σ分别表示这一天袋装糖重总体X 的均值和标准差,则)015.0,(~2 μN X ,其中μ未知。 问题: 已知总体2 (,)X N μσ:,且00.015,σσ==根据样本值判断 0.5μ=还是 0.5μ≠。 提出两个对立假设00:0.5H μμ==(原假设或零假设)和 10:H μμ≠(备择假设).再利用已知样本作出判断是接受假设0H ( 拒绝假设1H ) , 还是拒绝假设0H (接受假设 1H ). 如果作出的判断是接受0H , 则0μμ=即认为机器工作是正常的, 否则, 认为是不

计量经济学第三章课后习题详解

2011年各地区的百户拥有家用汽车量等数据 北京 天津 河北 山西 内蒙 古 辽宁 吉林 黑龙 江 上海 江苏 浙江 安徽 福建 江西 山东 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 一、研究的目的和要求 经济增长,公共服务、市场价格、交通状况,社会环境、政策因素都会影响中国汽车拥有量。为了研究一些主要因素与家用汽车拥有量的数量关系,选择“人均地区生产总值”、“城镇人口比重”、“交通工具消费价格指数”等变量来进行研究和分析。 为了研究影响2011年各地区的百户拥有家用汽车量差异的主要原因,分析2011年各地区的百户拥有家用汽车量增长的数量规律,预测各地区的百户拥有家用汽车量的增长趋势,需要建立计量经济模型。 二、模型设定 为了探究影响2011年各地区的百户拥有家用汽车量差异的主要原因,选择百户拥有家用汽车量为被解释变量,人均GDP、城镇人口比重、交通工具消费价格指数为解释变量。 首先,建立工作文件、选择数据类型“integer data”、“Start date”中输入“1”,“End date”中

输入“31”,在EViews命令框直接键入“data Y X2 X3 X4”,在对应的“Y X2 X3 X4”下输入或粘贴相应的数据。 探索将模型设定为线性回归模型形式:= 三、估计参数 在命令框中输入“LS Y C X2 X3 X4”,回车即出现下面的回归结果: 根据数据,模型估计的结果写为: t = = = F= n=31 四、模型检验 1.统计检验 (1)拟合优度:由上表中的数据可以得到: =,修正的可决系数为=,这说明模型对样本的拟合一般。说明解释变量“人均地区生产总值”、“城镇人口比重”、“交通工具消费价格指数”联合起来对被解释变量“百户拥有家用汽车量”做了绝大部分的解释。 (2)F检验:针对 :=0,给定显著水平=,在F分布表中查出自由度为k-1=3和n-k=27的临界值 (3,27)=,由上表可知F=>(3,27)=,应拒绝原假设:=0,说明回归方程显 著,即“人均地区生产总值”、“城镇人口比重”、“交通工具消费价格指数”变量联合起来确实对“百户拥有家用汽车量”确实有显著影响。 (3)t检验:分别针对 :=0,给定显著水平=查t分布表得自由度为n-k=31-4=27临界值 (n-k)=(27)=, 与对应的t统计量分别为、、、,其绝对值均大于 (n-k)=(27)=,这说明在显著性水平=下,分别都应当拒绝:=0,也就是说,当在其他解释变量不变的情况下,解释变量“人均地区生产总值”(X2)、“城镇人口比重”(X3)、“交通工具消费价格指数”(X4)分别对被解释变量“百户拥有家用汽车量”(Y)都有显著的影响。 (4)p值判断:与 对应的p值分别为:、、、,均,表明在小于,表明在显著水平=的水平下,对 应解释变量对被解释变量影响显著。 检验的依据: 1>可决系数越大,说明拟 合程度越好。 2>F的值与临界值比较, 若大于临界值,则否定原假设,回归方程是显著的;若小于临界值,则接受原假设,回归方程不显著。 3>t的值与临界值比较, 若大于临界值,则否定原假设,系数都是显著地;若小于临界值,则接受原假设,系数不显著。

第七章假设检验

第七 章 假设检验 一、教材说明 本章主要介绍统计假设检验的基本概念和基本思想、正态总体参数的统计假设的显著性检验方法.。 1、本章的教学目的与要求 (1)使学生了解假设检验的基本概念; (2)使学生了解假设检验的基本思想; (3)使学生掌握假设检验的基本步骤; (4)使学生会计算检验的两类错误,搞清楚两类错误的关系; (5)使学生掌握正态总体参数的假设检验,主要是检验统计量及其分布,检验拒绝域的 ? ),问题: 已知总体2 (,)X N μσ:,且00.015,σσ==根据样本值判断0.5μ=还是 0.5μ≠。 提出两个对立假设00:0.5H μμ==(原假设或零假设)和 10:H μμ≠(备择假设).再利用已知样本作出判断是接受假设0H ( 拒绝假设1H ) , 还是拒绝假设0H (接受假设 1H ). 如果作出的判断是接受0H , 则0μμ=即认为机器工作是正常的, 否则, 认为是不

正常的. 因为X 是μ的无偏估计量,所以,若0H 为真,则0μ-x ~(0,1)N , 衡量0μ-x X 的大小。于是可以选定一个适当的正数k ,当观察 值x X k ≥时,拒绝假设0H ;反之,当观察值x 满足 时k n X <-/0 σμ,接受假设 X 注:上述α称为显著性水平.此例表明假设检验的结论与选取的显著性水平α有密切的关系.所以,必须说明假设检验的结论是在怎样的显著水平α下作出的. 2.假设检验的基本思想及推理方法 1)假设检验基本思想 (1) 在假设检验中,提出要求检验的假设,称为原假设或零假设,记为0H ,原假设如 果不成立,就要接受另一个假设,这另一个假设称为备择假设或对立假设,记为1H 。 (2) 假设检验的依据——小概率原理:小概率事件在一次试验中实际上不会发生。 (3) 假设检验的思路是概率性质的反证法。即首先假设成立,然后根据一次抽样所得的

相关文档