第五章统计推断
5.1 统计假设有哪几种?它们的含义是什么?
答:有零假设和备择假设。零假设:假设抽出样本的那个总体之某个参数(如平均数)等于某一给定的值。备择假设:在拒绝零假设后可供选择的假设。
5.2小概率原理的含义是什么?它在统计假设检验中起什么作用?
答:小概率的事件,在一次试验中,几乎是不会发生的。若根据一定的假设条件,计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而否定假设。
小概率原理是显著性检验的基础,或者说显著性检验是在小概率原理的基础上建立起来的。
5.3什么情况下用双侧检验?什么情况下可用单侧检验?两种检验比较,哪一种检验的效率更高?为什么?
答:以总体平均数为例,在已知μ不可能小于μ
时,则备择假设为H A:
μ>μ0,这时为上尾单侧检验。在已知μ不可能大于μ0时,则备择假设为H A:μ<μ0,这时为下尾单侧检验。在没有关于μ不可能小于μ0或μ不可能大于μ0的任何信息的情况下,其备择假设为H A:μ≠μ0,这时为双侧检验。
两种检验比较,单侧检验效率更高,因为在单侧检验时,有一侧的信息是已知的,信息量大于双侧检验,因此效率高于双侧检验。
5.4显著性水平是一个指数还是一个特定的概率值?它与小概率原理有什
么关系?常用的显著水平有哪几个?
答:显著性水平是一个特定的概率值。在小概率原理的叙述中提到“若根据一定的假设条件,计算出来该事件发生的概率很小”,概率很小要有一个标准,这个标准就是显著水平。常用的显著水平有两个,5%和1%。
5.5为什么会产生I型错误?为什么会产生II型错误?两者的关系是什么?为了同时减少犯两种错误的概率,应采取什么措施?
答:在H0是真实的情况下,由于随机性,仍有一部分样本落在拒绝域内,
这时将拒绝H0,但这样的拒绝是错误的。即,如果假设是正确的,却错误地据绝了它,这时所犯的错误称为I型错误。
当μ≠μ
0,而等于其它的值(μ
1
)时,样本也有可能落在接受域内。当事
实上μ≠μ
0,但错误地接受了μ=μ
的假设,这时所犯的错误称为II型错误。
为了同时减少犯两种错误的概率,应当增加样本含量。
5.6统计推断的结论是接受H0,接受零假设是不是表明零假设一定是正确的?为什么?“接受零假设”的正确表述应当是什么?
答:统计推断是由样本统计量推断总体参数,推断的正确性是与样本的含量有关的。以对平均数的推断为例,当样本含量较少时,标准化的样本平均数u
值较小,很容易落在接受域内,一旦落在接受域内,所得结论将是接受H0。如果抽出样本的总体参数μ确实不等于μ
,当增加样本含量之后,这种差异总能被检验出来。因此接受H0并不表明H0一定是正确的。
接受H0的正确表述应当是:尚无足够的理由拒绝H0。尚无足够的理由拒绝
H
并不等于接受H0。
5.7配对比较法与成组比较法有何不同?在什么情况下使用配对法?如果
按成组法设计的实验,能不能把实验材料随机配对,而按配对法计算,为什么?
答:配对比较法:将独立获得的若干份实验材料各分成两部分或独立获得的若干对遗传上基本同质的个体,分别接受两种不同的处理;或者同一个实验对象
先后接受两种不同处理,比较不同的处理效应,这种安排称为配对实验设计。成组比较法:将独立获得的若干实验材料随机分成两组,分别接受不同的处理,这种安排称为成组比较法。在生物统计学中,只有遗传背景一致的成对材料才能使用配对比较法。如果按成组比较法设计的实验,不能把实验材料进行随机配对而按配对法计算。因为这种配对是无依据的,不同配对方式所得结果不同,其结果不能说明任何问题。
5.8如果一个配对实验设计,在处理数据时使用了成组法计算,后果是什么?
答:对于一个配对设计,在处理数据时按成组法计算,虽然不能认为是处理错误,但会明显降低处理的敏感性,降低了检验的效率。
5.9已知我国14岁的女学生,平均体重为43.38 kg。从该年龄的女学生中抽取10名运动员,其体重 (kg) 分别为:39、36、43、43、40、46、45、45、42、41。问这些运动员的平均体重与14岁的女学生平均体重差异是否显著?
答:H0:μ=μ0(43.38 kg)
H A :μ≠μ
正态性检验:
从正态概率图看,抽出样本的总体近似服从正态分布。
SAS程序为:
options linesize=76 nodate;
data girl;
input weight @@;
diff=weight-43.38;
cards;
39 36 43 43 40 46 45 45 42 41
;
run;
proc means n t prt ;
var diff;
title 'T-Test for Single Mean';
run;
结果见下表:
T-Test for Single Mean
Analysis Variable : DIFF
N T Prob>|T|
--------------------------
10 -1.4117283 0.1917
--------------------------
P>0.05,尚无足够的理由拒绝H
。
5.10以每天每千克体重52 μmol 5-羟色胺处理家兔14天后,对血液中血清素含量的影响如下表[9]:
y/(μg · L-1)s/(μg · L-1)n
检验5-羟色胺对血液中血清素含量的影响是否显著? 答:首先,假定总体近似服从正态分布(文献中没有给出)。 方差齐性检验的统计假设为:
21210σσσσ≠=::A H H
根据题意,本题之平均数差的显著性检验是双侧检验,统计假设为:
21210μμμμ≠=::A H H
程序如下:
options nodate; data common;
input n1 m1 s1 n2 m2 s2; dfa=n1-1; dfb=n2-1; vara=s1**2; varb=s2**2;
if vara>varb then F=vara/varb; else F=varb/vara;
if vara>varb then Futailp=1-probf(F,dfa,dfb); else Futailp=1-probf(F,dfb,dfa); df=n1+n2-2;
t=abs(m1-m2)/sqrt(((dfa*vara+dfb*varb)*(1/n1+1/n2))/df);
utailp=1-probt(t,df); k=vara/n1/(vara/n1+varb/n2); df0=1/(k**2/dfa+(1-K)**2/dfb);
t0=abs(m1-m2)/sqrt(vara/n1+varb/n2);
utailp0=1-probt(t0,df0);
f=f; Futailp=Futailp; df=df; t=t; tutailp=utailp; output;
df=df0; t=t0; tutailp=utailp0; output;
cards;
12 4.20 1.21 9 8.49 1.11
;
proc print;
id f;
var Futailp t df tutailp;
title 'T-Test for Non-Primal Data';
run;
结果如下:
T-Test for Non-Primal Data
F FUTAILP T DF TUTAILP
1.18830 0.41320 8.32277 19.0000 4.6339E-8
1.18830 0.41320 8.43110 18.1369 5.4346E-8
首先看F检验,方差齐性检验是双侧检验,当显著性概率P <0.025时拒绝H
,在这里P=0.41,因此方差具齐性。方差具齐性时的t检验,看第一行的结0
果,其上侧尾区的显著性概率P是一个非常小的值,远远小于0.005。因此拒绝H
,5-羟色胺对血液中血清素的含量有极显著的影响。
5.11以每天每千克体重52 mol 5-羟色胺处理家兔 14天后,体重变化如
下表[9]:
y /kg s /kg n
检验5-羟色胺对动物体重的影响是否显著?
答:首先,假定总体近似服从正态分布(文献中没有给出)。 方差齐性检验的统计假设为:
21210σσσσ≠=::A H H
根据题意,本例平均数差的显著性检验是双侧检验,统计假设为:
21210μμμμ≠=::A H H
程序不再给出,结果如下:
T-Test for Non-Primal Data
F FUTAILP T DF TUTAILP
1.49383 0.19477 0.78665 38.0000 0.21818 1.49383 0.19477 0.78665 36.5662 0.21828
方差齐性检验:P >0.025,方差具齐性。t 检验:上侧尾区显著性概率
P >0.025,因此,尚无足够的理由拒绝H 0,5-羟色胺对动物体重的影响不显著。
5.12 18岁汉族男青年与18岁维族男青年50米跑成绩(s )如下表[10]: 汉族:n =150 y =7.48 s =0.48 维族:n =100 y =7.41 s =0.69 问:(1)检验两者平均成绩差异是否显著?
(2)检验两个民族个体间成绩的整齐程度差异是否显著?
答:首先,假定总体近似服从正态分布(文献中没有给出),则方差齐性检验的统计假设为:
21210σσσσ≠=::A H H
根据题意,本例平均数差的显著性检验是双侧检验,统计假设为:
21210μμμμ≠=::A H H
结果如下:
T-Test for Non-Primal Data
F FUTAILP T DF TUTAILP
2.06641 .000029498 0.94606 248.000 0.17252 2.06641 .000029498 0.88213 161.981 0.18951
从结果中可以看出:(1)方差齐性检验表明,两者方差不具齐性。这也就
回答了第二问,两个民族个体间成绩的整齐程度差异显著。(2)由于方差不具齐性,应看结果的第二行。检验统计量t 的显著性概率P =0.189 51,P >0.025,结论是汉族和维族18岁男青年50米跑平均成绩差异不显著。
5.13一种内生真菌(Piriformospora indica ) 侵染大麦后,可以提高其产量。为此,做了以下试验对该假设进行检验,所得结果如下表[11]:
y /-1s /(g · pot -1
) n
检验侵染组与未侵染组的产量差异是否显著?
答:首先,假定总体近似服从正态分布(文献中没有给出),则方差齐性检验的统计假设为:
21210σσσσ≠=::A H H
根据题意,本例平均数差的显著性检验是双侧检验,统计假设为:
21210μμμμ≠=::A H H
结果如下:
T-Test for Non-Primal Data
F FUTAILP T DF TUTAILP
4.35434 0.066115 3.67137 10.0000 .0021537 4.35434 0.066115 3.67137 7.1815 .0038003
统计量F 的显著性概率P =0.066 115,P >0.025,结论是方差具齐性。在方差具齐性时,t 检验使用第一行的结果。统计量t 的显著性概率P =0.002 153 7,P <0.005。因此,侵染组与未侵染组的产量差异极显著。
5.14在一项关于乳房X 线照片计算机协助诊断(computer-aided diagnosis ,CAD )的研究中,得到下表中的结果[12]:
由10名放射学医生对乳房X 线照片采用三种读片方式所得到的)
90.0(Z
A 的值
医生编号 独立阅读
这是一项配对设计,在三种读片方式中两两比较它们的差异显著性。
答:
00≠=d A d H H μμ::
(1)独立阅读与不用CAD 连续阅读间的差异显著性检验。
所用程序如下:
data sorty;
input y1 y2 @@;
y=y1-y2;
cards;
0.13 0.22 0.41 0.35 0.17 0.30 0.46 0.45 0.20 0.24 0.48 0.22 0.52 0.43 0.54 0.49 0.15 0.06 0.22 0.17 ;
proc sort;
by y;
data norm;
n=10;
do i=1 to n by 1;
p=(i-1/3)/(n+1/3);
u=probit(p);
output ;
end;
data combine;
merge sorty norm ;
symbol v=star;
proc gplot;
plot y*u;
run;
proc means n mean stderr t prt;
var y;
title1 'Paired T-Test';
title2 'Read Independently - Read without CAD';
run;
在该程序中,第一个PROC语句是排序过程,第二个PROC语句是制图过程,第三个PROC语句是MEANS过程。GPLOT过程用来检验总体的正态性,MEANS过程用来做t检验。结果如下:
Paired T-Test
Read Independently - Read without CAD
Analysis Variable : Y
N Mean Std Error T Prob>|T|
------------------------------------------------------
10 0.0350000 0.0344561 1.0157856 0.3363
------------------------------------------------------
正态概率图中的散点虽然不甚集中,但趋势仍然是一条直线,可以认为是近似正态分布的。统计量t的显著性概率P=0.336 3,P>0.05。因此,独立读片和不用CAD连续读片的结果差异不显著。
(2)独立阅读与借助CAD连续阅读间的差异显著性检验。
所用程序与(1)基本上是一样的,这里不再给出,只给出结果:
Paired T-Test
Read Independently - Read with CAD
Analysis Variable : Y
N Mean Std Error T Prob>|T|
------------------------------------------------------
10 -0.1100000 0.0621110 -1.7710225 0.1103
------------------------------------------------------ 差数的正态性检验表明,差数近似服从正态分布。统计量t的显著性概率P=0.110 3,P >0.05。结论是尚无足够的理由拒绝H
。因此,独立读片与借助
CAD连续读片间的差异不显著。
(3)不用CAD连续阅读与借助CAD连续阅读间的差异显著性检验。
Paired T-Test
Read without CAD - Read with CAD
Analysis Variable : Y
N Mean Std Error T Prob>|T|
------------------------------------------------------
10 -0.1450000 0.0427720 -3.3900678 0.0080
------------------------------------------------------正态性的条件基本可以满足,t的显著性概率P=0.008 0,P<0.01。结论是不用CAD读片与借助CAD读片间的差异极显著。
5.15用内生真菌(Piriformospora indica) 侵染大麦,播种三周后在植株的根和叶中谷胱甘肽的含量(nmol/g)如下表[11]:
在根中
y s n
在叶中
y s n
分别比较在根中和在叶中谷胱甘肽含量的提高是否显著。
答:对照组命名为“1”,处理组命名为“2”,并假定总体近似服从正态分布(文献中没有给出)。
方差齐性检验的统计假设为:
21210σσσσ≠=::A H H
根据题意,本例平均数差的显著性检验是单侧检验,统计假设为:
21210μμμμ<=::A H H
所用程序与5.10题基本一致,这里不再给出。程序运行结果如下: (1)在根中:
T-Test for Non-Primal Data
F FUTAILP T DF TUTAILP
1.13469 0.46845
2.21633 4.00000 0.045492 1.13469 0.46845 2.21633
3.98414 0.045626
统计量F 的显著性概率P =0.468 45,P >0.025,方差具齐性。统计量t
的显著性概率P =0.045 492,P <0.05。结论是拒绝H 0。在根中,谷胱甘肽含量的提高是显著的。
(2)在叶中:
T-Test for Non-Primal Data
F FUTAILP T DF TUTAILP
4.37894 0.18591 3.98301 4.00000 0.008180 4.37894 0.18591 3.98301 2.86819 0.015382
统计量F 的显著性概率P =0.185 91,P >0.025,方差具齐性。统计量t 的显著性概率P =0.008 180,P <0.01。结论是拒绝H 0。在根中,谷胱甘肽含量的提高是极显著的。
5.16在SARS 常规治疗的基础上,附加两种中草药配方,研究它们对治疗的辅助作用。一种是汤剂(NHM A ),另一种是在台湾常用的保健品(NHM B )。将患者分成3组,A 组接受NHM A ,B 组接受NHM B ,C 组接受安慰剂。记录病程改
善的天数,结果如下表[13]
:
y /d s /d n
推断两种中草药对SARS 症状的改善是否有辅助作用?
答:处理组命名为“1”,对照组命名为“2”。并假定总体近似服从正态分布(文献中没有给出)。
方差齐性检验的统计假设为:
21210σσσσ≠=::A H H
根据题意,本例平均数差的显著性检验是单侧检验,统计假设为:
21210μμμμ<=::A H H
所用程序与5.10题基本一致,这里不再给出。程序运行结果如下: (1)A 组与对照组比较:
T-Test for Non-Primal Data
Group A - Control
F FUTAILP T DF TUTAILP
7.41049 .0048427 2.59576 17.0000 .0094223
7.41049 .0048427 2.70819 11.6076 .0097563
方差齐性检验的结果表明,两者的方差不具齐性,应使用上表中的第二行结果,方差不具齐性时的t检验。t=2.708 19,df=11.607 6,t的显著性概率P=0.009 756 3,P<0.01,结论是拒绝H
,A组药物对改善病程有极显著的作用。(2)B组与对照组比较:
T-Test for Non-Primal Data
Group B - Control
F FUTAILP T DF TUTAILP
1.44981 0.29496 0.80702 17.0000 0.21540
1.44981 0.29496 0.79880 15.6533 0.21818
方差齐性检验指出,方差具齐性。t=0.807 02,df=17,t的显著性概率P=0.215 40,P >0.05。结论是尚无足够的理由拒绝H0。因此,B组药物对改善病程的效果不显著。
5.17一项为促进肺癌筛查的非专业健康顾问培训项目,共有79名不同背景的人员参加。培训结束后,她(他)们对培训手册中的各项内容进行了评价,有46人认为手册中所提供的信息非常有用,34人认为手册中的家庭作业非常有用[14]。请检验培训人员对这两项内容的评价差异是否显著?
答:
H 0:φ
1
=φ
2
H
A :φ
1
≠φ
2
所用程序如下:
options nodate;
data binomial;
input n1 y1 n2 y2;
mp=(y1+y2)/(n1+n2);
u=(abs(y1-y2)-0.5-mp*abs(n1-n2))/sqrt(mp*(1-mp)*(n1+n2));
utailp=1-probnorm(u);
keep u utailp;
cards;
79 46 79 34
;
proc print;
id u;
var utailp;
title 'Significance Test for Binomial Data';
run;
结果见下表:
Significance Test for Binomial Data
U UTAILP
1.82993 0.033630
本例为双侧检验,当显著性概率P <0.025时拒绝H0,统计量u的显著性概率P =0.033 63,P >0.025。因此,尚无足够的理由拒绝H0,培训人员对这两项的评价无显著性差异。
5.18加入抗生素后的几个小时内,多形核白细胞迅速地提高了对Borrelia 螺旋体的吞噬速度,在此期间血浆中螺旋体的总数明显减少。设计一实验:将被Borrelia螺旋体感染的血液,放在37℃培养两小时。在此期间,吞噬细胞不断地增加。如果在被感染的血液中添加青霉素G和四环素可促进吞噬细胞进一步地增加。以下是在感染的血液中分别添加青霉素G、四环素和不添加抗生素的三个处理,在培育两小时后多形核白细胞的个数[15]:
处理
y s n
检验添加抗生素是否显著提高多形核白细胞的数量?
答:首先,假定总体近似服从正态分布(文献中没有给出)。 方差齐性检验的统计假设为:
21210σσσσ≠=::A H H
根据题意,本题之平均数差的显著性检验是单侧检验,统计假设为:
21210μμμμ>=::A H H
(1)添加青霉素G 组(组1)与对照组(组2)间的比较:
T-Test for Non-Primal Data Penicillin G - Control
F FUTAILP T DF TUTAILP
17.1633 0 63.6881 198.000 0 17.1633 0 63.6881 110.497 0
从结果中可以看出,显然方差不具齐性。此时的df =110.497,P 值为0,结论
是添加青霉素G 后,极显著地提高了多形核白细胞的数量。 (2)添加四环素组(组1)与对照组(组2)间的比较:
T-Test for Non-Primal Data Tetracycline - Control
F FUTAILP T DF TUTAILP
1.99881 .00033282 27.8776 198.000 0 1.99881 .00033282 27.8776 178.228 0
方差不具齐性,应使用方差不具齐性的t 检验。统计量t 的显著性概率P =0,拒绝H 0。说明添加四环素后,极显著地提高了多形核白细胞地数量。
5.19用免疫抑制药物单独或配伍处理被单纯疱疹病毒感染的小鼠,以下是用免疫抑制药物CTS 和CTS+ATS 处理小鼠,其红斑持续的天数[16]:
处理 y /d s /d n
注:CTS :cellophane tape stripping ,透明胶带剥离。
推断两种不同处理,在红斑持续天数上的效应差异是否显著? 答:首先,假定总体近似服从正态分布(文献中没有给出)。 方差齐性检验的统计假设为:
21210σσσσ≠=::A H H
根据题意,本题之平均数差的显著性检验是双侧检验,统计假设为:
21210μμμμ≠=::A H H
程序前面已经给过,这里不再给出,只给出结果。
T-Test for Non-Primal Data
F FUTAILP T DF TUTAILP
3.72403 .00000018902
4.63436 123.000 .000004492 3.72403 .00000018902 4.24119 72.514 .000032349
首先,可以判断出方差不具齐性。这时的t =4.241 99,df =72.514,检
验统计量t 的显著性概率P =0.000 032 349,远远小于0.005,拒绝H 0。结论是:CTS 单独使用与CTS+ATS 混合使用,在红斑持续天数上的差异极显著。
5.20一项关于手术后患者药物直接从小肠吸收的研究,得到下表中的结果[17]
(节录的一部分):
药物代谢动力学参数:口服庆大霉素80 mg 后的C max 和MRT 受试者 C max /
(μg · mL -1*)
MRT ** / min
手术前 手术
手术前 手术后 注:*C max :maximum plasma concentration achieved (达到的最大血浆浓度)。
**MRT :mean residence time (平均残留时间)。
答:
00≠=d A H H μμ::
(1)检验C max :
因数据无法进行正态性变换,需用非参数统计。这里从略。 (2)检验MRT :
数据严重偏离正态性,无法进行正态性变换,需用非参数统计。这里从略。
(注:遇到这种情况应分析造成严重偏离正态性的原因。是整个趋势?还是个别数据?如果是个别数据,还要从生物学角度分析出现这种情况的原因。)