文档库 最新最全的文档下载
当前位置:文档库 › 生物统计学3

生物统计学3

生物统计学3
生物统计学3

第六章 方差分析

引言

在第四、五章中,学习了单样本与总体或两样本间平均数的显著性检验。然而,在生物学研究中,常收集到多样本的数据,对这些多样本间平均数差异的统计分析方法即为方差分析(多样本分析)。方差分析不仅能够分析单因素多水平(处理)效应值间平均数的差异,还能同时分析两个因素、多个因素多水平间平均数的差异,以及各因素间的交互作用。

方差分析是对多因素总体作用的检验,各因素内水平间一对一的比较方法是多重比较。在方差分析检验差异显著的前提下,进行多重比较的分析。本章仅对单因素和两因素方差分析,以及多重比较进行介绍。

学习目标

1.辨析概念:固定因素和随机因素;固定模型、随机模型和混合模型。 2.掌握适于进行方差分析的不同类型生命科学数据。 3.理解不同方差分析模型计算过程的异同。

4.在方差分析中,固定因素和随机因素在对统计结果进行解释时的不同。 5.掌握方差分析的基本步骤。

6.了解多重比较的前提条件,掌握常用比较方法。

第六章 方差分析

方差分析又叫变量分析,它是对多个样本平均数差异显著性检验的一种引伸。在对多个样本进行比较时,如果用t 检验就会产生较大的误差,提高了犯α错误的概率。例如我们用t 检验一对一比较的方法检验4个样本平均数之间的差异显著性,就需要做62

4=C 次检验,每次无效假设的概率都是l 一α=0.95,而且这些检验都是独立的,那么6次都接受的概率是(0.95)6

=0.735,犯α错误的概率为1—0.735=0.265,

即6次犯错误可能性的累积,因此所犯错误的概率大大增加,使用方差分析就可以避免这一问题。方差分析是对各因素总体处理效应的显著性检验。

第一节 方差分析的基本原理

方差亦称均方,是标准差的平方,是表示变异的量。在一个多处理试验中,可以得到多组不同的观测值。各组观测值不同的原因可以分为两大类,一类是因素处理的不同引起的,叫处理效应或条件变异,另一类是试验过程中偶然性因素的干扰和测量误差所致,称为误差或试验误差。方差分析的基本思想是将测量数据的总变异按照变异原因不同分解为处理效应和试验误差,并作出其数量估计。

通过方差比较以确定两种原因在总变异中所占的重要程度,如果处理效应和试验误差相差不大,说明试验处理对指标影响不大,如二者相差较大,处理效应比试验误差大得多,说明试验处理影响是很大的,不可忽视。方差分析的用途非常广泛,可用于多个样本平均数的比较、分析多个因素间的交互作用、回归方程的假设检验、方差的同质性检验等。本章主要介绍多个样本平均数的比较,并对两个因素间的交互作用进行分析。 一、数学模型

假定有k 组观测数据,每组有n 个观测值,则用线性可加模型来描述各观测值,有:

ij i ij x ετμ++=

式中,ij x 是在第i 次处理下的第j 次观测值,μ为总体平均数,i τ为处理效应,ij ε是试验误差,要求ij ε是相互独立的,且服从正态分布),0(2σN 。

对于由样本估计的线性模型为:ij i ij e t x x ++= 式中,x 为样本平均数,i t 为样本的处理效应,ij e 为试验误差。

依据对i τ的不同假定,即试验因素的性质和作用不同,将方差分析数学模型分为固定模型和随机模型。 (一)固定模型

所谓固定模型是指各个处理的效应值i τ是固定的,各个处理的平均效应μμτ-=i i 是一个常量,且

∑=0i

τ

。在试验中,我们只能讨论参加试验的个体而不是随机选择的样本,就是说除去随机误差之后每

个处理所产生的效应是固定的。实际上试验因素的各水平常常是根据试验目的,事先主观选定的而不是随机选定的。例如几种不同温度下小麦的发芽情况,不同月龄小白鼠抗药性的测定等。在这些试验中处理的水平是特意选择的,得到的结论只适合于方差分析中所考虑的那几个水平,上述的温度、月龄等因素称为固定因素,固定因素是指因素的水平可以严格地人为控制,水平固定后它的效应值也是固定的,试验重复时可以得到相同的结果。对单个或多个固定因素作用的方差分析应采用固定模型,在生产实践和科学实验中有很多这样的情况。 (二)随机模型

随机模型是指各处理的效应值i τ不是固定的数值,而是由随机因素所引起的效应。这里i τ是一个随机变量,是从期望均值为0,方差为2

σ的正态总体中得到的随机变量。得出的结论可以推广到多个随机因素的所有水平上。试验中随机因素的各水平是从总体全部水平中随机抽取的样本,水平不能严格人为控制,在水平确定之后其效应值并不固定,重复试验时也很难得出相同的结果。这类试验通过样本对所属总体作出推断时应采用随机模型,例如在研究动物体重对生长率,或土壤对植物生长的影响时,体重、土壤条件是无法人为控制的,均要用随机模型来处理。

(三)混合模型

在多因素试验中,若既有固定因素,又有随机因素存在时,方差分析则采用混合模型进行统计计算。 由于固定模型、随机模型和混合模型在设计思想和统计推断上有明显不同,因此进行方差分析时的公式推导也有所不同。所推导的平方和及自由度的分解公式没有区别,但在进行统计推断时假设检验构成的统计数是不同的。另外,模型分析的侧重点也不完全相同,方差期望值也不一样。固定模型主要侧重于效应值的估计和比较,而随机模型则侧重效应方差的估计和检验。因此在进行分析及试验设计之前就要明确关于模型的基本假设。

对于单因素方差分析来说,固定模型和随机模型统计方法完全相同,只是在根据统计数作推论时有所不同。

二、统计假设的显著性检验——F 检验

设试验A 具有k 个处理样本,每个样本有n 个观测值,则试验A 共有nk 个观测值,其样本资料可用

表7-1来表示。

从第二章可知,方差是离均差平方和除以自由度的商,对于总体:N

x ∑-=

2

2

)

(μσ

对于样本:1

)(2

2

--=

n x x s ;因此,要把一个试验的总变异依据变异来源分为相应的变异,首先要将总

平方和和总自由度分解为各个变异来源的相应部分。

方差分析的步骤:

同t 检验相同,方差分析首先也要作假设,无效假设把各个处理的变量假设来自同一总体,即处理间

方差不存在处理效应,只有误差的影响,因而处理间的样本方差2A σ与误差的样本方差2

e σ相等,即

22

0:e A H σσ=,22:e A

A H σσ≠。还要确定显著水平α。 (一)平方和的计算

从方差分析的基本指导思想出发,引起观测值出现变异的原因有处理效应和试验误

差。处理间平均数的差异由处理的效应所致;同一处理内的变异则由随机误差引起,根据线性可加数学模型,则有:

总平方和 ∑∑∑-=-=k

n

T kn T x x x SS 11

2

2

2

)(

令矫正数kn

T C 2=, 则C x SS T -=∑2

处理间平方和 ∑∑-=-=k

k i i A C T n x x n SS 1

12

2

1)(

处理内平方和 A T i k n

i e SS SS T n

x x x SS -=-

=-=

∑∑∑∑221

1

21

)(

(二)自由度的计算

总自由度:1-=nk df T 处理间自由度:1-=k df A

处理内自由度:)1()1()1(-=---=-=n k k nk df df df A T e (三)方差(均方)

处理间:A

A

A df SS MS = 处理内:e

e

e d

f SS MS =

(四)显著性检验——F 检验

上面的处理(水平)内方差可以作为误差方差的估计量,而水平间方差则作为水平差异的估计量,为比较不同水平间效应值有无差别,要应用F 分布进行F 检验。

从第四章已知,从一个总体随机抽取两个样本,其样本方差1MS 和2MS 的比值为F ,即:2

1

MS MS F =

其F 分布曲线随1df 和2df 的变化而变化。由于F 值表是一尾表,一般将大方差作分子,小方差作分母,使F 值大于1,因此,表上的1df 代表大方差自由度,2df 代表小方差自由度。进行不同处理差异显著性的F 检验时,一般是把处理间方差作为分子,称为大方差,误差方差作分母,称为小方差。无效假设是否成立,决定于计算的F 值在F 分布中出现的概率。F 值为:

e

A

MS MS F =

然后根据确定的显著水平α从F 值表中查出在A df 和e df 下的αF 值。如果所计算的αF F <,α>P ,则接受0H ,说明处理间差异不显著,若αF F ≥,α≤P ,则接受A H ;应否定0H 。说明处理间差异是显著的(05.0≤P )或差异达到极显著水平(01.0≤P ),并分别在计算的F 值的右上角标上一个或两个“*”号;如果处理间方差小于误差方差,则可不必进行检验,即可作出接受0H 结论。

第二节 单因素方差分析

在试验中所考虑的因素只有一个时,称为单因素实验。单因素方差分析是方差分析中最简单的一种。单因素方差分析依组内观测数目不同而分为两种情况。

一、组内观测次数相等的方差分析

这是在k 组处理中,每一处理皆含有n 个观测值,其方差分析的基本方法前面已做介绍,这里以一实例,说明单因素方差分析的计算过程。

例6.1 在实验室内有多种方法可以测定生物样品中的磷含量,为研究各种测定方法之间是否存在差异,随机选择四种方法,测定同一干草样品的磷含量,结果如表7.2。

试分析不同方法之间差异是否显著。

(一)假设:0H :各种测定方法之间没有显著差异;

A H :各种测定方法之间有显著差异。

(二)显著水平:05.0=α (三)统计量计算:

矫正数 252055

47102

2=?==

kn T C 总平方和 2925205)353634(2222

=-+++=-=

∑ C x

SS T

处理间平方和 925205)176137(5

11222

=-++?=-=

∑ C T n SS i

A 处理内平方和 20929=-=-=A T e SS SS SS 总自由度:191451=-?=-=nk df T 处理间自由度:3141=-=-=k df A

处理内自由度:161541(=-?=-=-=)()n k df df df A T e 处理间均方:33

9

===A A A df SS MS 处理内均方:25.116

20

===

e e e d

f SS MS F 值为:40.225

.13

===

e A MS MS F 查附表? 24.305.0163=;,F ;05.0;05.0>

(五)结论:所有测定方法间没有显著差异。

采用统计软件来进行方差分析:

1. 打开程序:开始—程序—STATISTICA—STATISTICA,出现模块转换对话框,选其中的ANAVA/MANOVA,击Switch To按钮。

2. 建如下图的数据库,在Analysis中选Resume analysis,在对话框中点Variables,选取自变量(处理因素)和因变量(效应值),由于方法是随机选取的,所以,点Random factors,将方法项定为随机因子,点OK。

在结果中可以看到,这是单因素方差分析,因素是随机的。点All effects 可得方差分析的结果,同手工计算的相同。

二、组内观测次数不相等的方差分析

有时由于试验条件的限制,不同处理的观测次数不同,是个处理的观测次数依次是

k n n n 、、、 21的

单因素分组资料,上面所述的方差分析方法仍然可用,但由于总观测次数不是kn ,而是∑=k

i i

n

1

次,在计算

平方和时公式稍有改变。

处理间平方和 ∑-=C n T SS i

i A 2

总自由度:1-=

∑i

T n

df

处理内自由度:k n

df i

e -=

其它计算公式与组内观测次数相等的方差分析完全相同。

例6.2 体重相近的19头猪被随机分为四组,各组以不同饲料饲喂三个月后,测得各头猪的增重(kg ),如表6.3,试对饲料的作用进行方差分析。

1. 假设:0H :4321μμμμ===;

A H :四种饲料对猪的增重作用不同。

2. 显著水平:05.0=α

表6.3 不同饲料猪的增重(kg )

3. 统计量计算:

202.11562719

84

.2196916192.148222====N T C 698

.4354202.115627900.119981202

.115627)3.900.578.60(2222

=-=-+++=-=∑ C x SS ij T

348

.4226202.115627550.119853202

.115627)52.43151.303(2

22=-=-++=-=∑ C n T SS i i A 350.128348.4226698.4354=-=-=A T e SS SS SS

181191=-=-=∑i T n df 3141=-=-=k df A

15419=-=-=∑k n df i e 783.14083348

.4226===A A A df SS MS 557.815

350

.128===e e e df SS MS 165557

.8783.1408===

e A MS MS F 查附表? 29.305.0153=;,F ;05.0;05.0<>P F F 4. 推断:拒绝0H ,接受 A H 。

5. 结论:四种饲料对猪增重的影响差异显著。

计算过程同例6.1完全一致,只是本例的处理为固定因素,所以在选项框中不要选Random factors 。计算结果见下一个表。

第三节两因素方差分析

在实际工作中经常会遇到两种因素共同影响试验结果的情况。在两因素试验中,当两因素都是固定因素时称为固定模型;两因素均为随机因素时,称为随机模型;一个因素是固定因素另一个因素是随机因素时,称为混合模型。在计算方法上三种模型类似,但在对待检验及结果解释时却不同。

各试验因素的相对独立作用称为该因素的主效应。某一因素在另一因素的不同水平上所产生的效应不同,则两因素间存在交互作用。因素间的交互作用显著与否关系到主效应的利用价值,若交互作用不显著,则各因素的效应可以累加,各因素的最优水平组合起来,即为最优的处理组合。若交互作用显著,则各因素的效应不能累加,最优处理组合的选定应根据各处理组合的直接表现选定。有时交互作用相当大,甚至可以忽略主效应。两因素间是否存在交互作用有专门的统计判断方法,一般情况下,也可根据专业知识判断。

一、无重复观测值的二因素方差分析

依据经验或专业知识,判断两因素无交互作用时,每个处理可只设一个观测值,即假定A因素有a个水平,B因素b有个水平,每个处理组合只有1个观测值。这种无重复观测值的两因素分组资料模式如表7.4。

若因素间不存在交互作用,观测值的线性模型是:ij j i ij x εβαμ+++=

上式中i α和j β是A 因素和B 因素的效应(其中i =1,2,…,a; j=1,2,…,b),可以是固定的,也可以是随机的,且

∑∑==0j

i

β

α。ij ε是随机误差,彼此独立且服从),0(2σN 。

(一)平方和的分解为:

矫正数 ab

T C 2

=,

总平方和 ∑∑∑-=-=

a b

ij

T C x x x

SS 1

1

22)(

A 因素处理间平方和 ∑∑-=-=a

a i i A C T

b x x b SS 1

12

.2

.1)(

B 因素处理间平方和 ∑∑-=-=b

b j j B C T a x x a SS 1

12.2

.1)(

误差平方和 B A T a

b

j i ij e SS SS SS x x x x SS --=+--=∑∑1

12

..)( (二)自由度的计算

总自由度:1-=ab df T

A 因素处理间自由度:1-=a df A

B 因素处理间自由度:1-=b df B 处理内自由度:)1)(1(--=b a df e (三)方差(均方)

A A

A df SS MS = B

B

B df SS MS =

e

e

e d

f SS MS = e A

A MS MS F = e

B

B MS MS F =

下面举例来说明其详细分析方法。

例6.3 以五种不同浓度的生长激素溶液浸渍某种大豆种子,浸渍的时间有三种,出苗45天后得各处理每一植株的平均干物重(g )。试作方差分析与多重比较。

表6.5 激素处理对大豆干物重的影响

本例的研究目的是了解激素和时间的效应,故i α和j β为固定因素适应于固定模型。方差分析如下:

1.平方和计算:

27.10753

51272

2=?==ab T C ,

73.29527.1075414132222=-+++=-=∑ C x SS T 06.28927.1075)113741(31

122212.=-+++?=-=∑ C T b SS a i A

73.127.1075)444340(5

1

122212.=-+++?=-=∑ C T a SS b j B

94.473.106.28973.295=--=--=B A T e SS SS SS SS

2.自由度的计算

141351=-?=-=ab df T

4151=-=-=a df A 2131=-=-=b df B

8)13()15()1)(1(=-?-=--=b a df e

3.列出方差分析表,并进行F 检验:

F 检验结果表明,浓度间的F 值大于01.0F 。不同时间之间的F 值小于05.0F 。表明

不同激素浓度对大豆干物重有极显著差异,不同浸渍时间对大豆干物重的影响未达显著水平。

表6.6 激素处理对大豆干物重影响的方差分析

二、具有重复观测值的两因素方差分析

以上调查资料是两因素的作用结果,所估计的误差实际上是这两个因素的相互作用,这是在两个因素不存在互作,或互作很小的情况下进行估计的。但是,如果存在两个因素互作,方差分析中就不能用互作来估计误差,必须在有重复观测值的情况下对试验误差进行估计。具有重复观测值的两因素试验的典型设计是:假定A 因素有a 个水平,B 因素有b 个水平,则每一次重复包括ab 次实验,设试验重复n 次,资料模式如表7.7。

表6.7 具有重复观测值的两因素方差分析分组资料

两因素具有重复观测值的方差分析可用下面线性模型来描述:

ijk ij j i ijk x εαββαμ++++=)(

上式中,ijk x 表示A 因素第i 个水平,B 因素第j 个水平和第k 次重复的观测值(其中

n k b j a i ,,2,1;,,2,1;,,2,1 ===)

;μ为总平均值;i α是A 因素第i 水平的效应值,j β是B 因素第j 水平的效应值,ij )(αβ是i α和j β的交互作用,且有∑∑∑===ijk ij j

i

εαββ

α,0)(是随机误差,

彼此独立,且服从),0(2σN 。

因试验共有n 次重复,试验的总次数为abn 次。方差分析步骤和前面介绍的相类似,唯一不同的是F 检验的方法。

(一)平方和的分解为:

矫正数 abn

T C 2

=,

总平方和 ∑∑∑∑-=-=

a b n

ijk

T C x x x

SS 1

1

21

2)(

A 因素处理间平方和 ∑∑-=-=a

a i i A C T bn x x bn SS 11

2

..2

..1)( B 因素处理间平方和 ∑∑-=-=b

b j j B C T an x x an SS 11

2..2

..1)( 交互作用 B A ij a b

j i ij AB SS SS C T n x x x x n SS ---=+--=∑∑∑2.11

2 (1)

).(

误差平方和 AB B A T a b n

ij ijk

e SS SS SS SS x x

SS ---=-=∑∑∑1

1

1

2.)(

(二)自由度的分解

总自由度:1-=abn df T A 因素处理间自由度:1-=a df A B 因素处理间自由度:1-=b df B 交互作用 )1)(1(--=b a df AB 处理内自由度:)1(-=n ab df e (三)方差(均方)

A A

A df SS MS =

B B

B df SS MS =

AB AB

AB df SS MS =

e

e

e d

f SS MS =

(四)F 检验:

1.固定模型:在固定模型中,ij j i )(αββα及,均为固定效应,在F 检验时,A 因素、B 因素和B A ?互作项均以e MS 作为分母。

2.随机模型:对于随机模型,ij j i )(αββα、、和ijk ε是相互独立的随机变量,都遵从正态分布。检验因素A 和B 时不同于固定模型。

AB

A

A MS MS F =

AB B

B MS MS F =

e

AB

AB MS MS F =

3.混合模型(以A 为固定因素、B 为随机因素为例):在混合模型中,A 和B 的效应为非可加性,i α为固定效应, ij j )(αββ及均随机效应。对A 作检验时同随机模型,对B 和B A ?作检验时同固定模型,即

AB A

A MS MS F =

e B

B MS MS F =

e

AB

AB MS MS F =

例6.4 研究激素对不同性别鸟类血浆中钙浓度(mg/100ml )的影响,实验结果列于表6.8中,试作方差分析。

表6.8 不同处理和性别鸟类血浆中的钙浓度

本例中,由于激素处理与否和性别都是人为控制的,为固定因素,可依固定模型分析。

6125.95265

225.4362

2=??==abn T C

6975.18276125.9526)3.294.185.16(2222=-+++=-=∑ C x SS T 3125.706125.9526525.1990.23712212..=-?+=-=∑C T bn SS a i A

1125.13866125.9526525.3010.13512

212..=-?+=

-=∑C T an SS b j B 9005

.41125.1383125.706125.9526)92.1384.74(5

1

1

222.=---++?=---=

∑ B A ij AB SS SS C T n

SS 3720

.3669005.41125.13863125.706975.1827=---=---=AB

B A T e SS SS SS SS SS

1912015221=-=-??=-=abn df T

1121=-=-=a df A 1121=-=-=b df B

1)12()12()1)(1(=-?-=--=b a df AB

16)15(22)1(=-??=-=n ab df e

3125.7013125

.70===A A A df SS MS

1125.138611125

.1386===

B B B df SS MS 9005.41

9005

.4===AB AB AB df SS MS 8982.2216

3720.366===e e e df SS MS 07.38982.223125.70===e A A MS MS F 5.608982

.221125

.1386===

e B B MS MS F

214.08982

.229005

.4===

e AB AB MS MS F 将以上结果列入方差分析表。可以看出,不同性别鸟类血浆中的钙浓度差异不显著,激素对鸟类血浆中的钙浓度的影响达到极显著水平,即鸟类血浆中的钙浓度主要决定于激素处理,而与两者之间的交互作用关系不大。

表6.9不同处理和性别鸟类血浆中的钙浓度方差分析计算表

计算过程同单因素的基本一致,数据库的制作如下表所示,在选项框中选自变量时将两个都选中。

在结果对话框中可以看到,这是2因素方差分析,两因素都是固定的。点All effects

可得方差分析的结果,同手工计算的相同。

例6.5 在啤酒生产中,为了研究烘烤方式(A)与大麦水分(B)对糖化时间的影响,选了两种烘烤方式,四种水分共8种处理,每一处理重复3次,结果如表7.11。

大麦水分是不均匀的,又不易控制,所以因素B是随机的,它的效应也是随机的。由此可见,本题是一个混合模型的方差分析。

表6.10 不同烘烤方式及水分的糖化时间

将上表中各观测值都减10,计算后列于表6.11中。

表6.11 糖化时间数据转换表

平方和与自由度的分解:

26.3413

425.902

2=??==abn T C

99.36326.341]5.7)5.0(0.2[2222=-++-+=-=∑ C x SS T 51.526.341)5.390.51(3

4112212..

=-+??=-=∑C T bn SS a i A 865.22826.341]5.4214)5.3[(321122212.

.=-+++-??=-=∑ C T an SS b j B 615.107865.22851.526.341]5.180.25.9[3

1

1

2222.=---+++?=---=

∑ B A ij AB SS SS C T n

SS

00

.22615.107865.22851.599.363=---=---=AB

B A T e SS SS SS SS SS

2313421=-??=-=abn df T 1121=-=-=a df A

3141=-=-=b df B

3)14()12()1)(1(=-?-=--=b a df AB

16)13(42)1(=-??=-=n ab df e

51.5151

.5===A A A df SS MS 288.763865

.228===

B B B df SS MS 872.353

615

.107===AB AB AB df SS MS 375.116

00.22===e e e df SS MS 154.0872.3551

.5===AB A A MS MS F

482.55375.1288

.76===

e B B MS MS F 089.26375

.1872

.35===

e AB AB MS MS F 列出方差分析表并进行F 检验(表6.12)

表6.12 糖化时间方差分析表

从上面结果可以看出大麦中的水分及水分与烘烤方式之间的互作对糖化时间的影响.达到了极显著水平,而烘烤方式对糖化时间的作用则不显著。在生产中就应注意大麦的含水量及根据含水量来选择合适的烘烤方式。

计算过程同上例完全一致,只是本例的水分处理为随机因素,所以在选项框中要选Random factors ,只将水分项设为随机因素。

从结果表中可见这是一个2因素方差分析,混合模型,水分为随机的。

第四节 多重比较

无论是单因素、两因素,还是多因素方差分析,一旦某因素的检验结果拒绝了零假设,该因素对效应值有显著影响时,并不等于该因素所有k 个水平的平均数之间都存在显著差异。我们既不知道各水平间差异有多大,也不知道是哪一对之间有差异。例如3=k 时,零假设(321μμμ==)被拒绝时,我们并

不知道该接受以下哪一种备择假设:32

1

μμμ=≠,321μμμ≠=,或321μμμ≠≠。要明确

生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 122 --∑∑n n x x )(

2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 三 填空 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 n /σx σ

生物统计学试题及答案

生物统计学考试 一.判断题(每题2分,共10分) √1. 分组时,组距和组数成反比。 ×2. 粮食总产量属于离散型数据。 ×3. 样本标准差的数学期望是总体标准差。 ×4. F分布的概率密度曲线是对称曲线。 √5. 在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 二. 选择题(每题3分,共15分) 6.x~N(1,9),x1,x2,…,x9是X的样本,则有() x N(0,1)B.11 - x ~N(0,1)C.91 - x ~N(0,1)D.以上答案均不正确 7. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计 算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 D.不能确定大小 8. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。 若想对完成工作所需时间总体构造一个90%置信区间,则() u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 9. 1-α是() A.置信限 B.置信区间 C.置信距 10. 如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为 ( )。 B. t检验 C. F检验 D. u检验 三. 填空题(每题3分,共15分) 11. 12. 13. 已知F分布的上侧临界值F0.05(1,60)=4.00,则左尾概率为0.05,自由度为(60,1) 的F 14. 15.已知随机变量x服从N (8,4),P(x < 4.71)(填数字) 四.综合分析题(共60分)

生物统计学(第3版)杜荣骞 课后习题答案 第六章 参数估计

第六章参数估计 6.1以每天每千克体重52 μmol 5-羟色胺处理家兔14天后,对血液中血清素含量的影响如下表[9]: y/(μg · L-1)s/(μg · L-1)n 对照组 4.20 0.35 12 5-羟色胺处理组8.49 0.37 9 建立对照组和5-羟色胺处理组平均数差的0.95置信限。 答:程序如下: options nodate; data common; alpha=0.05; input n1 m1 s1 n2 m2 s2; dfa=n1-1; dfb=n2-1; vara=s1**2; varb=s2**2; if vara>varb then F=vara/varb; else F=varb/vara; if vara>varb then Futailp=1-probf(F,dfa,dfb); else Futailp=1-probf(F,dfb,dfa); df=n1+n2-2; t=tinv(1-alpha/2,df); d=abs(m1-m2); lcldmseq=d-t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2)); ucldmseq=d+t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2)); k=vara/n1/(vara/n1+varb/n2); df0=1/(k**2/dfa+(1-K)**2/dfb); t0=tinv(1-alpha/2,df0); lcldmsun=d-t0*sqrt(vara/n1+varb/n2); ucldmsun=d+t0*sqrt(vara/n1+varb/n2); cards; 12 4.20 0.35 9 8.49 0.37 ; proc print; id f; var Futailp alpha lcldmseq ucldmseq lcldmsun ucldmsun; title1 'Confidence Limits on the Difference of Means'; title2 'for Non-Primal Data'; run; 结果见下表: Confidence Limits on the Difference of Means for Non-Primal Data F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN 1.11755 0.42066 0.05 3.95907 4.62093 3.95336 4.62664 首先,方差是具齐性的。在方差具齐性的情况下,平均数差的0.95置信下限为3.959 07,置信上限为4.620 93。0.95置信区间为3.959 07 ~ 4.620 93。 6.2不同年龄的雄岩羊角角基端距如下表[27]: 年龄/a y/cm s/cm n

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性,试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研 究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求 结果重演性、结果可靠性、条件先进代表性、目的明确性 三、单因素试验的处理数就是该因素的水平数。 四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组 合数是? 3因素3水平的处理组合数是? 多因素试验的处理数是各因素不同水平数的所有组合。 五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为 喷施等量清水。 六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算 P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、互作的计算 N与P的互作为(16-10)/2=3或(14-8)/2=3 九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试 验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影 响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误 差,则精确度=准确度。) 十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。 适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2,而示范小区面积不小于330m2 。 十一、通常情况下,狭长小区误差比方形小区误差小。 小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1 十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复; 小区面积较大的试验可设2-4次重复。 十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)A=“抽得1个数字≤4”;

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学作业

生物统计学SPSS作业 4.6 桃树枝条的常规含氮量为2.40%,现对一桃树新品种枝条的含氮量进行了10次测定,其结果为:2.38%、2.38%、2.41%、2.50%、2.47%、2.41%、2.38%、2.26%、2.32%、2.41%,试问测定结果与常规枝条含氮量有无差别。 解:1、假设H1:u1=u2,即新品枝条与常规枝条含氮量无差别。对H2: u1!=u2。 2、取显著水平α=0.05。 3、用SPSS软件进行检验计算如下: (1)打开SPSS软件,输入数据,如图 (2)如图在主菜单栏选择“分析”选项的“比较均值”,在下拉菜单中选择“独立样本T检测”。

(3)在下图中将左边方框中的“新品枝条含氮量”放到右边的“检验变量”方框中,并选择“确定”。即可得出“单样本T检验”的检验结果。

4、结果分析 由SPSS “单样本T检验”检验结果可知t=-0.371 Sig. (2-Tailed)是双尾t检验显著概率0719大于0.05,所以可以接受假设H1,即新品枝条与常规枝条含氮量无差别

4.8 假说:“北方动物比南方动物具有较短的附肢。”未验证这一假说,调查了如下鸟翅长(mm)资料:北方的:120 113 125 118 116 119 ;南方的:116 117 121 114 116 118 123 120 。试检验这一假说。 解:1、假设H1:u1=u2,即北方动物和南方动物的附肢没有差别。对H2: u1!=u2。 2、取显著水平α=0.05。 3、用SPSS软件进行检验计算如下: (1)打开SPSS软件,输入数据,如图 (2)如图在主菜单栏选择“分析”选项的“比较均值”,在下拉菜单中选择“独立样本T检测”。 (3)在下图中将左边方框中的“翅长”放到右边的“样本变量(s)”方框中,将“状态”放到“分组变量”中,并选择“定义组”。

生物统计学答案 第一章 统计数据的收集与整理

第一章 统计数据的收集与整理 1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点, 或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg )。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat 。所用的SAS 程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67' 68-69='68-69' 70-71='70-71' 72-73='72-73' 74-75='74-75'; run; n y y n i i ∑== 1

李春喜《生物统计学》第三版 课后作业答案知识分享

李春喜《生物统计学》第三版课后作 业答案

《生物统计学》第三版课后作业答案 (李春喜、姜丽娜、邵云、王文林编著) 第一章概论(P7) 习题1.1 什么是生物统计学?生物统计学的主要内容和作用是什么? 答:(1)生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。 (2)生物统计学主要包括实验设计和统计推断两大部分的内容。其基本作用 表现在以下四个方面:①提供整理和描述数据资料的科学方法;②确定某些性状和特性的数量特征;③判断实验结果的可靠性;④提供由样本推断总体的方法;⑤提供实验设计的一些重要原则。 习题1.2 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 答:(1)总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。 (2)个体(individual)是组成总体的基本单元。 (3)样本(sample)是从总体中抽出的若干个个体所构成的集合。 (4)样本容量(sample size)是指样本个体的数目。 (5)变量(variable)是相同性质的事物间表现差异性的某种特征。 (6)参数(parameter)是描述总体特征的数量。

(7)统计数(statistic)是由样本计算所得的数值,是描述样本特征的数量。 (8)效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。 (9)互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。 (10)实验误差(experimental error)是指实验中不可控因素所引起的观测值偏 离真值的差异,可以分为随机误差和系统误差。 (11)随机误差(random)也称抽样误差或偶然误差,它是有实验中许多无法控 制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避 免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完 全消。 (12) 系统误差(systematic)也称为片面误差,是由于实验处理以外的其他 条件明显不一致所产生的倾向性的或定向性的偏差。系统误差主要由一 些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得 精细,在试验过程中是可以避免的。 (13) 准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或 性状的观测值与其真值接近的程度。 (14) 精确性(precision)也称精确度,指调查或实验中同一实验指标或性状 的重复观测值彼此接近程度的大小。 (15)准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值 的程度来衡量。精确性是反映多次测定值的变异程度,用样本间的各 个变量间变异程度的大小来衡量。

生物统计学论文

生物统计学 论 文 题目:浅谈生物统计学在农业上的应用 院系:生命科学与技术系 专业:食品营养与检测专业 学号:0918031011 班级:食品一班 姓名:张庆珍 指导老师:苏辉 时间:2011- 12 -9

目录 浅谈生物统计学在农业上的应用 (3) 摘要 (3) ABSTRA (3) 引子 (5) 实验设计 (5) 评价批内烟叶质量一致性的方法及应用 (6) 烟叶质量一致性的评价方法 (7) 统计分析 (7) 结果与分析 (7) 1一般评价方法与分析 (10) 1.1总糖质量特性值分析 (10) 1.2烟碱质量特性值分析 (10) 2加严评价方法 (11) 2.1总糖质量特性值加严分析见表6、7 (11) 2.2烟碱质量特性值加严分析见表8、9 (11) 2.3与外观质量检验对比该批烟叶外观质量检验结果为:烟叶整体外观不错, 但存在部位混级和混打不均匀现象。外观质量检验结果与该方法评价结果较符 合。 (11) 3结论 (11) 在线学习 (11) 参考文献 (12)

浅谈生物统计学在农业上的应用 摘要 统计学是把数学的语言引入具体的科学研究领域,将所研究的问题抽象为数学问题的过程,是搜集、分析和解释数据的一门科学。生物统计学是数理统计在生物学研究中的应用,它是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。随着生物学研究的不断发展,生物统计学的应用也越来越广泛。 生物统计学是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。 生物统计学包括实验设计和统计分析两部分内容,其作用主要有四个方面:提供整理、描述数据资料的科学方法并确定其数量特征,判断试验结果的可靠性,提供由样本推断总体的方法,提供试验设计的原则。 农业上研究新品种特性及与旧品种是否有差异性,需要应用生物统计学的知识。 关键词:生物统计学、农业、新品种。 ABSTRA Statistics is mathematics language introduction concrete scientific

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

生物统计学(版)杜荣骞课后习题答案统计数据的收集与

第一章统计数据的收集与整理1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:n y y n i i ∑ = =1 ,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点,或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg)。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat。所用的SAS程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67'

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

2017福师《生物统计学》答案

一、单选题(共 32 道试题,共 64 分。) V 1. 最小二乘法是指各实测点到回归直线的 A. 垂直距离的平方和最小 B. 垂直距离最小 C. 纵向距离的平方和最小 D. 纵向距离最小 2. 被观察到对象中的()对象称为() A. 部分,总体 B. 所有,样本 C. 所有,总体 D. 部分,样本 3. 必须排除______因素导致“结果出现”的可能,才能确定“结果出现”是处理因素导致的。只有确定了______,才能确定吃药后出现的病愈是药导致的。 A. 非处理因素,不吃药就不可能出现病愈 B. 处理因素,不吃药就不可能出现病愈 C. 非处理因素,吃药后确实出现了病愈 D. 处理因素,吃药后确实出现了病愈 4. 张三观察到李四服药后病好了。由于张三的观察是“个案”,因此不能确定______。 A. 确实进行了观察 B. 李四病好了 C. 病好的原因 D. 观察结果是可靠的 5. 四个样本率作比较,χ2>χ20.05,ν可认为

A. 各总体率不同或不全相同 B. 各总体率均不相同 C. 各样本率均不相同 D. 各样本率不同或不全相同 6. 下列哪种说法是错误的 A. 计算相对数尤其是率时应有足够的观察单位或观察次数 B. 分析大样本数据时可以构成比代替率 C. 应分别将分子和分母合计求合计率或平均率 D. 样本率或构成比的比较应作假设检验 7. 总体指的是()的()对象 A. 要研究,部分 B. 观察到,所有 C. 观察到,部分 D. 要研究,所有 8. 以下叙述中,除了______外,其余都是正确的。 A. 在比较未知参数是否不等于已知参数时,若p(X>x)<α/2,则x为小概率事件。 B. 在比较未知参数是否等于已知参数时,若p(X=x)<α,则x为小概率事件。 C. 在比较未知参数是否大于已知参数时,若p(X>x)<α,则x为小概率事件。 D. 在比较未知参数是否小于已知参数时,若p(X

李春喜《生物统计学》第三版课后作业答案

《生物统计学》第三版课后作业答案(李春喜、姜丽娜、邵云、王文林编着) 第一章概论(P7) 习题1.1 什么是生物统计学?生物统计学的主要内容和作用是什么?答:(1)生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。 (2)生物统计学主要包括实验设计和统计推断两大部分的内容。其基本 作用表现在以下四个方面:①提供整理和描述数据资料的科学方法; ②确定某些性状和特性的数量特征;③判断实验结果的可靠性;④提 供由样本推断总体的方法;⑤提供实验设计的一些重要原则。 习题1.2 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。答:(1)总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。 (2)个体(individual)是组成总体的基本单元。 (3)样本(sample)是从总体中抽出的若干个个体所构成的集合。 (4)样本容量(sample size)是指样本个体的数目。 (5)变量(variable)是相同性质的事物间表现差异性的某种特征。 (6)参数(parameter)是描述总体特征的数量。 (7)统计数(statistic)是由样本计算所得的数值,是描述样本特征的数量。

(8)效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。 (9)互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。 (10)实验误差(experimental error)是指实验中不可控因素所引起的 观测值偏离真值的差异,可以分为随机误差和系统误差。 (11)随机误差(random)也称抽样误差或偶然误差,它是有实验中许多无 法控制的偶然因素所造成的实验结果与真实结果之间产生的差异,是不可避免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完全消。 (12) 系统误差(systematic)也称为片面误差,是由于实验处理以外 的其他条件明显不一致所产生的倾向性的或定向性的偏差。系统误 差主要由一些相对固定的因素引起,在某种程度上是可控制的,只要 试验工作做得精细,在试验过程中是可以避免的。 (13) 准确性(accuracy)也称为准确度,指在调查或实验中某一实验 指标或性状的观测值与其真值接近的程度。 (14) 精确性(precision)也称精确度,指调查或实验中同一实验指标 或性状的重复观测值彼此接近程度的大小。 (15)准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真 值的程度来衡量。精确性是反映多次测定值的变异程度,用样本间 的各个变量间变异程度的大小来衡量。 习题1.3 误差与错误有何区别?

《生物统计学》期末考试试卷

《生物统计学》期末考试试卷 一 单项选择(每题3分,共21分) 1.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选 择统计量________。 A. 2 (1)n S σ- B. 2 20(1)n S σ- X X 2.设123,,X X X 是总体2 ( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是_____。 A. 123X X X +- B. 41i i X μ=-∑ C. 2 1X σ+ D. 4 2 1 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为_______。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是________。 A.63e μ μ- B.36e μ μ- C.36e μ μ- D. 316 e μ μ- 5.在假设检验中,显著性水平α的意义是_______。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 6.单侧检验比双侧检验的效率高的原因是________。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.比较身高和体重两组数据变异程度的大小应采用_____。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数

生物统计学(第四版)答案 1—6章

2.2试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。24号:19,21,20,20,18,19,22,21,21,19; 金皇后:16,21,24,15,26,18,20,19,22,19。 【答案】1=20,s1=1.247,CV1=6.235%;2=20,s2=3.400,CV2=17.0%。 2.3某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下: 单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,4,50,51,46,41,34,44,46; 第三章概率与概率分布 3.3已知u服从标准正态分布N(0,1),试查表计算下列各小题的概率值: (1)P(0.3<u≤1.8);(2)P(-1<u≤1);(3)P(-2<u≤2);(4)P(-1.96<u≤1.96; (5)P(-2.58<u≤2.58)。 【答案】(1)0.34617;(2)0.6826;(3)0.9545;(4)0.95;(5)0.9901。 3.4设x服从正态分布N(4,16),试通过标准化变换后查表计算下列各题的概率值: (1)P(-3<x≤4);(2)P(x<2.44);(3)P(x>-1.5);(4)P(x≥-1)。 【答案】(1)0.4599;(2)0.3483;(3)0.9162;(4)0.8944。 3.5水稻糯和非糯为一对等位基因控制,糯稻纯合体为ww,非糯纯合体为WW,两个纯合亲本杂交后,其F1为非糯杂合体Ww。 (1)现以F1回交于糯稻亲本,在后代200株中试问预期有多少株为糯稻,多少株为非糯稻?试列出糯稻和非糯稻的概率; (2)当F1代自交,F2代性状分离,其中3/4为非糯,1/4为糯稻。假定F2代播种了2000株,试问糯稻株有多少?非糯株有多少? 课后答案网https://www.wendangku.net/doc/006081613.html,1=42.7,R=30,s1=7.078,CV1=16.58%;2=52.1,R=30,s2=6.335,CV2=12.16%。 第四章统计推断 课后答案网https://www.wendangku.net/doc/006081613.html,=0=21g,4.5接受HA:≠0;95%置信区间:(19.7648,20.2352)。 4.6核桃树枝条的常规含氮量为2.40%,现对一桃树新品种枝条的含氮量进行了10次测定,其结果为:2.38%、2.38%、2.41%、2.50%、2.47%、2.41%、2.38%、2.26%、2.32%、2.41%,试问该测定结果与常规枝条含氮量有无差别。 【答案】t=-0.371,接受H0:=0=2.40%。 4.7检查三化螟各世代每卵块的卵数,检查第一代128个卵块,其平均数为47.3粒,标准差为2 5.4粒;检查第二代69个卵块,其平均数为74.9粒,标准差为4 6.8粒。试检验两代每卵块的卵数有无显著差异。 【答案】u=-4.551,否定H0:1=2,接受HA:1≠2。 4.8假说:“北方动物比南方动物具有较短的附肢。”为验证这一假说,调查了如下鸟翅长(mm)资料:北方的:120,113,125,118,116,114,119;南方的:116,117,121,114,116,118,123,120。试检验这一假说。 【答案】t=-0.147,接受H0:1=2。 4.9用中草药青木香治疗高血压,记录了13个病例,所测定的舒张压(mmHg)数据如下:序

相关文档
相关文档 最新文档