文档库 最新最全的文档下载
当前位置:文档库 › 生物统计学复习资料(整理)

生物统计学复习资料(整理)

生物统计学复习资料

第一章

1.生物统计学的基本作用:

1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征。

2)判断试验结果的可靠性

3)提供由样本推断总体的方法

4)提供试验设计的一些重要原则

3.总体:具有相同性质的个体所组成的集合

4.个体:组成整体的基本单元

5.样本:从总体中抽出的若干个体所构成的集合

6.变量:相同性质的事物间表现差异性的某项特征。按其性质分为连续变量和非连续变量。变量可以是定量的,也可以是定性的。

7.连续变量:表示在变量范围内可抽出某一范围的所有值

8.非连续变量:也称离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。

9.常数:是不能给予不同数值的变量,它代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。

10.参数:对总体特征的度量

11.统计数:由测定样本的全部重复观测值算得的描述样本的特征的数。

12.效应:试验因素相对独立的作用

13.误差:是试验中不可控因素所引起的观测值偏离真值的差异

14.随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的差异,不可避免。

15.系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差,可避免。

16.错误:是指在试验过程中,人为因素所引起的差错。

17.准确性:在调查或试验中某一试验指标或性状的观测值与真实值接近程度

18.精确性:指调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。

第二章

1.次数分布:在不同区间内变量出现的次数所构成的分布。

2.资料根据生物的形状特性,可分为数量性状和质量性状

3.间断性变数:指用计数方法获得的数据,其各个观测值必须以整数表示,在两个相邻整数间不允许带有小数的值存在。

4.连续性变数:指称量、度量或测量方法所得到得数据,其各个观测值并不限制于整数,在两个数值之间可以有微量数值差异的第三个数值存在

5.质量性状资料的方法:统计次数法,评分法

统计次数法:于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别及其次数或相对次数

给分法:给予每类性状以相对数量的方法。

6.试验资料搜集方法:调查和试验

7.资料调查方法:普查和抽样调查

抽样调查:根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。8.随机抽样满足条件:1)总体中每个个体被抽中的机会均相等;2)总体中任意一个个体是否被抽中是相互独立的

9.统计表要求:1)标题:简明扼要,准确地说明表的内容,有时须注明时间、地点

2)标目:分横纵两项,横列在表的左侧,纵列表上端,须注明计算单位

3)数字:一律用阿拉伯数字,以小数点对齐,无数字用“/”表示 4)线条:多用三线条。上下两条边路略粗

10.统计图绘制的要求:

1)标题简明扼要,列于图的下方

2)横纵坐标两轴有刻度,注明单位

3)横轴从左至右,纵轴由下而上,数值由小至大,图形长宽约为5.4或6.5 4)图中要不同颜色或线条代表不同的事物时,应有图例说明

11.计数资料基本采用单项式分组法进行整理

12.计量资料的整理一般采用组距式分组法

13.次数分布图分类:条形图、饼图、直方图、多边形图、散点图

14.变量的基本特征:

1)集中性:变量在趋势上有着向某一中心聚集,或者说以某一数值为中心而分布的性质。特征数是平均值

2)离散性:变量有着离中分散变异的性质。特征数是变异数,常用的指标是极差、方差、标准差和变异系数

15.平均数的种类:算术平均数、中位数、纵数、几何平均数

17.标准差的作用;

1) 表示变量分布的离散度

2) 利用标准差的大小,可以概括的估计出变量的次数分布及各类观测值在总体中所占有的比例

3) 估计平均数的标准误

4) 进行平均数的区间估计和变异系数的计算

18.组距:根据极差分成若干组,每组的距离相等,称为组距。组距=极差/组数

19.自由度:样本内独立且能自由变动的离均差的个数。

20.变异系数:样本的标准差除以平均数的百分比

21. 平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平; ②作为样本或资料的代表数据与其他资料进行比较。 平均数的特征:①离均差之和为零; ②离均差平方和为最小。

21.标准差的用处: ①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大; ②在计算标准差是如果对观察值加上一个或减去一个a ,标准差不变;如果给各观测值乘以或除以一个常数a ,所得的标准差就扩大或缩小a 倍; ③在正态分布中,X+-S 内的观测值个数占总个数的68.26%,X-+2s 内的观测值个数占总个数的95.49%,x-+3s 内的观测值个数占总个数的99.73%。

标准差的特征: ①表示变量分布的离散程度; ②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例; ③估计平均数的标准差; ④进行平均数区间估计和变异数的计算。

22.比较总体和样本的平均数、标准差:

总体平均数µ=∑x/N,式中分母为总体观察个数N ; 样本平均数x=∑x/n ,公式中n 是样本容量; 样本平均数是总体平均数的无偏估计值。

总体和样本标准差都等于离均差的平方和除以样本容量; 而总体标准差σ= ,分母上是总体观测值个数N; 而样本标准差是s=

1

n x x 2-∑-)

( ,分母上是样本自由度n-1. 样本标准差s 是总体标准差σ的无偏估计值。

第三章:

1.事件:一种事物常存在几种可能出现的情况,每种情况都为一次事件。

2.随机事件:在一定条件下,可能出现,也可能不出现的事件。

3.随机现象:在原本条件不变的条件下,重复进行观察,其结果未必相同的现象。

随机现象三个特征:

1)试验可以在相同条件下多次重复且相互独立;

2)给定条件下每次试验结果不只一个;

3)每次试验不能预料出现那种结果,但可以大概预知。

4.常见的理论分布:离散型随机变量的二项分布、泊松分布、连续型随机变量的正态分布

5.事件的相互关系:

1)和事件:事件A 和事件B 至少有一件发生而构成的新事件

2)积事件:事件A 和事件B 同时发生而构成的新事件

3)互斥事件:事件A 和事件B 不能同时发生

4)对立事件:事件A 和事件B 必有一个发生,但二者不能同时发生

5)独立事件:事件A 的发生或事件B 的发生毫无关系

6)完全事件:如果多个事件A1、A2…两两互斥,切每次试验结果必然发生其一

6.加法定理是互斥事件A 和B 的和事件的概率等于事件A 和事件B 的概率之和

7.乘法定理是独立事件的概率的乘积

8.大数定理:样本容量越大,样本统计数与总体参数之差越小

9.二项分布、泊松分布与正态分布的关系:如果n 相当大或p 与q 基本接近时,二项分布接近于正态分布;当λ较大时,泊松分布也接近正态分布。

10.正态分布的特征:

1)当x=u 是,f(x)有最大值πσ21

2)当x-u 的绝对值相等时,f (x )值也相等,正态分布是以u 为中心向左右两

侧对称分布

3) (X-u)/σ的绝对值越大,f (x )值也越小,但f (x )永不会等于0,所以正态分布以x 轴为渐近线

4)正态分布的曲线完全由参数u 和σ决定,u 确定正态分布曲线在x 轴上的中心位置,减小,曲线左移,增大曲线右移。σ确定正态分布曲线的展开程度,越小,曲线展开程度越小,曲线越陡高,反之亦然

5)正态分布曲线在x=u+σ处各有一个拐点,曲线通过拐点是改变弯曲的方向

6)正态分布的概率密度曲线与渐近线X轴所围成的全部面积必然等于1

11.无偏估计值:如果参数所有样本的某一统计数的平均数等于总体的相应参数(1)样本平均数是总体平均数的无偏估计值

(2)样本方差是总体方差的无偏估计值

(3)样本标准差不是总体的标准差的无偏估计值

12.中心极限定理:如果被抽样总体不是正态总体,但具有平均数u和σ2,当样本容量n不断增大,样本平均数的分布也越来越接近正态分布,且具有平均数u 和方差σ2/n

13.t分布的特征:

1)t 分布曲线是左右对称,围绕平均数u=0向两侧递降

2)t 分布受自由度df=n-1的制约,每个自由度都有一条t分布曲线

3)和正态分布相比,t分布的顶部偏低,尾部偏高,自由度大于等于30时,其曲线就比较接近正态分布曲线,当自由度趋向于无穷大时和正态分布曲线重合14.重置抽样(放回式抽样):指从总体中抽取一个个体,记下其特征数后再放回总体的抽样方法。

15.非重置抽样(不放回式抽样):指从总体中抽取一个个体,记下其特征数后不再放回的抽样方法。

16.抽样分布:指从总体中按一定的样本容量随机抽取全部所有可能的样本,由这些样本计算的统计数组成的分布。

17.无偏估计:指在统计数上如果所有可能样本的统计数的平均数等于总体相应的参数,则称这个统计数为总体相应参数的无偏估计量。

18.频率与概率之间的转化:

事件A在n次重复试验中发生了m次,则比值m/n称为事件A发生的频率,记为W(A);事件A在n次重复试验中发生了m次,当试验次数n不断增加时,事件A发生的频率W(A)就越来越接近某一确定值p,则p即为事件A发生的概率。二者的关系是:当试验次数n充分大时,频率转化为概率。

19.正态分布、标准正态分布、正态分布曲线的特点

正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。

U=0,σ²=1的正态分布为标准正态分布。

正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平

均数μ为峰值的曲线,当x=μ时,f(x)取最大值πσ21

;②、正态分布是以μ

为中心向左右两侧对称的分布 ③、σu

x -的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x 轴为渐近线,x 的取值区间为(-∞,+∞); ④、正态分布曲线完全由参数μ和σ来决定 ⑤、正态分布曲线在x=μ±σ处各有一个拐点;⑥、正态分布曲线与x 轴所围成的面积必定等于1。

正态分布具有两个参数μ和σ,μ决定正态分布曲线在x 轴上的中心位置,μ减小曲线左移,增大则曲线右移;σ决定正态分布曲线的展开程度,σ越小曲线展开程度越小,曲线越陡,σ越大曲线展开程度越大,曲线越矮宽。

第四章

1. 统计推断是根据理论分布由一个样本或一系列样本所得的结果来推断总体特征的过程。

2.参数估计则是由丫根本结果对总体参数在一定概率水平下所做出的估计。参数估计包括点估计和区间估计。

3.统计推断包括假设检验和参数估计两个方面

任务:分析误差产生的原因,确定差异的性质,排除误差干扰,从而对总体的特征做出正确的判断。

4.假设检验:根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设推断。

5.假设检验步骤:

1)提出假设:对样本所属总体提出无效假设H o 和备择假设H A

2)确定显著水平α

3)计算概率:在H o 正确的前提下,计算统计分布的统计数或相应的概率值。

4)推断是否接受假设:根据小概率原理,进行差异是否显著地推断,并作出推论。

6.小概率原理:如果假设一些条件,并在假设的条件下能够准确的算出事件A出现的芥蓝菜为很小,则在假设条件下的n次独立重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不能发生。

小概率原理是指概率很小的事件再一次试验中被认为是几乎不可能会发生的,一般统计学中常把概率概率小于0.05或0.01的时间作为小概率事件。他是假设检验的依据,如果在无效假设H0成立的条件,某事件的概率大于0.05或0.01,说明无效假设成立,则接受H0,否定HA;,如果某时间的概率小于0.05或0.01,说明无效假设不成立,则否定H0,接受HA。

7.假设检验中的两类错误:

1)第一类错误(弃真错误):如果H0是真实的,假设检验却否定了它,就犯了一个否定真实假设的错误

2)第二类错误(纳伪错误):如果H0不是真实的,假设检验时却接受了H0,否定了HA,这样就犯了接受不真实假设的错误。

两者的区别:第一类错误只有在否定H0时才会发生,而第二类错误只有在接受H0时才会发生,二者不会同时发生。

联系:在样本容量相同的情况下,犯第一类错误二等概率减少,第二类错误就会增加,反之亦然

假设检验中的两类错误是取证错误和取伪错误。为了减少犯两类错误的概率要做到:①显著水平a的取值不可以太高也不可太低,一般去0.05作为小概率比较合适,这样可以使犯两类错误的概率都比较小;②尽量增加样本容量,并选择合理的实验设计和正确的实验技术,以减小标准误,减少两类错误。

8.区间估计指根据一个样本的观测值给出总体参数的估计范围给出总体参数落在这一区间的概率。

9.点估计是指从总体中抽取一个样本,根据样本的统计量对总体的未知参数作出一个数值点的估计。

10.置信度与区间估计的关系为;对于同一总体,置信度越大,置信区间就越小,置信度越小,置信区间越大。

第五章

1. Χ²检验主要有三种用途:一个样本方差的同质性检验,适合性检验和独立性检验。一个样本方差的同质性检验用于检验一个样本所属总体方差和给定总体方差是否差异显著,适合性检验是比较观测值与理论值是否符合的假设检验;独立性检验是判断两个或两个以上因素间是否具有关联关系的假设检验。

Χ²检验用途:一个样本方差的同质性检验、适合性检验、独立性检验

1)适合性检验:比较观测值与理论值是否符合的假设检验。这种方法是对样本

的理论值先通过一定的理论分布推算出来,然后用实际观测值与理论观测值比较,从而得出实际观测值与理论观测值之间是否吻合的结论,因此适合性检验也叫吻合性检验或拟合优度检验。

2)独立性检验:实验九两个或两个以上因子彼此之间的相互独立的还是相互影响的一类统计方法。

2.Χ²检验基本原理:应用理论推算值E与观测值O之间的偏离程度来决定的。理论推算值与实际观测值之间偏差越大,越不符合;偏差越小,越趋于符合;若两值完全相等时,表明理论值与实际值完全符合。

3. Χ²检验的步骤为:

(1)提出无效假设H0:观测值与理论值的差异由抽样误差引起即观测值=理论值备择假设HA:观测值与理论值的差值不等于0,即观测值≠理论值(2)确定显著水平a.一般可确定为0.05或0.01

(3)计算样本的x2,求得各个理论次数Ei,并根据各实际次数Oi,代入公式,计算出样本的x2。

(4)进行统计推断

4.在计算Χ²是应注意:

1)任何一组的理论次数Ei都必须大于5,如果Ei<=5,,统计量会明显偏离Χ²分布,则需要并组或增大样本容量,以满足EI>5;

2)在自由度df=1时,需进行连续性矫正

公式:

对同一资料,进行矫正的值要比未校正的值小。当自由度df>=2时,一般不需要矫正。

第六章

1.试验因素:试验中所研究的影响试验指标的原因或原因组合,简称为因素或因子。

按照性质不同,因素可以分为可控因素和非可控因素。

2.因素水平:每个试验因素的不同状态(处理的某种特定状态或数量上的差别)。

3.试验处理:指对受试对象给予某种外部干预(或措施),是试验实施因子水平的一个组合。可分为单因素处理和多因素处理。

4.试验单位:试验中能接受不同试验处理的独立的试验载体。实际上就是根据目的而确定的观测总体。

5.重复:是指在试验中,将一个处理实施在两个或两个以上的试验单位上。

6.方差分析基本原理:将所有处理的观测值作为一个整体,一次比较就对所有各组间样本平均数是否有差异作出判断。

基本思想:将测量数据的总变异按照变异原因不同分解为处理效应和试验效应,并作出其数量估计。

7.方差分析避免的问题;

1)j检验过程繁琐

2)无统一的试验误差,误差估计的精确性和检验的灵敏性低

3)推断的可靠性降低,犯α错误的概率增加

8.方差分析的基本假定:正态性、可加性、方差同质性

9.数据转换:平方根转换、对数转换、反正弦转换、倒数转换

样本所来自的总体和方差分析基本假定相抵触,这些数据必须进行适当的数据转换

10.方差分析的概念、基本思想、一般步骤

1)方差分析是对两个或多个样本平均数差异显著性检验的方法。

(2)方差分析的基本思想是将测量数据的总变异按照变异来源分为处理效应和误差效应,并作出数量估计,在一定显著水平下进行比较,从而检验处理效应是否显著。

(3)方差分析的基本步骤如下:

a.将样本数据的总平方和与自由度分解为各变异因素的平方和与自由度。

b.列方差分析表进行F检验,分析各变异因素在总变异中的重要程度。

c.若F检验显著,对个处理平均数进行多重比较。

11.多重比较

(1)多个平均数两两间的相互比较称为多重比较。

(2)多重比较常用的方法有最小显著差数法和最小显著极差法,其中最小显著极差法又有新复极差检验和q检验法。

(3)多重比较的结果常以标记字母法和梯形法表示。标记字母法是将全部平均数从大到小依次排列,然后再最大的平均数上标字母a,将该平均数与以下各平均数相比,凡相差不显著的都标上字母a,直至某个与之相差显著的则标以字母b。再以该标有b的平均数为标准,与各个比它大的平均数比较,凡差数差异不显著的在字母a的右边加标字母b。然后再以标b的最大平均数为标准与以下未曾标有字母的平均数比较,凡差数不显著的继续标以字母b,直至差异显著的平均数标以字母c,再与上面的平均数比较。如此重复进行,直至最小的平均数有了标记字母,并与上面的平均数比较后为止。这样各平均数间,凡有一个相同标

记的字母即为差异不显著,凡具不同标记的字母即为差异显著。差异极显著标记方法同上,用大写字母标记。

梯形法是将各处理的平均数差数按梯形列于表中,并将这些差数进行比较。差数>LSD(LSR)0.05说明处理平均数间的差异达到显著水平,在差数的右上角标上“*”号;差数>LSD(LSR)0.01说明处理平均数间的差异达到极显著水平,在差数的右上角标上“**”号。差数< LSD(LSR)0.05,说明差异不显著。

第七章

1.回归分析:用来研究呈因果关系的相关变量间的关系的统计分析方法,其中表示原因的变量为自变量,表示结果的变量为因变量。

2.回归截距是当自变量为零时,因变量的取值,即回归线在y 轴上的截距;

3.回归系数是回归直线的斜率,其含义是自变量改变一个单位,因变量y 平均增加或减少的单位数。

4.相关分析:相关分析是用来研究呈平行关系的相关变量之间的关系的统计方法。

5.相关系数表示变量x 与变量y 相关的程度和性质,

6.决定系数是相关系数的平方,表示变量x 引起y 变异的回归平方和和占y 变异总平方和的比率,它只能表示相关的程度而不能表示相关的性质。

第九章

1.抽样调查中必须考虑的重点问题:抽样误差,样本容量以及抽样方法

2.生物学领域常用的抽样方法:随机抽样,顺序抽样,典型抽样

3.平均数资料样本容量的确定: 2

24L s n = n s

t L 05.0=

第十章

1.区间实验:在田间条件下对作物品种选育及遗传规律与栽培技术等方面进行的试验。

2.真值:一定时刻,一定位置,一定状态下某量得程度所体现出来的客观值或实际值。

3.准确度:指在实验中某一实验指标或性状的观测值接近的程度。

4.精确度:指在实验中同一实验指标或性状的重复观测值很大接近的程度。

5.因素:也叫供试因子,在试验中所研究的对试验指标有影响的各种技术措施。例如:品种、密度

6.水平:试验因素的质的不同状态或量得不同等级(因素内划分的不同等级)

7.处理:实际参加试验的试验因素水平或不同因素的实验水平组合。在单因素试验中指各个因素的试验的水平。在所有因素试验中指不同因素水平的组合。

8试验设计三个基本要素:包括处理因素、受试对象和处理效应

9.田间试验的类型:

一)按试验研究内容划分:品种、栽培、土壤肥料、病虫害防治

二)按试验因素划分:单因素试验、多因素试验、综合性试验

单因素试验:指在整个试验中只重复比较一个试验因素不同水平,其他作为试验条件的因素均应该严格控制一致的试验。

多因素试验:指同一试验中包含两个或两个以上的试验因素,各因素又分为不同水平,其他试验条件均应该严格控制一致的试验。

综合性试验:是在较大面积上运用成套的生产栽培技术措施,从中探索高产、稳产、低成本、综合栽培技术的效应

三)按试验小区大小划分:小区试验、大区试验

小区:在田间试验中,安排一个处理的小块地段称为试验小区。

区组:将全部处理分配于具有相对同质的一块土地上,称为一个区组,包括完全区组和不完全区组。

10.试验方案:按试验目的要求所拟定的进行比较的一组试验处理的总称。11.试验指标:试验中用来衡量各种处理效果的好坏的指标,如产品的产量、品质。通常指作物产量经济性状,包括定性指标和定量指标。

定量指标:可以直接用来表示数量的指标。

定性指标:不能直接用数量来表示,只能定性描述的指标。

12.均衡方案:方案内包含有全部的处理组的方案称为均衡方案;方案内只有部分处理组的方案则称为非均衡方案。

13.对照:用来与试验处理进行比较的处理。

14.唯一差异原则:指除处理以外,其他条件应该完全一致。

15.试验效应:试验因素的独立作用,即因素对试验指标所起的增加或减少的作用。

16.简单效应:同一因素不同水平之间试验效应的差异。

17.平均效应:(主效应):同一因素内各个简单效应的平均数。

18.互作(交互作用):两个或两个以上因素相互作用所引起的效应或两个因素简

单效应间的差异。

19.三原则:重复、随机和局部控制

1)重复:同一处理所放置的试验单元数,即同一处理种植的小区数

2)随机:每一重复的每一处理都有同等的机会放在任何一个试验小区上。3)局部控制:将整个试验空间分成若干个各自相对均匀的局部(区组)20.生物试验基本要求:

1)试验目的要明确

2)试验条件要有代表性

3)试验结果要可靠

4)试验结果要能重演

21.试验误差:试验中观测值与理论值之间的偏差,包括粗大误差、系统误差、随机误差。

粗大误差:由不正确的操作所引起的误差。

系统误差:由试验仪器、条件、设备、工具等原因所照成的各个观测值具有一定规律性变化的误差。

随机误差:由多种偶然的无法控制的因素所引起的误差。

试验误差来源:1)实验材料固有的差异2)试验条件不一致3)操作技术不一4)偶然性因素影响

控制试验误差的途径:1)选择纯合一致的试验材料2)改进操作管理制度,使之标准化

3)精心选择试验单位4)采用合理的实验设计和统计分析

22.边际效应:小区两边或两端的植株因有较大的空间而表现出的生长优势23.生长竞争:由于相邻小区所加处理不同(如种植不同作物或施肥水平不同)造成边行植物与中间植株生长发育不一致的现象。

24.保护行:为了使试验在较为均匀的环境下安全进行,在试验地周围种植同种作物品种的保护地段。

25.完全区组:重复和区组数目相等,每一区组或重复都安排全套处理

26.不完全区组:一个重复安排在几个区组上,每个区组只安排部分处理

27.主区:按照处理划分的小区。副区:主区内按各副区划分的小区。

28.试验设计:试验设计包括广义的试验设计和狭义的试验设计。广义的试验设计是指整个研究课题的设计,包括试验方案的拟订,试验单位的选择,分组的排

列,试验过程中试验指标的观察记载,试验资料的整理,分析等内容;而狭义的试验设计则仅是指试验单位的选择,分组与排列方法。生物统计学中的试验设计主要指狭义的试验设计。

29.名词解释:处理、处理效应、主效应、互作

处理:是指对受试对象给予的某种外部干预,是试验中实施的因子水平的一个组合,又称为处理因素。

处理因素:是指处理因素作用于受试对象的反应,是研究结果的最终体现。

主效应:是指由于因素水平的改变而造成因素效应的改变。

互作:是指两个或两个以上处理因素间的相互作用产生的效应。

生物统计学 复习资料

目录 计算部分 (1) 第一章 (1) 第二章 (2) 第三章 (5) 第四章 (7) 第五章 (9) 第六章 (9) 第八章 (12) 第十章 (13) 操作部分 (14) 一、T test (14) 1、One-sample T Test (14) 2、Independent T test (14) 3、paired-samples T Test (15) 二、ANOV A (15) 1、One-Way ANOV A (15) 2、Univariate (16) 三、Correlate and Regression (16) 1、Correlate (16) 2、Regression (17)

生物统计学 计算部分 第一章 1、次数分布表 统计表由标题、横标目、纵标目、线条、数字及合计构成,其基本格式如下表: 表2-3 50枚受精种蛋出雏天数的次数分布表 2、求全距、组距、组中值 全距:资料中最大值与最小值之差,又称为极差(range ),用R 表示,即 R=Max(x)-Min(x) 本例 R =65.0-37.0=28.0(kg ) 组距:每组最大值与最小值之差(即全距和组数的比值)记为 i 。分组时要求各组的组距相等。 组距(i)=全距/组数 本例 i =28.0/10≈3.0 组中值=(组下限+组上限)/2=组下限+1/ 2组距=组上限-1/2组距 3、平均数、标准差、变异系数计算 平均数: (直接法) (加权法)(组中值*频数) 样本标准差: n x n x x x x n i i n ∑ ==+++=1 21 ∑ ∑∑ ∑ = =++++++===f fx f x f f f f x f x f x f x k i i k i i i k k k 11 212211

生物统计学复习资料综述

第一章 1.生物统计学(Biostatistics)是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科。属于应用统计学的一个分支。是一门应用数学。 2.统计学(Statistics)是把数学的语言引入具体的科学领域,将所研究的问题抽象为数学问题的过程, 是收集、分析、列示和解释数据的一门科学。 3.生物统计学是研究生命过程中以样本推断总体的一门学科。 4.生物统计学的基本类容: ①试验设计:如何合理地进行调查或试验设计 ②统计分析:如何科学地整理、分析所收集来的具有变异的资料,揭示出隐藏其内部的规律性。 5.生物统计学的基本作用: ①提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。 ②运用显著检验,判断试验结果的可靠性或可行性。 ③提供由样本推断总体的方法。 ④提供试验设计的的一些重要原则。 6.常用的统计学术语: 一.总体与样本 具有相同性质的个体所组成的集合称为总体;总体有分为有限总体和无限总体。 组成总体的基本单元称为个体 从总体中抽出若干个体所构成的集合称为样本(sample);(总体中的一部分) 构成样本的每个个体称为样本单位;样本中所包含的个体数目叫样本容量或样本大小,

样本容量常记为n。一般在物学研究中,通常n<30的样本叫小样本,n ≥30的样本叫大样本。 二、参数与统计数 描述总体特征的数量称为参数,也称参量。常用希腊字母表示参数,例如用μ表示总体平均数,用σ表示总体标准差; 描述样本特征的数量称为统计数,也称统计量。常用英文字母表示统计数,例如用X-表示样本平均数,用S表示样本标准差。 三、变量与常数 变量,或变数,指相同性质的事物间表现差异性或差异特征的数据。 常数,表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。 变量包括定量变量和定性变量,定性变量又可分为连续变量(可以有任何小数出现)和非连续变量(只有整数出现)。 四、效应与互作 通过施加试验处理,引起试验差异的作用称为效应。效应有正效应与负效应之分。 互作,又叫连应,是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效应(协同作用)与负效应(拮抗作用)之分。 五、误差与错误 效应 随机误差,抽样误差,偶然误差

动科101《生物统计》重点

《生物统计学》复习资料 一、名词解释(举例自己总结) 1.总体:根据研究目的确定的研究对象的总体。 2.样本:总体的一部分成为样本。N≤30的样本称为小样本,N≥30的样本称为大样本。 3.随机抽样:指总体中的每个个体都有同等的机会被抽取组成样本。 4.参数:由总体计算的特征数称为参数。 5.统计数:由样本计算的特征数称为统计数。 6.准确性:在试验或调查中某一试验指标或性状的观测值与其真值接近的程度。 7.精确性:指在试验或调查中同一试验指标或性状的重复观测值彼此接近的程度。 8.随机误差:是由于许多无法控制的内在和外在偶然因素,尽管在试验中力求一致但不可 能绝对一致所造成。随机误差影响试验的精确性。 9.系统误差:由于试验动物的初始条件相差较大,饲料种类、品质、饲养条件未控制相同, 测量的仪器不准、标准试剂未经校准,以及观测、记载、抄录、计算中的错误所引起的。 系统误差影响试验的准确性。 10.极差:又称全距,资料中最大值与最小值之差。 二、简答题 1、计量资料的整理方法 答:1、求全距。2、确定组数。3、确定组距。4、确定组限及组中距。5、归组划线计数,作次数分部表。 2、编制统计表的总原则 答:总原则:结构简单,层次分明,内容安排合理,重点突出,数据准确,便于理解和比较分析。具体要求如下:1、标题要简明扼要、准确地说明表的内容,有时需注明时间、地点。 2、标目分横标目和纵标目两项,横标目列在表的左侧,用以表示被说明事物的主要标志;纵标目列在表的上端,说明横标目各统计指标内容,并注明计算单位,如:%、kg等。 3、数字一律用阿拉伯数字,数字以小数点对齐,小数位数一致,无数字的用“——”表示,数字是0的则填“0”。 4、表的上下两条边线略粗,纵横标目间及合计用细线分开,表的左右边线可省去,表的左上角一般不用斜线。 3、资料的分类 答:数量性状资料、质量性状资料、半定量资料。(详见p12) 4、描述资料特征的统计数 答:平均数、标准差、变异系数。 5、算术平均数的性质 答:1,、样本各观测值与平均数之差的和为0,简述为离均差之和为0,。2、样本各观测值与平均数之差的平方和最小,简述为离均差平方和最小。 6、多重比较的应用条件p87 答:F值显著或极显著否定了无效假设H0,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些处理平均数间差异不显著。因为,有必要进行平均数两两间的比较,以具体判断两两处理平均数间的差异显著性。 7、多重比较的四种方法?LSD法≤SSR法≤q法 答:(1)最小显著差数(LSD法) (2)最小显著极差(LSR法)1)q检验法2)SSR法 8、协方差分析意义与原理? 9、正态分布的特征p40 重点:p(-1≤μ﹤1)=0.6826 p(-2≤μ﹤2)=0.9545 p(-3≤μ﹤3)=0.9973 p(-1.96≤μ﹤1.96)=0.95 p(-2.58≤μ﹤2.58)=0.99 10、标准误:是平均数抽样总体的标准差,其大小反映样本平均数的抽样大小其精确性的

生物统计学复习资料

总体:根据研究目的而确定的、具有共同性质的个体所组成的集合,称为总体. 变异系数:变异系数为该样本标准差对平均数的百分比 标准误:平均数的标准差也称为标准误,它表示了平均数的抽样误差的大小。 参数:由总体的全部观察值算得的特征数,称为参数 极差:极差又称全距,记为R,是资料中最大观察值与最小观察值的差数。 离均差:在一个样本中,观察值与该样本平均数的差称为离均差。统计量:测定样本中的各个体所得的特征数称为统计量,是总体的相应参数的估计值。 算数平均数:一个数量资料中各个观察值的总和除以观察值个数所得的商,称为算术平均数。 几何平均数:一组观察值的连乘积再开这群数值的个数次方所得的值,称为几何平均数,记为G。 中位数:中数又称为中位数,即在同一性质资料内,将所有观察值按大小顺序排列,居中间位置的观察值称为中数,记作Md。 众数:在同一性质的资料中,如某一观察值出现的次数最多,即称该观察值为众数,记作M0 抽样:从总体中获得样本的过程。 显著性水平:保证参数在该区间的概率以P =(1-a)表示,称为置信系数或置信度,a称为显著水准或显著水平。

零假设:假设总体平均数u等于某个给定值u0(u=u0),或u-u0=0,这样的假设称为的零假设H0。 离散型数据:指用计数方法得到的数据,其各个观察值必以整数表示。连续性数据:指由称量、度量或测量等方法得到的数据。各个观察值并不限于整数。 频率分布:把频率值按要求进行分组归类,则制成频率分布表 频数分布:把观察值按数值大小进行分组归类,则制成频数分布表 随机抽样:从总体中随机抽取的样本称为随机样本。 无限总体:根据研究目的而确定的、具有共同性质的个体所组成的集合,称为总体. 相关系数:描述两个变量间直线趋势好坏程度的量,值越接近1,X、Y直线相关的程度就越真切 回归系数:b是直线的斜率,即b是X每增加一个单位时,平均地将要增加(b>0)或减少(b<0)的单位数, 样本:由总体的若干个体所组成的集合,称为样本 样本标准差:是离均差平方和平均后的方根,用σ表示。标准差是方差的算术平方根。 有限总体:但总体所包含的个体数目也可以是有限的,如一袋玉米种子组成的总体,称为有限总体 函数关系:函数关系是一种确定性关系,它反映了事物或现象之间存在着一种严格的数量依存关系。 备择假设:与零假设相对立,拒绝H0情况下,可供选择的假设,如

生物统计学经典习题期末复习个人整理

第二节样本平均数与总体平均数差异显著性检验 【例5.1】母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为116、115、113、112、114、117、115、116、114、113(天),试检验所得样本的平均数与总体平均数114天有无显著差异? 根据题意,本例应进行双侧t检验。 1.提出无效假设与备择假设:=114,:≠114 2、计算值 经计算得:=114.5,S=1.581 所以===1.000 =10-1=9 3、查临界值,作出统计推断由=9,查值表(附表3)得=2.262,因为 |t|<,P>0.05,故不能否定:=114,表明样本平均数与总体平均数差 异不显著,可以认为该样本取自母猪怀孕期为114天的总体。 【例5.2】按饲料配方规定,每1000kg某种饲料中维生素C不得少于246g,现从工厂的产品中随机抽测12个样品,测得维生素C含量如下:255、260、262、248、244、245、250、238、246、248、258、270g/1000kg,若样品的维生素C 含量服从正态分布,问此产品是否符合规定要求? 按题意,此例应采用单侧检验。 1、提出无效假设与备择假设:=246,:>246、计算值 经计算得:=252,S=9.115 所以===2.281 =12-1=11 3、查临界值,作出统计推断因为单侧=双侧=1.796,|t|>单侧t0.05(11),P<0.05,否定:=246,接受:>246,表明样本平均数与总体平均数差异显著,可以认为该批饲料维生素C含量符合规定要求。

第三节两个样本平均数的差异显著性检验 【例5.3】某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度,测定结果如表5-3所示。设两品种后备种猪90kg时的背膘厚度值服从正态分布,且方差相等,问该两品种后备种猪90kg时的背膘厚度有无显著差异? 表5-3长白与蓝塘后备种猪背膘厚度 品种 头 数 背膘厚度(cm) 长白1 2 1.20、1.32、1.10、1.28、1.35、1.08、1.18、1.25、1.30、1.12、1.19、1.05 蓝塘1 1 2.00、1.85、1.60、1.78、1.96、1.88、1.82、1.70、1.68、1.92、1.80 1、提出无效假设与备择假设:=,:≠ 2、计算值此例=12、=11,经计算得=1.202、=0.0998、=0.1096, =1.817、=0.123、=0.1508 、分别为两样本离均差平方和。 = = =0.0465 =** =(12-1)+(11-1)=21 3.查临界t值,作出统计推断当df=21时,查临界值得:=2.831, |t|>2.831,P<0.01,否定:=,接受:≠,表明长白后备种猪

生物统计学复习资料

生物统计学复习资料 生物统计学:是数理统计在生物学研究中的应用,它是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。精确性:指调查和试验中同一实验指标或性状的重复观测值彼此接近程度的大小,即试验误差的大小是可以计算的。准确性:是指统计数接近真知的程度。总体:具有相同性质的个体所组成的集合,它是指研究对象的全体。个体:组成总体的基本单元,具有相同性质。样本:从总体中抽取部分个体所组成的集合,即总体的一部分称为样本。样本容量:样本中个体的数目称为样本容量记为n.。众数:资料中出现次数最多的那个观测值或次数最多一组的中点值(组中值),称为众数。中位数:将试验或调查资料中所有观测值依大小顺序排列,居于中间位置的观测值。方差:用样本容量n来除离均差平方和,得到的平方和,简称方差。它反映一组数据的平均离散水平。变异系数:样本标准差除以样本平均数,得到的百分比为变异系数。用变异系数可以比较不同样本相对变异程度的大小。概率:事件A在n次重复试验中发生了m次,当试验次数n不断增大时,事件A发生的频率W(A)就越来越接近某一确定值p,于是定义p为事件A发生的概率。统计推断:是根据总体理论分布,从样本的统计数对总体参数做出的推断,统计推断包括假设检验和参数估计。参数估计:是统计推断的另一个方面,它是指由样本结果对总数参数在一定概率水平下所做出的估计。参数估计包括区间估计和点估计。因素水平:每个试验因素的不同状态(处理的某种特定状态或数量上的差异)称为因素水平。试验单位:是指在试验中能接受不同试验处理的独立试验载体,实际上就是根据研究目的而确定的观测总体。抽样误差:我们可以从总体中不断抽取若干个样本,每一样本有若干不同的观测值,所求得的样本平均数不可能恰好等于总体平均数,他们之间是有一定差异的,这个差异是由于抽样所引起的。称为抽样误差。典型抽样:根据初步资料或经验判断。有意识,有目的的选取一个典型群体作为样本。以估计总体。标准差:方差的平方根值就是标准差,标准差是衡量变量资料变异程度最好的指标。标准误:样本平均数的标准误差。 假设检验的步骤:1、提出假设2、确定显著水平3、计算概率4、推断是否接受假设。综上所述,1、对样本所属总体提出无效假设H0和备择假设Ha。2、确定显著水平a3、在H0正确地前提下,计算抽样分布的统计数或相应的概率值4、根据小概率原理,进行差异是否显著的推断,并作出结论。试验误差来源和减少途径来源:1、实验材料固有差异2、试验条件不一致3、操作不一致4、偶然性因素的影响减少途径:1、选择纯合一致的实验材料2、改进操作管理制度使之标准化3精心选择试验单位4、采用合理的实验设计。方差分析基本原理与基本步骤:原理,将测量数据的总体变异按照原应不同分解为处理效应和实验误差,并作出期数量估计。步骤:1、将样本数据的总平方和总自由度分解为变异因素的平方和与自由度。2、列出方差分析表进行F 检验,分析个变异系数在总变异中的重要程度。3、若F检验显著,则对个处理平均数进行多重比较。

生统复习资料

生物统计复习资料 绪论 一、什么是“生物统计学”? 生物统计学是生物学和数学的结合。是指应用数理统计的原理、方法来分析和解释各种生物现象和数量资料的应用科学。 二、为什么要学习生物统计学? 简单讲,生物统计学所讲授内容是从事农业科学研究必须具备的理论知识,因为试验数据的分析是科研工作中重要的一环,要求科研人员必须具备分析试验数据的基本能力,故应学习之。 三、怎样学好生物统计学? 生物统计学是一门应用学科,重点要求大家会使用这一数据分析“工具” ,因而相对容易学。但是其所用的原理、公式较多,需费一定时间去理解、记忆。学好这门课主要做到:明白意义、结合实际、多做练习,“实战”运用。 第一章变数的特征数 1.试验方案:是根据试验目的和要求所拟定的进行比较的一组试验处理的总称。具体就是指试验指标、试验因素和处理、重复次数、对照、小区以及设计方法的确定等。 2.指标、因素、处理:在试验中用来判断试验处理效果的标准称为试验指标(简称指标),有定性指标和定量指标。 因素:对试验指标有影响,在试验中需加以考察的条件叫试验因素,简称因素或因子,否则称非试验因素或非试验条件。 处理:是指试验因素的不同状态或不同的数量级别,简称处理,也叫水平。在单因素试验时,处理和水平的概念是等价的,但在复因素试验时,处理则是指各个因素水平的组合,叫处理组合。 3. 小区:安排每个处理所需试验材料的基本单位。用每个小区的数值(最好是平均值)进行统计分析。 4.总体与样本 总体是指在同一组试验条件下,由具有某种共同性质的大量个体所组成的集团,或者说是某一变数的全部可能值的集合。样本是指从总体中抽出的一部分个体。(一个个体有一个数值)总体容量用N表示,样本容量n用表示。 5.参数与统计数 描述总体的特征数叫参数,它是总体的真正数值,是固定的常量,是由总体的全部变量计算而得到的,显然参数通常是无法得到的。 描述样本的特征数叫统计数它是由样本的观察值计算而得到的,是参数相应的估计数。统计数是变化的,它会随样本的不同而不同。 6.变数与变量 变数是指在同一组试验条件下所获得的某种性状或特性的一组有变化的数据。变数中的每一个具体数值叫变量或叫观察值。 (一)数量性状的数据 1、连续性变数:指由称量、度量或测量、分析化验等方法所得到的数据。其各个变量并不仅限于整数,在两个相邻数值之间可以有微量差异的其他数值存在。 2、间断性变数:也叫非连续性变数。是指由计数方法所获得的数据,其各个变量必须以整数表示,在两个相邻的整数间不能有带小数的数值存在。 (二)质量性状的数据 由只能观察描述或感觉而难以量测的性状获得的数量资料为质量性状的数据。这些性状本身不能以数字来表示,要获得这类性状的数量资料,一般可以采用分级法和统计次数法进行数量化。所获得的质量性状的数据性质类似间断性变数。

生物统计学复习资料

05学年生工第1学期生物统计附试验设计 考试试卷答案 一、填空题(共26分) 1. 准确性 也叫 准确度 ,指在调查或试验中某一试验指标或性状的观察值与其真值接近的程度。 精确度 也叫 精确性 ,指调查或试验中同一试验指标或性状的重复观察值彼此接近的程度。(4分) 2. 多重比较的目的是判断两两平均数间的 差异显著性 。多重比较的方法很多,常用的有 最小显著差数法(LSD ) 和 最小显著极差法 。生物试验中,由于试验误差较大,常采用 邓肯法(或,DUNCAN 法,新复极差法、SSR 法) 。(8分) 3. 试验设计中, 重复 是指试验中同一处理实施在两个或两个以上的试验单位上;其作用是 估计试验误差 和 降低试验误差 。(4分) 4. 在某因素同一水平上,另一因素不同水平对试验指标的影响称为 简单效应 ;所谓 互作效应 ,实际上指的就是由于两个或两个以上试验因素的相互作用而产生的效应。(4分) 5. 试验中所研究的影响试验指标的因素叫 试验因素 。(2分) 6. 相关变量间的关系一般分为两种,一种为因果关系,即一个变量的变化受到另一个或几个变量的影响;另一种是平行关系,即两个以上的变量共同受到另外因素的影响。统计上采用 回归分析 研究呈因果关系的相关变量间的关系;采用 相关分析 研究呈平等关系的相关变量间的关系。(4分) 二、简答题(共35分) 1. 写出单因素试验资料方差分析的数学模型及其假设。(4分) 答:单因素试验资料方差分析的数学模型为: ij i ij e a x ++=μ 其中μ为全试验观察值总体的平均数,a i 为第i 个处理的效应,表示处理i 对试验结果产生的影响;e ij 是试验误差,相互独立,且服从正态分布N(0, σ2)。 2. 为什么有时要进行协方差分析?试举例说明(4分) 答:为了提高试验的精确性和准确性,对处理以外的一切条件都需要采取有效的措施严加控制,使它们在各处理间尽量一致,这叫试验控制。但在有些情况下,即使做出很大努力也难以使试验控制达到目的。例如,研究几种饲料配合饲料对猪的增重效果,希望试验仔猪的初始重相同,因为仔猪的初始重不同,将影响到猪的增重。经研究发现,增重与初始重之间存在线笥回归关系。但是,在实验中很难满足仔猪初始重相同这一要求。这时可利用仔猪的初始重(记为x )与其增重(记为y )的回归关系,将仔猪增重都矫正为初始重相同时的增重,于是初始重不同对仔猪的影响就消除了。由于矫正后的增重是应用统计方法将初始重控制一致而得到的,故叫统计控制。统计控制是试验控制的一种辅助手段。经过这种矫正,试验误差将减少,对试验处理效应估计更为准确。y 的变异主要由x 的不同造成(处理没有显著效应),则各矫正后的y ’间将没有显著差异(但原y 间的差异可能是显著的)。若y 的变异除x 不同的影响外,尚存在不同处理的显著效应,则可期望各y ’间将有显著差异(但原y 间的差异可能是不显著的)。此外,矫正后的y ’和y 的大小次序也常不一致。所以,处理平均数的回归矫正平均数的显著性检验,能够提高试验的准确性和精确性,从而更真实地反映试验实际结果。这种将回归分析与方差分析结合在一起,对试验数据进行分析的方法,叫做协方差分析。 3. 什么叫多重回归分析?多重回归分析中,自变量的顺序选择方法有哪三种?(3分) 答:回归分析中,如果依变量为一个随机变量,而自变量有多个(大于等于2个),则称为多重回归。在多重回归分析中,三种自变量的顺序选择方法分别为前进法、后退法和逐步回归法。在前进法中,一次只选择显著水平最高的一个自变量进入回归方程,进入回归方程的自变量不再从回归方程中剔除,即为“只进不出”。在后退法中,第一步所有的自变量都进入回归方程,然后,通过显著性检验,一次剔除回归方程中一个不显著的自变量,剔除的自变量不再进入回归方程,即为“只出不进”。在逐步回归法为前进法的修改,与前进法的区别在于,当一个自变量进入回归方程后,要对回归方程中的所有自变量进行显著性检验,不显著的自变量要被剔除,即为“有进有出”。

《生物统计学》复习

1.变量之间的相关关系主要有两大类:(因果关系),( 平行关系) 2.在统计学中,常见平均数主要有( 算术平均数)、( 几何平均数) 3.样本标准差的计算公式( ) 4.小概率事件原理是指() 5.在标准正态分布中,P(-1≤u≤1)=( ) (已知随机变量1的临界值为0.1587) 6.在分析变量之间的关系时,一个变量X确定,Y是随着X变化而变化,两变量呈因果关系,则X称为(),Y称为( ) 1、下列数值属于参数的是:(A) A、总体平均数 B、自变量 C、依变量 D、样本平均数 2、下面一组数据中属于计量资料的是(D) A、产品合格数 B、抽样的样品数 C、病人的治愈数 D、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是(C) A、12 B、10 C、8 D、2 4、变异系数是衡量样本资料程度的一个统计量。(A) A、变异 B、同一 C、集中 D、分布 5、方差分析适合于,数据资料的均数假设检验.(A) A、两组以上 B、两组 C、一组 D、任何 6、在t 检验时,如果t = t0、01 ,此差异是:(B) A、显著水平 B、极显著水平 C、无显著差异 D、没法判断 7、生物统计中t检验常用来检验(A) A、两均数差异比较 B、两个数差异比较 C、两总体差异比较 D、多组数据差异比较 8、平均数是反映数据资料性的代表值。(B) A、变异性 B、集中性 C、差异性 D、独立性 9、在假设检验中,是以为前提。(C) A、肯定假设 B、备择假设 C、原假设 D、有效假设 10、抽取样本的基本首要原则是(B) A、统一性原则 B、随机性原则 C、完全性原则 D、重复性原则 11、统计学研究的事件属于事件。(D) A、不可能事件 B、必然事件 C、小概率事件 D、随机事件 12、下列属于大样本的是(A) A、40 B、30 C、20 D、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是(D) A、0。11 B、8.64 C、2.88 D、0.32 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是(B). A、正比关系 B、反比关系 C、加减关系 D、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是(B) A、18 B、12 C、10 D、5 16、已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是( A ) A、9、1和8 B、1、8和9 C、8、1和9 D、9、8和1 17、观测、测定中由于偶然因素如微气流、微小的温度变化、仪器的轻微振动等所引起的误差称为(D) A、偶然误差 B、系统误差 C、疏失误差 D、统计误差 18、下列那种措施是减少统计误差的主要方法。(B)

生物统计学复习要点

1、生物统计学主要包括试验设计和统计分析 2、统计学的发展经历了3个阶段:古典记录统计学,近代描述统计学和现代推断统计学 3、生物统计学是数理统计在生物学研究中的应用,它是用数理统计的原理和 方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。 4、英国统计学家R.A.Fisher于1923年发展了显著性检验及估计理论,提出 来F分布和F 检验,创立了方差和方差分析,在从事农业试验及数据分析研究时,他提出了随机区组法、拉丁方法和正交试验的方法 5、常用的统计学术语有:总体与样本,参数与统计数,变量与资料,因素与水平,处理与重复,效应与互作,准确性与精确性,误差与错误 6、总体按所含个体的数目可分为有限总体和无限总体,n小于30的样本称为小样本,n大于等于30的为大样本 7、参数也称参量,是对一个总体特征的度量。统计数也称统计量,是由样本计算所得的数值。 8、准确性反映测定值与真值符合程度的大小,而精确性则是反映多次测定值 的变异程度 9、生物统计学的基本作用:1)提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征2)判断试验结果的可靠性3)提供由样本推断总体的方法4) 提供试验设计的一些重要原则

10、试验资料具有集中性和离散性两种基本特征。平均数是反映集中性的特 征数,主要包括算术平均数,中位数,众数,几何平均数等;反映离散性的特征数是变 异数,主要包括极差,方差,标准差和变异系数 11、资料可分为数量性状资料和质量性状资料 12、数量性状资料分为计数资料(非连续变量资料)和计量资料(连续变量资料) 13、资料的来源(资料的搜集方法)一般有两个,调查和试验 14、常用的抽样方法有随机抽样,顺序抽样,典型抽样 15、随机抽样的方法:简单随机抽样,分层随机抽样,整体抽样,双重抽样 16、计量资料的整理步骤:1,计算全距2.确定组数和组距(样本容量30--60, 分组数为5--8)3,确定组限和组中值4,分组,编制次数分布表 17、常用的统计图有条形图,饼图,直方图,多边形图,散点图(会辨认) 18、算术平均数的算法:直接计算法,减去(或加上)常数法,加权平均法 19、算术平均数的重要特性:1)样本中各观测值与其平均数之差称为离均差, 其总和等于零2)样本中各观测值与其平均数之差平方的总和,较各观测值与任一数 值(不包括平均数)之差的平方和最小,即离均差平方和为最小 20、标准差的特性:1,标准差的大小受多个观测值的影响,如果观测值与观测 值之间差异较大,其离均差也大,因而标准差也大,反之则小2,计算标准差时,如将 各观测值加上或减去一个常数a,其标准差不变,将各观测值乘以或除以一个常数a, 则标准差扩大或缩小了a倍3,在正态分布情况下,一个样本变量的分布情况可作如 下估计:在平均数两侧的1s范围内,观测值个数约为观测值总个数的68.26%,在平

生物统计学复习资料

生物统计学复习资料 一、名词解释 准确性(accuracy):在试验中某一指标的观测值与真实值的接近程度,也称准确度。(反映观测值偏离目标值的程度) 精确性(precision):在相同试验条件下,对同一指标重复测量时所得观测值之间的接近程度,也称精确度。(反映观测值之间的变异程度) 准确性和精确性合称正确性。 随机误差(random error):由无法控制的偶然因素导致的误差。(随机误差影响精确性,扩大样本容量或增加试验重复次数有助于减少但无法消除随机误差) 系统误差(systematic error):由测量工具不精准、试验方法不完善、操作人员水平差异等因素导致的误差。(既影响准确性又影响精确性,可消除) 总体(population):研究对象的全体成员(有限总体、无限总体) 个体(individual):构成总体的各个成员 样本(sample):从总体中抽取的部分个体所组成的集合。 样本容量(sample size):样本包含的个体数量。 随机抽样(random sampling):采用随机方式从总体中获取样本的过程。 放回式抽样(sampling with replacement):从总体抽取一个个体,记录特征后放回总体,再抽取下一个个体。 非放回式抽样(sampling without replacement):从总体抽取一个个体,不放回总体就继续抽取下一个个体。 连续型数据(continuous data):与某种标准相比较获得的非整数数据。(可以提高精确度,采用变量方法分析) 离散型数据(discrete data):由记录不同类别个体数目而得到的整数数据。(不能提高精确度,采用属性方法分析) 极差(range,R):数据资料中最大值与最小值的差值。 组距(class interval, i):对频数资料分组时,每个组区间的高限和低限之差,即组区间极差。样本特征数(sample characteristics):描述频率分布特征的数值 总体特征数(population characteristics):描述概率分布特征的数值 样本统计数(statistic):由样本数据计算而来的描述样本特征的数值。 总体参数(statistic):用于描述总体特征的恒定数值。 统计分布(经验分布):通过样本资料得出的频率分布。 理论分布(总体分布):由总体数据得出的概率分布。 抽样分布(sampling distribution):样本统计数的概率分布。 众数(mode, Mo):具有最大频数(率)的组值或中值。 中位数(median, Md):观察值排序后,位于排列中点的观察值或排列中点观察值的平均值(观察值累积频率恰好达到50%时的数值)。 变异系数(coefficient of variability, CV):样本标准差与样本平均数的百分比。 确定性现象(必然现象):在某些条件下一定会发生的现象。可分为必然事件和不可能事件两类。 非确定性现象(随机现象):在相同条件下重复进行试验,可能发生也可能不发生的现象,结果未必相同。 试验(trial或experiment):一组综合条件的实现。 随机试验(random trail):从已有试验的结果不能预知下一次试验结果,此类试验称随机试验。

完整word版生物统计学复习资料整理

生物统计学复习资料 第一章 1.生物统计学的基本作用: 1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征。 2)判断试验结果的可靠性 3)提供由样本推断总体的方法 4)提供试验设计的一些重要原则 3.总体:具有相同性质的个体所组成的集合 4.个体:组成整体的基本单元 5.样本:从总体中抽出的若干个体所构成的集合 6.变量:相同性质的事物间表现差异性的某项特征。按其性质分为连续变量和非连续变量。变量可以是定量的,也可以是定性的。 7.连续变量:表示在变量范围内可抽出某一范围的所有值 8.非连续变量:也称离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。 9.常数:是不能给予不同数值的变量,它代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。 10.参数:对总体特征的度量 11.统计数:由测定样本的全部重复观测值算得的描述样本的特征的数。 12.效应:试验因素相对独立的作用 13.误差:是试验中不可控因素所引起的观测值偏离真值的差异 14.随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的差异,不可避免。 15.系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差,可避免。 16.错误:是指在试验过程中,人为因素所引起的差错。 17.准确性:在调查或试验中某一试验指标或性状的观测值与真实值接近程度 18.精确性:指调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。 第二章 1.次数分布:在不同区间内变量出现的次数所构成的分布。 资料根据生物的形状特性,可分为数量性状和质量性状2. 3.间断性变数:指用计数方法获得的数据,其各个观测值必须以整数表示,在两个相邻整数间不允许带有小数的值存在。 4.连续性变数:指称量、度量或测量方法所得到得数据,其各个观测值并不限制于整数,在两个数值之间可以有微量数值差异的第三个数值存在 5.质量性状资料的方法:统计次数法,评分法 统计次数法:于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别及其次数或相对次数

生物统计学复习资料

第一章统计数据的搜集与整理 1.1 总体与样本 1.1.1 统计数据的不齐性 ●遗传因素 ●环境因素 1.1.2总体与样本 ●总体(Population) 指研究的全部对象,是由所研究具有某种共同性质的全部个体所组成的集合体。分为有限总体和无限总体。 ●样本(Sample) 为总体的一部分,样本内包含的个体数目称为样本含量。 ●统计学研究的核心问题是如何通过样本来推断总体。 1.1.3 抽样 从总体获得样本的过程称抽样,抽样的目的是希望通过对样本的研究推断其总体。生物统计学上要求抽样具有代表性,应是一个总体的缩影,因此要遵循随机性的原则。 1.1.4 随机抽样 要求总体中的任何个体都有同等的机会被抽到;要求抽样时不受任何主观因素的影响。如抽签,抓阄,用随机数字表等。随机表的用法(附表1,自习)

1.1.5 放回式抽样和非放回式抽样 ●放回式抽样:从总体中抽出一个个体,记下它的特征后,放回总体中,再做第二次抽样。 ●非放回式抽样:从总体中抽出个体后,不再放回。 ● 有限总体中的抽样:放回式的抽样可能会重复抽中某一个体。尤其是总体量不大,或抽样范围小的时候。 ●无限总体在同等抽样条件下,放回式抽样和非放回式抽样没有区别。 ●一般情况样本的含量越大越有代表性。 1.2 数据类型及频率分布 1.2.1 连续型数据和离散型数据 统计学的最基本工作是收集数据,数据收集得越多越有可能揭示客观现象的特性和变化规律。 数据类型: ●连续型数据(度量数据):与某种标准做比较所得到的数据.例如:长度,时间,重量。对连续型数据进行分析的方法,通常称为变量的方法。 ●离散型数据(记数数据):由记录不同类别个体的数目所得到的数据.例如:尾数,成活或死亡个数对离散型数据进行分析的方法,通常称为属性的方法。1.2.2 频数(率)表和频数(率)图的编绘 离散型数据与连续型数据的频数(率)表和频数(率)图略有不同。 离散型数据频数(率)表和频数(率)图。

生物统计学复习资料

生物统计学复习资料 一、单项选择题 1.x~N(1,9),x1,x2,…,x9是X的样本,则有() A.31 - x ~N(0,1) B.11 - ~N(0,1) C.91 - x ~N(0,1) D.以上答案均不正确 2.假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄的标准误() A.两者相等 B.前者比后者大 C.前者比后者小 D.不能确定大小 3.设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。若想对完成工作所需时间总体构造一个90%置信区间,则()A.应用标准正态概率表查出u值 B.应用t分布表查出t值 C.应用卡方分布表查出卡方值 D.应用F分布表查出F值 4.1-α是( D ) A.置信限 B.置信区间 C.置信距 D.置信水平 5.如检验k (k=3)个样本方差s i2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为( A ) A.方差的齐性检验 B. t检验 C. F检验 D. u检验 二、填空题 6.在一个有限总体中要随机抽样应采用式抽样方法。 7.在实际抽样工作中,为了减小标准误,最常用的办法就是。 8.已知F分布的上侧临界值F 0.05 (1,60)=4.00,则左尾概率为0.05,自由度为(60,1)的F分布的临界值为。 9.衡量优良估计量的标准有、和。 10.已知随机变量x服从 N (8,4),P(x < 4.71)= 。 三、判断题(下列各题,你认为正确的,请在题后的括号内打“√”,错的打“×”。) 11.分组时,组距和组数成反比。() 12.粮食总产量属于离散型数据。() 13.样本标准差的数学期望是总体标准差。() 14.F分布的概率密度曲线是对称曲线。() 15.在配对数据资料用t检验比较时,若对数n=13,则查t表的自由度为12。 ()答案:1.对 2.错 3. 错 4. 错 5.错 四、分析题 16.何谓“小概率原理”?算术平均数有两条重要的性质,是什么? 小概率的事件,在一次试验中,几乎是不会发生的。若根据一定的假设条件,计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假

生物统计复习

生物统计 第一章: 1、生物统计学是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科。属于应用统计学的一个分支。内容包括试验设计和统计分析。 2、生物统计学的基本作用:1、提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。2、运用显著检验,判断试验结果的可靠性或可行性。 3、供由样本推断总体的方法。 4、提供试验设计的的一些重要原则。(问答) 3、总体与样本:具有相同性质的个体所组成的集合称为总体,它是指研究对象的全体;组成总体的基本单元称为个体;(总体中的一个研究单位)从总体中抽出若干个体所构成的集合称为样本;(总体中的一部分)总体又分为有限总体和无限总体:含有有限个个体的总体称为有限总体;包含有极多或无限多个体的总体称为无限总体 4、构成样本的每个个体称为样本单位;样本中所包含的个体数目叫样本容量或样本大小(sample size),样本容量常记为n。一般在生物学研究中,通常把n<30的样本叫小样本,n ≥30的样本叫大样本。 5、变量,或变数,指相同性质的事物间表现差异性或差异特征的数据。常数,表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。 6、描述总体特征的数量称为参数,也称参量;常用希腊字母表示参数,例如用μ表示总体平均数,用σ表示总体标准差;描述样本特征的数量称为统计数,也称统计量。常用英文字母表示统计数,例如用表示样本平均数,用S表示样本标准差。 7、通过施加试验处理,引起试验差异的作用称为效应。效应有正效应与负效应之分。互作,又叫连应,是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效应(协同作用)与负效应(拮抗作用)之分。 8、变异包括效应和误差,误差又包括:随机误差(抽样误差)、偶然误差 、系统误差(片面误差)。随机误差,也叫抽样误差,是由于试验中无法控制的内在和外在的偶然因素所造成的试验结果与真实结果之间的差异。统计上的试验误差一般都指随机误差。随机误差越小,试验精确性越高。 系统误差,也叫片面误差,是由于试验处理以外的其他条件控制不一致所产生的带有倾向性的或定向性的偏差。系统误差影响试验的准确性。 只要试验工作做得精细,系统误差是可以克服的。 9、错误,是指在试验过程中,由于人为作用引起的差错。在试验中是完全可以避免的。 10、准确性,也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。精确性,也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。 第二章 1、在生物学试验及调查中,通过对某种具体事物或现象观察获得的结果称为资料。 2、试验资料的分类:变量包括定量变量——数量性变量和定性变量——质量性变量(属性性状资料),定量变量又包括连续变量——计量资料(连续变量资料)和非连续变量——计数资料(非连续变量资料)(问答) 3数量性状是指能够以计数和测量或度量的方式表示其特征的性状。观察测定数量性状而获得的数据就是数量性状资料。

生物统计学复习题(精心整理).docx

一、填空题 1.在黄瓜品种比较试验屮,除了黄瓜品种不同外,其它试验条件控制在相同的水平上,这就是比较试验的(唯一差界)原则。 2.在做空白试验时,变界系数可作为(土壤差界的指标,确定小区而积、形状和重复次数)等依据。 3.根据样本的容量的大小而将样本分为(大样本与小样本)。 4•样本平均数抽样分布的平均数为原总体的关系是( 5.在单个平均数差异显著性测验中,如果弘=3.0 >“()0| =2.58,其推断为: (否定无效假设,接受备择假设,差异达到极显著水平)。 6.在进行独立性测验吋,如果口由度df=l,则需要作(连续性矫止)。 2 2 F )。 7.从一个正态总体中随机抽取两个独立的样本,将必和吐的比值定义为 8.拉丁方试验设计的的特点是精确性高,其主要缺点是(缺乏伸缩性)。 9.直线回归方程式y = a + hx,。是回归截距,而b是(回归系数)。 10.在田间试验中最主要和最难控制的试验误差是(土壤差界)。 11・根据试验小区而积的大小可以将试验划分为大区试验和小区试验。 12.试验因素对试验指标所起的增加或减少的作用称为试验效M。 13.常用的111间试验设计可以分为顺序排列的试验设计和随机排列的试验设计。 14.只受到两个极端值影响的变界数是一极差(或全距)。 15.估计量抽样标准误差的大小反映了估计的楮确性。 16.在进行统计假设测验时所犯的两类错谋是_第•类错谋和笫二类错谋。 17.独立性测验主要是测验两个变数间是否札I互独立。 18.三种多重比较方法的显著尺度不同,LSD法最低,SSR法次Z, q法最高。 19.6个品种,重复5次的单因素完全随机试验,其误差自曲度是一24。 20.相关系数显著,回归系数也(必然显著)。 21.根据试验目的和要求所拟进行比较的一纽试验处理称为试验方案。 22.常用的III间试验设计可以分为顺序排列的试验设计和随机排列的试验设计。 y x 23.冇一组数据西、兀2、…、占,算术平均数的计算公式为元=厶丄。 n 24.当u二±1.96时,那么正态|11|线下面积为0.95 。 25.在成对数据资料用/测验比较吋,若对数,尸13,则查/表的自由度为12 o 26.观察一对相对性状的分离现象而获得数据资料,想知道这对性状的分离是否符合孟德尔 遗传规律,采用的测验方法是一适合性测验。 27.方差分析步骤包括平方和与自山度的分解、F测验、多重比较。 28.5个品种,重复3次,随机区纽试验设计,具误差H由度d匸(8 )。 4

相关文档
相关文档 最新文档