文档库 最新最全的文档下载
当前位置:文档库 › 生物统计学整理(1)

生物统计学整理(1)

生物统计学整理(1)
生物统计学整理(1)

1什么时候用相关分析,什么时候用直线相关分析

如果两个变量属于平行关系,一般用相关分析

对两个变量间的直线关系进行相互分析称为直线相关分析

2什么是随机区组设计、裂区设计

答:随机区组设计是根据局部控制和随机原理进行的,将试验单位按性质不同成分与重复数一样多的区组,是区组内非试验因素差异最小而区组间非试验因素差异最大,每个区组均包括全部的处理。区组内各处理随机排列,各区组独立随机排列

裂区设计是先将每一区组按第一因素的处理数划分小区,称成为主区,亦称整区,在主区里随机安排主处理,然后在主区内引进第二个因素的各个处理,即副处理,就是主处理的小区内分设与副处理数相等的更小的小区,称为副区,又称裂区,在副区里随机排列副处理。

3方差、标准差的计算公式 19,20

答:样本方差s的平方=Σ(x-x拔)的平方/n-1

总体方差σ的平方=Σ(x-μ)的平方/N

样本标准差s=根号下Σ(x-x拔)的平方/n-1

总体标准差=σ根号下Σ(x-μ)的平方/N

4什么是统计数,什么是参数

答:参数也称参量,是对一个总体特征的度量,常用希腊字母表示。如总体平均数μ,总体标准差σ等均为参数

统计数是由样本计算所得的数值,它是描述样本特征的数量,常用英文字母表示,如样本标准差s等。

5多重比较的方法有哪些,各自的适用范围是什么

答:多重比较的方法有最小显著差数法(LSD法)和最小显著极差法(LSR法),而最小显著极差法又可分为SSR法和q检验

对于精度要求高的试验应用q检验,一般试验可用SSR检验法,试验中各个处理皆与对照相比的试验资料可用LSD检验法

6回归截距a的标准误

s计算公式130页

a

s=Sy/x根号下1/n +x拔的平方/SSx

a

7直线回归方程的基本性质125

直线回归方程的3个性质

1、Q=Σ(y-y^)的平方=最小值 ^在第二个y的上面

2、Σ(y-y^)=0^在第二个y的上面

3、回归直线通过中心点(x拔,y拔)。

8无偏估计值的特征

一致性,有效性,无偏性

9正态分布的特征 36

答:正态分布具有以下特征

(1)当X=μ时,f(x)有最大值1/σ根号下2π,所以,正态分布曲线是以平均数μ处为峰值的曲线

(2)当X-μ的绝对值相等时,f(X)值也相等,所以正态分布是以μ为中心向左右两侧对称的分布

(3)X-μ/σ的绝对值越大,f(x)值越小,但f(x)永远不会等于0,所以正态分布以x轴为渐近线,x的取值区间为(负无穷,正无穷)

(4)正态分布曲线完全由参数μ和σ来决定,μ确定正态分布曲线在x轴上的中心位置,μ减小,曲线左移,μ增大,曲线右移。σ确定正态分布曲线的展开程度,σ越小,曲线展开程度越小,曲线越陡高,σ越大,曲线展开程度越大,曲线越矮宽

10什么是总体与样本

具有相同性质的个体组成的集合称为总体,它是指研究对象的全体。

从总体中抽出的若干个体所构成的集合称为样本

11什么是随机抽样

随机抽样是指要求在进抽样的过程中,总体内所有个体都具有相同的被抽取的概率,因此随机抽样又被称为概率抽样

12什么是因变量和自变量

表示原因的变量称为因变量,自变量是固定的试验时预先设定的

13实验设计的三个基本原则

答1重复2随机3局部控制

什么是参数估计

参数估计是统计推断的另一个方面,它是指由样本结果对总体参数在一定概率水平下所做出的估计,包括区间估计与总估计

数据资料按其性质不同各分为数量性状资料和质量性状资料两种

直线回归应注意的问题有哪些

答直线回归应注意的问题有:

1描述两个变量的依存关系

通过回归系数的假设检验,弱认为两变量间存在直线回归的关系,则可利用直线回归方程描述x和y两个变量之间的数量关系

2进行预测

在自变量x的观测范围内对依变量y进行估计,就是把自变量x代入回归方程对依变量y进行估计

3进行控制

利用回归方程进行逆运算,通过控制自变量x的取值来限定依变量y在一定范围内波动

生物学试验的基本要求是什么

1试验目的要明确2试验条件要有代表性3试验结果要可靠4试验结果要能重演

什么是分层随机抽样

分层随机抽样是一种混合抽样,将总体按变异原因或程度划分成若干区蹭,然后再用简单随机抽样方法,从各区层按一定的抽样分数抽选抽样单位

小概率事件原理是什么

如果假设一些条件,并在假设条件下,能够准确的计算出事件A出现的概率又很小,则在假设条件下的n次独立重复试验中,事件A将按预定的概率发生,而在一次试验中,则几乎不可能发生

简答题:

方差分析的基本假定是什么及什么是方差分析?

方差分析是将所有处理的观测值作为一个整体,一次比较就对所有各组间样本平均数是否有差异做出判断,如果差异不显著,则认为他们都是相同的,如果差异显著,再进一步比较是哪组数据与其他数据不同

试验误差的来源及控制?

答:试验误差的来源有

1试验材料固有的差异

2试验条件不一致

3操作技术不一致

4偶然性因素的影响

控制试验误差的途径有

1选择纯合一致的试验材料

2改进操作管理制度,使之标准化

3精心选择试验单位

4采用合理的试验设计

试验设计的基本原则?

答:1重复,在试验中,同一处理设置的试验单位数,称为重复

2随机,指一个重复中的某一处理或处理组合被安排在哪一试验单位,不要形成主观成见

3局部控制

什么是假设检验和适合性检验?

假设检验又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断。如果抽样结果使小概率事件发生,则拒绝假设,如果抽样结果没有使小概率事件发生,则接受假设,一般认为等于或小于0.05或0.01的概率为小概率

比较观测值与理论值是否符合的假设检验叫适合性假设。这种方法是对样本的理论值先通过一定的理论分布推算出来,然后用实际观测值与理论值比较,从而得出实际观测值与理论值之间是否吻合的结论,因此也称吻合性检验或拟合优度检验

生物统计学中的试验设计主要指什么?试验设计的基本要素有哪些?

生物统计学中试验设计主要指狭义的试验设计,即试验单位的选择,分组与排列的方法

试验设计的基本要素有

1处理因素,一般指受试对象给予的某种外部干预,包括单因素处理,多因素处理,同一因素可根据不同强度分为若干个水平

2受试对象,是处理因素的客体,实际上就是根据研究目的而确定的观测总体

3处理效应,是处理因素作用于受试对象的反应,是研究结果的最终体现

什么是正交设计?简述正交试验的基本方法?

正交设计是一种研究多因素试验的方法,在多因素试验中,随着试验因素和水平数的增加,处理组合数急剧增加

正交试验的基本方法

1确定试验因素数和水平数

2选用合适的正交表

3进行表头设计,列出试验方案

4试验

计算题(按步骤给分,公式对但结果错也给分):无重复观察值的二因素方差分析,适合性检验(孟德尔分离规律)、根据已有数据完善方差分析表、二个品种的变异程度比较(变异系数),一个样本频率的假设检验

生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 122 --∑∑n n x x )(

2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 三 填空 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 n /σx σ

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学1

定量资料的统计描述 在畜牧科学研究和生产中,对定量资料进行统计描述是一项经常性的工作。我们从科学试验或生产实践中获得的数据往往是杂乱无章的,只有对数据资料进行相应的统计处理,如计算出某一样本的平均数、标准差、变异系数、以及最大、最小值等基本统计量,才能得出规律性的结论。 在SAS系统中,对定量资料进行统计描述,可以采用MEANS和UNIVARIATE 两个过程来完成。 2.1 MEANS过程 MEANS过程可提供单个或多个变量的简单统计描述,当对多个变量进行统计描述时,其输出格式较为紧凑,便于阅读。在畜牧试验数据的处理中,计算定量资料的描述性统计量以MEANS过程最为常用。 下面我们可以通过一些具体的例子来了解如何应用MEANS过程对定量资料进行描述性统计。 例2.1 某试验站香猪的6周饲养试验增重结果数据见下表,计算甲乙两种饲料每周各自的平均增重、最大值、最小值、方差、变异系数、标准差各统计量。 1周2周3周4周5周6周 甲种饲料 6.65 6.35 7.05 7.90 8.04 4.45 乙种饲料 5.34 7.00 7.89 7.05 6.74 7.28 Data ok ; Input siliao $ weekage addweigh @@ ; cards ; a 1 6.65 a 2 6.35 a 3 7.05 a 4 7.90 a 5 8.04 a 6 4.45 b 1 5.34 b 2 7.00 b 3 7.89 b 4 7.05 b 5 6.74 b 6 7.28 ; Proc sort out=bigsort; by siliao ; run ; - 1 -

生物统计学复习重点137030032

主要统计符号注解
编号 1 2 3 4 5 6 7 8 9 11 12 13 符号 注解 希腊字母符号 统计检验的显著水平,一般 α 取 0.05 或 0.01 总体标准差。用拉丁字母 S 表示样本标准差 总体方差。用拉丁字母 S2 表示样本方差(均方) 样本平均数抽样总体方差 标准误 (样本平均数抽样总体的标准差, 表示平均数抽样误差的大小) S x 。 为标本标准误,是平均数抽样误差的估计值 总体平均数。用拉丁字母 x 表示样本平均数 卡平方值 经连续性矫正的卡平方值 自由度 df 为显著水平为 α 时的卡平方临界值 随机误差;重复内分组设计的参试材料误差 线性模型中的处理效应 表示从第 1 个观测值 xi 累加到第 n 个,观测值 xn,当
i
α
σ σ2
2 σx σx
μ χ2 χ c2 2 χ α ,df
ε τ
n
n
∑x
i=1
∑x
i =1
在意义上已明确
i
时,可简写为 ∑ x 。 ∑ 为求和符号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
T N n SS MS S S2 H0 HA SE DF CV CK O E F LSD LSR x~N(μ, 2) ( ,σ p,q , x~B(n,p) ( , ) a b r c f t u
x
d
d
k
拉丁字母符号 观测值总和 有限总体的总观测值数目 样本的观测值数目或样本容量(样本含量) 平方和 均方 样本标准差,用以估计总体标准差 σ 标准方差(均方) ,用以估计总体方差 σ2 无效假设 备择假设 标准误 自由度,自由度具体数值用 df 表示,如 df=8 变异系数 对照 观测次数 理论次数 F 统计数,F0.05 、F0.01 分别为 0.05、0.01 的临界值 最小显著差数(least significant difference) ( ) 最小显著极差(least significant ranges) 随机变量 x 服从参数 μ 和 σ 的正态分布,μ 为总体平均数,σ 为总体标准差 二项总体成数 p+q =1 随机变量 x 服从参数 n 和 p 的二项分布,n 为试验次数, p 为理论概率 直线回归方程中样本的回归截距 直线回归方程中标本回归系数 样本相关系数;独立性检验中相依表的行数 独立性检验中相依表的列数 观测次数 t 分布的统计数 u 正态分布的统计数;正态标准离差 样本平均数,用以估计总体平均数 μ 成对观测值的差数 成对观测值的差数的平均数 样本数或处理数
第 1 页 共 14 页

生物统计学作业

生物统计学SPSS作业 4.6 桃树枝条的常规含氮量为2.40%,现对一桃树新品种枝条的含氮量进行了10次测定,其结果为:2.38%、2.38%、2.41%、2.50%、2.47%、2.41%、2.38%、2.26%、2.32%、2.41%,试问测定结果与常规枝条含氮量有无差别。 解:1、假设H1:u1=u2,即新品枝条与常规枝条含氮量无差别。对H2: u1!=u2。 2、取显著水平α=0.05。 3、用SPSS软件进行检验计算如下: (1)打开SPSS软件,输入数据,如图 (2)如图在主菜单栏选择“分析”选项的“比较均值”,在下拉菜单中选择“独立样本T检测”。

(3)在下图中将左边方框中的“新品枝条含氮量”放到右边的“检验变量”方框中,并选择“确定”。即可得出“单样本T检验”的检验结果。

4、结果分析 由SPSS “单样本T检验”检验结果可知t=-0.371 Sig. (2-Tailed)是双尾t检验显著概率0719大于0.05,所以可以接受假设H1,即新品枝条与常规枝条含氮量无差别

4.8 假说:“北方动物比南方动物具有较短的附肢。”未验证这一假说,调查了如下鸟翅长(mm)资料:北方的:120 113 125 118 116 119 ;南方的:116 117 121 114 116 118 123 120 。试检验这一假说。 解:1、假设H1:u1=u2,即北方动物和南方动物的附肢没有差别。对H2: u1!=u2。 2、取显著水平α=0.05。 3、用SPSS软件进行检验计算如下: (1)打开SPSS软件,输入数据,如图 (2)如图在主菜单栏选择“分析”选项的“比较均值”,在下拉菜单中选择“独立样本T检测”。 (3)在下图中将左边方框中的“翅长”放到右边的“样本变量(s)”方框中,将“状态”放到“分组变量”中,并选择“定义组”。

统计学考试要点整理

2010级3班整理生物统计学基础知识整理 生物统计学整理 第一部分名词解释本文档仅供参考,仍有不足,有许多名词没有交待,需自己补充。本资料与课本,课后习题册搭配使用效果更好,有疑问联系大正 1生物统计学:是一门探讨如何从事生物学实验研究的设计,取样,分析,资料整理与推 论的科学.是数理统计在生物学研究中的应用,它是应用数理统计的 原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科, 属于应用统计学的一个分支。 2总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 3个体:构成总体的每个成员称为个体。 4样本:总体的一部分称为样本 5样本含量:样本内包含的个体数目称为样本含量 6抽样:从总体中获得样本的过程。 7连续性数据:与某种标准做比较所得到的数据称为连续型数据,又称为度量数据 8离散型数据:由记录不同类别个体的数目所得到的数据,称为离散型数据 9变量的方法:对连续性数据进行分析的方法,通常称为变量的方法 10属性的方法:对离散型数据进行分析的方法 11对于数据的变异程度,经常使用的度量方法有三中,1 范围或称为极差 2 平均离差 3 标准离差或称为标准差 12概率论:研究偶然现象本身规律性的科学 13统计学:基于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性 的科学 14随机实验:在我们做第一次观测时,并不能准确得知下一次的结果,这样的实验叫做随机实验 随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。 15基本事件:试验的每一最基本结果用小写拉丁字母表示

2.什么叫总体?什么叫样本?为什么要抽样?怎样抽样? 1)总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 2)样本:总体的一部分称为样本 3)从总体中获得样本的过程称为抽样,抽样的目的是希望通过对样本的 研究,推断其总体。生物统计学中往往总体数目是无限个,为方便研究总 体特征需要抽样。 4)从总体中抽取样本时,总体中的每一个个体被抽中的机会必须都一样,不能带有偏见,我们得到的样本应该是该市总体的一部分,需要进行随机 抽样。随机抽样的方法很多,例如抽签,拈阄等。最好方法是使用随机数 字表进行抽样。 5)随即数字表抽样步骤:第一步,闭上眼睛用铅笔在随机数字表上任意 点上一点,假若点到奇数,就用第一页表;假若点到偶数,就用第二页表。 第二步,在选定的那一页上,在点一次,决定从那个字开始。决定开始以 后进行读书(例如,总体有 4728 个个体,那就四位数字为一节读下去,

014福师《生物统计学》在线作业一、二

014福师《生物统计学》在线作业一 黄镇 一、单选题(共25 道试题,共50 分。) 1. 对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?C A. tr>tb B. trx)<α,就认为x是抽不到的。A. 假设检验原理B. 小概率原理C. 中心极限定理D. 概率分布律 13. 设配对资料的变量值为x1和x2,则配对资料的秩和检验D A. 分别按x1和x2从小到大编秩 B. 把x1和x2综合从小到大编秩 C. 把x1和x2综合按绝对值从小到大编秩 D. 把x1和x2的差数按绝对值从小到大编秩 14.可能影响试验结果的因素分为处理因素和______因素。服药后病好了,则“病好了”这个结果可能是药导致的(药无效)、______药导致的(药无效)。C A. 非处理因素,也可能不是 B. 误差因素,也可能不是 C. 误差因素,不可能不是 D. 非处理因素,不可能不是 15.由于所选的特征在“药有效”时可能出现、在“药无效”时也可能出现,所以除了__D____外,所选

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

生物统计学习题(1)

第一章绪论 一、填空 1 变量按其性质可以分为___变量和_____变量。 2 样本统计数是总体__估计量。 3 生物统计学是研究生命过程中以样本来推断__ __的一门学科。 4 生物统计学的基本内容包括_、----两大部分。 5 统计学的发展过程经历了_ _3个阶段。 6 生物学研究中,一般将样本容量_n大于等于30_称为大样本。 7 试验误差可以分为__ _两类。 二、判断 (-)1 对于有限总体不必用统计推断方法。 (- )2 资料的精确性高,其准确性也一定高。 ( + ) 3 在试验设计中,随机误差只能减少,而不可能完全消除。(- )4 统计学上的试验误差,通常指随机误差。 第二章试验资料的整理与特征数的计算 一、填空 1 资料按生物的性状特征可分为_ _变量和__变量。 2 直方图适合于表示__ _资料的次数分布。

3 变量的分布具有两个明显基本特征,即_和__ _。 4 反映变量集中性的特征数是_____ __,反映变量离散性的特征数是__ _。 5 样本标准差的计算公式s=__√∑(x-x横杆)平方/(n-1)_____。 二、判断 ( - ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。 ( - ) 2 条形图和多边形图均适合于表示计数资料的次数分布。(+)3 离均差平方和为最小。 (+ )4 资料中出现最多的那个观测值或最多一组的中点值,称为众数。 (- )5 变异系数是样本变量的绝对变异量。 四、单项选择 1 下面变量中属于非连续性变量的是_____。 A 身高 B 体重 C 血型 D 血压 2 对某鱼塘不同年龄鱼的尾数进行统计分析时,可做成__ _图来表示。 A 条形图 B 直方图 C 多边形图 D 折线图 3 关于平均数,下列说法正确的是__ __。 A 正态分布的算术均数与几何平均数相等 B 正态分布的算术平均数与中位数相等 C 正态分布的中位数与几何平均数相等

李春喜生物统计学第三版课后作业答案

《生物统计学》第三版课后作业答案(李春喜、姜丽娜、邵云、王文林编着) 第一章概论(P7) 习题1.1 什么是生物统计学?生物统计学的主要内容和作用是什么? 答:(1)生物统计学(biostatistics)是用数理统计的原理和方法来分析和解释生物界各种现象和实验调查资料,是研究生命过程中以样本来推断总体的一门学科。 (2)生物统计学主要包括实验设计和统计推断两大部分的内容。其基本作用表现在以下四个方面:①提 供整理和描述数据资料的科学方法;②确定某些性状和特性的数量特征;③判断实验结果的可靠性; ④提供由样本推断总体的方法;⑤提供实验设计的一些重要原则。 习题1.2 解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。 答:(1)总体(populatian)是具有相同性质的个体所组成的集合,是研究对象的全体。 (2)个体(individual)是组成总体的基本单元。 (3)样本(sample)是从总体中抽出的若干个个体所构成的集合。 (4)样本容量(sample size)是指样本个体的数目。 (5)变量(variable)是相同性质的事物间表现差异性的某种特征。 (6)参数(parameter)是描述总体特征的数量。 (7)统计数(statistic)是由样本计算所得的数值,是描述样本特征的数量。 (8)效应(effection)试验因素相对独立的作用称为该因素的主效应,简称效应。 (9)互作(interaction)是指两个或两个以上处理因素间的相互作用产生的效应。 (10)实验误差(experimental error)是指实验中不可控因素所引起的观测值偏离真值的差异,可以分为随 机误差和系统误差。 (11)随机误差(random)也称抽样误差或偶然误差,它是有实验中许多无法控制的偶然因素所造成的实验 结果与真实结果之间产生的差异,是不可避免的。随机误差可以通过增加抽样或试验次数降低随机误差,但不能完全消。 (12) 系统误差(systematic)也称为片面误差,是由于实验处理以外的其他条件明显不一致所产生的倾 向性的或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的,只要试验工作做得精细,在试验过程中是可以避免的。 (13) 准确性(accuracy)也称为准确度,指在调查或实验中某一实验指标或性状的观测值与其真值接 近的程度。 (14) 精确性(precision)也称精确度,指调查或实验中同一实验指标或性状的重复观测值彼此接近程 度的大小。 (15)准确性是说明测定值堆真值符合程度的大小,用统计数接近参数真值的程度来衡量。精确性是反映 多次测定值的变异程度,用样本间的各个变量间变异程度的大小来衡量。 习题1.3 误差与错误有何区别? 答:误差是指实验中不可控制因素所引起的观测值偏离真值的差异,其中随机误差只可以设法降低,但不能避免,系统误差在某种程度上可控制、可克服的;而错误是指在实验过程中,人为的作用所引起的差错,是完全可以避免的。 第二章实验资料的整理与特征数的计算(P22、P23)

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学名词解释

生物统计学 1、参数与统计量 参数,是指从总体中计算所得的用以描述总体特征的数值,是反映总体基本情况的特征数。如:总体平均数、总体标准差。 统计量,是指从样本中计算所得的数值称为统计量,是反映样本基本情况的特征数,一定程度上是对总体参数的估计值。如:样本平均数、样本标准差。 2、标准差与变异系数 标准差和变异系数都是反映离散性的特征数即变异数中的一种。 标准差有总体标准差和样本标准差之分:б=N x 2) (∑-μ、S=1)(2--∑n x x 。标准差的大小受多个变量影响,若各变量间差异大标准差也大。标准差的值较大时,x 的代表性受到削弱。要用标准差比较两个或两个以上样本间的变异程度时,必须满足:标准差相近似,且单位相同。 变异系数是度量数据资料变异程度的常用指标。变异系数CV=x s ×100%,是样本变量的相对差异量,是为不带单位的纯数。变异系数CV 可比较多个样本的变异系数。 3、精确性与准确性 准确性也称准确度,是指测定值与真值的符合程度大小。 精确性也称精确度,是指多次测定值的变异程度。 4、单侧检验与双侧检验 双侧检验是指进行假设检验时将拒绝性概率分置于理论分布的两侧。备择假设为

HA :0μμ≠(或21μμ≠)。单侧检验是指进行假设检验时将拒绝性概率分置于理论分布的一侧。备择假设为HA :0μμ> (0μμ<),或:21μμ>(21μμ<) 5、假设检验的两类错误 若H0是真实的,经过假设检验却否定了它,则犯了一个否定真实假设的错误—即第一类(Ⅰ类)错误,亦称“弃真”。犯第一类错误(“弃真”)的概率即为显著性水平α。若H0不是真实的,经过假设检验却接受了它,则犯了一个接受非真实假设的错误—即第二类(Ⅱ类)错误,亦称“纳伪”。犯第二类错误(“纳伪”)的概率为β。当样本含量相同时,显著性水平α↓,则β↑;反之,β↓,则α↑。 6、比较五个样本平均数的差异显著性时,检验用什么方法,为什么? 若用t 检验对四个样本进行平均数差异显著性检验时,分别对两个样本进行差异显著性检验,结果会产生较大误差,提高了犯第一类错误的概率。假设每次比较所确定的检验水准α=0.05,则每次检验拒绝H0不犯第一类错误的概率为 1-0.05=0.95。比如对五个样本进行t 检验,需比较1025=C 次,那么10次检验都不 犯第一类错误的概率为(1-0.05)10=0.5990,而都拒绝H0时犯第一类错误的概率为401.0)05.0(11=P 10=--。 故比较多个样本平均数时不适用于t 检验,而用方差分析可有效地控制第一类错误。 用方差分析比较四个样本的平均数差异显著性检验时,按照变异原因的不同,将测量数据资料的总变异分解成处理效应和试验误差,通过比较各种原因在总变异中所占的重要程度,并作出其数量估计。方差分析比t 检验运算简便,也比t 检验更为精确。 7、独立事件和概率的乘法原则

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

生物统计学标1

一单项选择题 1. 数列1,3,5,7,9,11的中位数是(C) A.3 B. 5 C. 6 D.7 2. 1,4,6,6,7,7,9这组数中其众数是(C) A.6 B.7 C.6和7 D.9 3. 若事件A与事件B互为逆事件,则(D) A A∪B=Ω B A∪B=Ω或A∩B=Φ C A∩B=Φ D A∪B=Ω且A∩B=Φ 4. 若事件A与事件B是互不相容事件,则P(AB)=(B) A.1 B.0 C.0.5 D.Ω 5. 下列不属于随机试验的特点是(D) A.每次试验的可能结果不只一个,且能事先明确试验的所有可能结果。 B.进行试验之前不能够确定到底哪个结果会发生。 C.试验可以在相同的条件下重复进行。 D.试验不可以在相同条件下重复进行。 6. 设F1(X)与F2(X)分别为随机变量X1与X2的分布函数,为使 F(X)=a F1(X)-bF2(X)是某一随机变量的分布函数,在下列 给定的各组数值中应取(A) A.a=3/5,b=-2/5 B.a=2/3,b=2/3 C.a=-1/2,b=3/2 D.a=1/2,b=-3/2 7. 下列变量中属于非连续性变量的是(C) A. 身高 B. 体重 C. 血型 D. 血压 8. 下列不属于随机试验的特点是(A) A. 试验不可以在相同条件下重复进行 B. 进行试验之前不能够确定到底哪个结果会发生. C. 试验可以在相同的条件下重复进行. D. 每次试验的可能结果不只一个,且能事先明确试验的所有可能结果. 9. 在下列分布中,其中(A)分布是与自由度无关的。 A. 正态分布 B. t分布 C. F分布 D. 分布 10. 两样本平均数进行比较时,分别取以下检验水平,以(D)所对应的犯第二类错误的概率最小。 A. α=0.01 B. α=010 C.α=0.05 D.α=0.20 11. 下列哪个概率不可能是显著水平α的取值(A) A. 95% B. 5% C. 10% D. 2.5% 12.下列说法正确的是(A) A. 离均差总和为零,离均差平方和最小 B. 离均差总和不为零,离均差平方和最小 C. 离均差总和为零,离均差平方和最大 D. 离均差总和不为零,离均差平方和最大 13. 若事件A与事件B是互不相容事件,则P(AB)=(B) A. 1 B. 0 C. 0.5 D.Ω 14. 一批种蛋的孵化率为80%,同时用两枚种蛋进行孵化,则至少有一枚能孵化出小鸡的概率为(B) A. 0.90 B. 0.96 C. 0.80 D. 0.64 15. “真作假”属于(B)

《生物统计学-2019》复习题

《生物统计学》复习题 1.变量之间的相关关系主要有两大类:(因果关系),(平行关系) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生) 5.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(因变量) ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于 事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是

生物统计学作业操作步骤及分析3

第一次作业 习题2.5 某地100例30~40岁健康男子血清总胆固醇(mol/L)测定结果如下: 4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 试根据所给资料编制次数分布表. 解:1.求全距7.22-2.70=4.52(mol/L) 2.确定组数和组距组数10 组距=4.52/10=0.452(mol/L)取组距为0.5(mol/L) 3.确定组限和组中值 2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~ 7.0~ 习题2.7 根据习题2.5的资料,计算平均数、标准差和变异系数。 习题2.8 根据习题2.5的资料,计算中位数,并与平均数进行比较。 习题2.9 某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下: 单养50绳重量数据: 45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47, 44,43,46,55,42,27,42,35,46,53,32,41,48,50,51,46,41,34,44,46;

《生物统计学》期末考试试卷

《生物统计学》期末考试试卷 一 单项选择(每题3分,共21分) 1.设总体服从),(2 σμN ,其中μ未知,当检验0H :220σσ=,A H :220σσ≠时,应选 择统计量________。 A. 2 (1)n S σ- B. 2 20(1)n S σ- X X 2.设123,,X X X 是总体2 ( , )N μσ的样本,μ已知,2 σ未知,则下面不是统计量的是_____。 A. 123X X X +- B. 41i i X μ=-∑ C. 2 1X σ+ D. 4 2 1 i i X =∑ 3.设随机变量~(0,1)X N ,X 的分布函数为()x Φ,则( 2)P X >的值为_______。 A. ()212-Φ???? B. ()221Φ- C. ()22-Φ D. ()122-Φ 4.假设每升饮水中的大肠杆菌数服从参数为μ的泊松分布,则每升饮水中有3个大肠杆菌的概率是________。 A.63e μ μ- B.36e μ μ- C.36e μ μ- D. 316 e μ μ- 5.在假设检验中,显著性水平α的意义是_______。 A. 原假设0H 成立,经检验不能拒绝的概率 B. 原假设0H 不成立,经检验不能拒绝的概率 C. 原假设0H 成立,经检验被拒绝的概率 D. 原假设0H 不成立,经检验被拒绝的概率 6.单侧检验比双侧检验的效率高的原因是________。 A .单侧检验只检验一侧 B .单侧检验利用了另一侧是不可能的这一已知条件 C .单侧检验计算工作量比双侧检验小一半 D. 在同条件下双侧检验所需的样本容量比单侧检验高一倍 7.比较身高和体重两组数据变异程度的大小应采用_____。 A .样本平均数 B. 样本方差 C. 样本标准差 D. 变异系数

相关文档