研究生《生物统计学》课程
第五讲方差分析
主要内容:
一、单因素方差分析
二、两因素方差分析
三、多因素方差分析
一、单因素方差分析[Analyze]=>[Compare Means]=>[ One-Way ANOV A]
(1)建立数据文件,在Variable Vew中定义变量“饲料”、“增重”,“饲料”小数位数为0,用1、2、3、4分别代表甲、乙、丙、丁4种饲料。输入数据。
(2)方差分析:[Analyze]=>[Compare Means]=>[ One-Way ANOVA],打开[One-Way ANOVA]主对话框。选定“增重”使之进入[Dependent List](样本观测值)框,选定“饲料”使之进入[Factor](因素)框
(3)单击[Options]进入“选项”对话框,选择[Descriptive]要求输出描述统计量,[Homogeneity of Variance tese](方差齐性检验),[Continue]返回;
(4)单击[Post Hoc]打开[One-Way ANOV A: Post Hoc Multiple Comparisions](单因素方差分析:验后多重比较)对话框,可选择确定多重比较方法,如LSD法、Duncan 法,[Continue]返回;
(5)单击[OK],运行单因素方差分析。
结果显示:方差分析表:
(P=0.005<0.01 不同饲料对鱼增重的作用差异极显著)
多重比较:LSD法
(解释:甲与其他三种饲料都具有显著差异,乙、丙、丁间差异不显著)
Duncan法
(解释:用Duncan法划分的相似性子集,在显著性水平为0.05的情况下,第一组包括丙乙丁,组内相似的概率为0.123;第二组包括甲,说明甲的均值与其他三个具有显著性差异)
2、练习:某灯泡厂用四种配料方案制成的灯丝生产了四批灯泡,在每批灯泡中作随机抽样,测量其使用寿命(单位:小时),数据如下:
问不同灯丝制成的灯泡的使用寿命是否有显著差异,存在差异则做多重比较。
3、练习:调查5个不同小麦品系株高(cm),结果见下表,比较不同品系间小麦株高差异是否显著。
二、两因素方差分析:研究两个控制变量是否对观察变量产生显著影响,不仅能分析两个因素对观测变量的影响,还能分析其交互作用对观测变量的分布产生影响。在SPSS 中,两因素方差分析是利用“General Linear Model”(一般线性模型)模块中的“Univariate”(单变量方差分析)过程来完成。
(一)有重复的两因素方差分析:(固定模型)
1、案例分析:选定2种不同性别和4种不同年龄的猕猴,测定血液中a2球蛋白(单位:g/l)
(1)建立数据文件,在Variable Vew中定义变量“年龄”、“性别”、“蛋白含量”,“年龄”、“性别”小数位数为0,“年龄”中用1、2、3、4分别代表“1-3岁”、“4-6岁”、“7-10岁”、“>10岁”4个年龄段,“性别”中用1、2分别代表“雌性”、“雄性”,输入数据。
(2)方差分析:[Analyze]=>[General Linear Model]=>[Univariate],打开[Univariate]主对话框。选定“蛋白含量”使之进入[Dependent Variable](因变量)框,选定“年龄”、“性别”使之进入[Fixed Factor(s)](固定因素变量)框;(年龄和性别均为固定因素)
(3)单击[Options]进入“选项”对话框,选择[Descriptive]要求输出描述统计量,[Continue]返回;
(4)单击[Post Hoc…]打开[Univariate:Post Hoc Multiple Comp…]对话框,将“年龄”
选入[Post Hoc Test for]框中,选择LSD法,[Continue]返回;
(5)单击[Model],打开“Univariate:Model”对话框,默认“Full factorial”(建立全因素模型,包括所有因素的主效应、所有协变量的主效应及所有因素与因素的交互效应),“Custom”(自定义模型,只指定一个交互效应的子集或因素与协变量的交互效应),本题为有重复的实验,可研究“年龄”与“性别”的交互效应,故可选择默认选项。
(6)单击[OK],运行多因素方差分析。
Post Hoc Tests:多重比较结果年龄
2、练习:为了研究饲料中钙磷含量对幼猪生长发育的影响,将钙(A)、磷(B)在饲料中的含量各分4个水平进行交叉分组试验,选择日龄、性别相同,初始体重基本一致的幼猪48头,随机分为16组,每组3头,经2个月试验,幼猪增重(kg)见下表:
(固定模型)
3、练习:为了研究某种昆虫滞育期长短与环境的关系,在给定的温度和光照条件下在实验室培养,每一处理记录4只昆虫的滞育天数,试对该资料进行方差分析。
(固定模型)
4、练习:啤酒生产中需要研究烘烤方式(A)与大麦水分(B)对糖化时间的影响,选择两种烘烤方式、4种水分,共8种处理,每一处理重复3次,试进行方差分析。
(混合模型:烘烤方式为固定因素,大麦水分为随机因素)
(二)无重复的两因素方差分析:
1、案例分析:将一种生长激素配成M1、M
2、M
3、M
4、M5五种浓度,并用H1、H2、H3三种时间浸渍某大豆品种的种子,出苗45天后得各处理每一植株的平均干重(g),试作方差分析。(激素浓度、浸种时间均为固定因素)
(1)建立数据文件,在Variable Vew中定义变量“浓度”、“时间”、“干重”,“浓度”、“时间”小数位数为0,“浓度”中用1、2、3、4、5分别代表“M1”、“M2”、“M3”、“M4”、“M5”5个浓度段,“时间”中用1、2、3分别代表“H1”、“H2”、“H3”,输入数据;
(2)方差分析:[Analyze]=>[General Linear Model]=>[Univariate],打开[Univariate]主对话框。选定“干重”使之进入[Dependent Variable](因变量)框,选定“浓度”、“时间”使之进入[Fixed Factor(s)]框;
(3)单击[Model],打开“Univariate:Model”对话框,选择“Custom”(自定义模型),在[Build Term(s)]下拉菜单中选择“Main effect”(只分析主效应),将“浓度”、“时
间”引入[Model]框中,[Continue]返回;(由于没有重复试验,无法分析因子之间的交互作用,故必须自定义模型)
(4)单击[Options]进入“选项”对话框,选择[Descriptive]要求输出描述统计量,[Continue]返回;
(5)单击[Post Hoc…]打开[Univariate:Post Hoc Multiple Comp…]对话框,将“浓度”、“时间”选入[Post Hoc Test for]框中,选择LSD法、Duncan法,[Continue]返回;(6)单击[OK],运行多因素方差分析。
(结果表明,不同激素浓度处理对植株干重有显著影响,但浸种时间不同对植株干重影响不显著)
Post Hoc Tests(多重比较):浓度
(LSD与Duncan法都表明,M4与其它浓度都有明显差异;M3、M5之间差异不明显,但与其它浓度具有明显差异,M1、M2之间差异不明显, ,但与其它浓度具有明显差异)时间
2、练习:四窝不同品系的未成年大白鼠,每窝3只,分别注射不同剂量的雌激素,然后在同样条件下试验,称得它们的子宫重量(g),结果如下表,试作方差分析。(激素浓度、品系均为固定因素)
三、多因素方差分析:与两因素方差分析类似
“General Linear Model”(一般线性模型)模块中的“Univariate”(单变量方差分析)
案例分析:为了研究在猪饲料中添加胱氨酸(因素A)、蛋氨酸(因素B)和蛋白质(因素C)对猪日增重(kg)的影响,设计如下试验,每一组以两头猪作重复,结果如下表,
试对该资料进行方差分析。
胱氨酸(A)蛋氨酸(B)蛋白质(C)日增重(kg)
0 0 12 1.11
0.97
14 1.52
1.445
0.025 12 1.09
0.99
14 1.27
1.22
0.05 12 0.85
1.21
14 1.67
1.24
0.05 0 12 1.3
1
14 1.55
1.53
0.025 12 1.03
1.21
14 1.24
1.34
0.05 12 1.12
0.96
14 1.76
1.27
0.1 0 12 1.22
1.13
14 1.38
1.08
0.025 12 1.34
1.41
14 1.4
1.21
0.05 12 1.34
1.19
14 1.46
1.39
0.15 0 12 1.19
1.03
14 0.8
1.29
0.025 12 1.36
1.16
14 1.42
1.39
0.05 12 1.46
1.03
14 1.62
1.27
(1)建立数据文件,在Variable Vew中定义变量“胱氨酸”、“蛋氨酸”、“蛋白质”、“日增重”,“设置胱氨酸”、“蛋氨酸”、“蛋白质”小数位数为0,用数字表示这三个变量的不同水平,输入数据。
(2)方差分析:[Analyze]=>[General Linear Model]=>[Univariate],打开[Univariate]主对话框。选定“日增重”使之进入[Dependent Variable](因变量)框,选定“胱氨酸”、“蛋氨酸”、“蛋白质”使之进入[Fixed Factor(s)](固定因素变量)框;(这三个因素均为固定因素)
(3)单击[Model],打开“Univariate:Model”对话框,因为本题为有重复的实验,故可选择默认选项。
(4)单击[OK],运行多因素方差分析。
云南师范大学2010~2011学年下学期期末统一考试 高级生物统计学实验(期末) 试卷 学院 专业 年级 学号 姓名 考试方式(闭卷或开卷): 闭卷 考试时量:60分钟 试卷编号(B 卷): 题号 一 二 三 四 五 总分 评卷人 得分 一、下表为某种动物在不同温度下的代谢率的变化,试比较温度对其代谢率 有无影响?并对SSR 法其进行多重比较 温度(℃) 代谢率(mlO 2/g.h ) -5 2.78 3.80 4.87 4.68 5.51 5.67 5.10 2.79 2.60 3.14 4.26 3.72 3.48 2.86 3.37 3.32 4.35 4.59 4.66 4.83 5.16 -5 -5 -5 -5 -5 -5 .00 .00 .00 .00 .00 .00 .00 5.0 5.0 5.0 5.0 5.0 5.0 5.0
ANOVA 数据 7.1972 3.598 5.684 .012 11.39718.633 18.593 20 Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 经但因素方差分析的:f=5.684, p=0.012,差异显著,说明多有作用, 数据 Duncan a 7 3.2643 7 4.32577 4.6300 1.000.484 温度231Sig. N 12Subset for alpha = .05 Means for groups in homogeneous subsets are displayed. Uses H armonic Mean Sample Size = 7.000. a. 二、为调查红绿色盲是否与性别有关,某单位调查结果如下: 色盲 非色盲 男 32 168 女 13 232 问红绿色盲是否与性别有关? 三、试用交互误差图比较不同季节某种动物的胃长(cm )的变化?并绘制出其在 95%置信带 季节 胃长(cm )
统计学模拟试题 一、名词解释。 1、总体参数:在统计学中,反映总体的一些数量特征称为总体参数 2、样本统计量:由样本所获得的一些数量特征称为样本统计量 3、随机事件:在一定的实验条件下,有可能发生也有可能不发生的事件为随 机事件 4、集中位置量数:反映一群性质相同的观察的平均水平或集中趋势的统计指标 5、频数:是将数据资料按一定顺序分成若干组,并数出各组中所含有的数据。 6、统计推断: 7、抽样误差:抽出的样本统计量之间或样本统计量与总体参数间的偏差,立要由于个体间的差异所造成。 8、相对数:相对数也称为相对指标,是两个有联系的指标的比率,它可以从数量上反映两个相互联系的事物(或现象)之间的对比关系。 9、假设检验:在实际检验过程中,主要的问题是要判定被检验的统计量之间的偏差是由抽样误差造成的,还是由于总体参数不同所造成的,要作出判断就需要对总体先建立某种假设,然后通过统计量的计算及概率判断,对所建立的假设是否成立进行检验。这类方法称为假设检验。 10、平均数:反映一群性质相同的观察值的平均水平或集中趋势的统计指标。 11、变异系数:也是反映变量离散程度的统计指标,它是以样本标准差与平均数的百分数来表示的!记作:CV 12、总体与样本: 13、离中位置量数:描述一群性质相同值的离散程度的统计指标 14、抽样:指在总体中抽取一定含量的样本。 15、频率: 16、系统误差:宏观世界是由实验对象本身的条件,或或者者仪器不准,场地品格出现故障,训练方法,手段不同所造成的,可使测试结果杨倾向性偏大或偏小。 17、结构相对数:是在分组基础上,以各个分组全计数值与总值对比的相对数。 18、a=0.05或a=0.01:指检验水准称小概率水平
第八章方差分析 Ⅰ.学习目的 本章介绍方差分析的理论、方法与运用。通过学习,要求:1.了解方差分析的基本概念和思想;2.理解方差分解原理;3.掌握单因素、双因素(有、无交互作用)方差分析的原理和流程;4学会针对资料提出原假设,并能利用Excel进行方差分析。 Ⅱ.课程内容要点 第一节方差分析方法引导 一、方差分析问题的提出 方差分析,简称ANOVA(analysis of variance),就是利用试验观测值总偏差的可分解性,将不同条件所引起的偏差与试验误差分解开来,按照一定的规则进行比较,以确定条件偏差的影响程度以及相对大小。当已经确认某几种因素对试验结果有显著影响时,可使用方差分析检验确定哪种因素对试验结果的影响最为显著及估计影响程度。 二、方差分析的有关术语和概念 1.试验结果:在一项试验中用来衡量试验效果的特征量,也称试验指100
101 标或指标,类似函数的因变量或者目标函数。 2.试验因素:试验中,凡是对试验指标可能产生影响的原因都称为因素,或称为因子,类似函数的自变量。试验中需要考察的因素称为试验因素,简称为因素。一般用大写字母A 、B 、C 、……表示。方差分析的目的就是分析实验因素对实验或抽样的结果有无显著影响。如果在实验中变化的因素只有一个,这时的方差分析称为单因素方差分析;如果在实验中变化的因素不止一个,这时的方差分析就称为多因素方差分析。 3.因素水平:因素在试验中所处的各种状态或者所取的不同值,称为该因素的水平,简称水平。一般用下标区分。同样因素水平有时可以取得具体的数量值,有时只能取到定性值(如好,中,差等)。 4.交互作用:当方差分析过程中的影响因素不唯一时,这种多个因素的不同水平的组合对指标的影响称为因素间的交互作用。 三、方差分析的基本原理 (一)方差分解原理 一般地,试验结果的差异性可由离差平方和表示,离差平方和又可分解为组间方差与组内方差。其中,组间方差为因素对试验结果的影响的加总;组内方差则是各组内的随机影响的加总。如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因素是引起波动的主要原因,则认为因素对试验的结果存在显著的影响;否则认为波动主要来自组内方差,即因素对试验结果的影响不显著。 (二)检验统计量 检验因素影响是否显著的统计量是F 统计量: 组内方差的自由度 组内方差组间方差的自由度 组间方差// F
生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?
生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计
课本 一,1,统计推断结论都存在出错的可能性,所有的统计结论总是和概率相关系的结论。2,统计分析步骤:根据研究的问题做出研究设计、、根据上述设计手机样本数据、、整理数据资料统计描述、、统计推断、、做统计结论、、结合专业作分析讨论。 3,影响抽样误差大小的因素:样本含量的大小、总体被研究标志的变异程度、抽样的组织方式、抽样方法。 4,常见的抽样方法有单纯随机抽样,机械抽样,分层随机抽样,整群随机抽样。 5,代表总体特征的统计指标称为参数 6,人们把所需要研究的同质对象的全体称为总体 7,从总体中抽出来用以推测总体的部分对象称为样本 二,1,体育统计资料的来源主要有两个方面:常规性资料、、专题性资料。 2,体育统计可分为全面调查和非全面调查,非全面调查又分为抽样调查和典型调查,。体育统计常用的是抽样调查。 3,变量按取值情况可分为离散变量和连续性变量,按性质可分为定类变量、定序变量、定距变量和定比变量。 4,收集资料时应注意的问题:第一:保证资料的完整性、有效性和可靠性;第二:保证样本的代表性。 5,连续型变量频数分布表的编制步骤如下:求全距、、、确定组数和组距、、、确定组限、、、列频数分布表并划记。 三,1,反映集中趋势的数称为集中量数。2,算数平均数是所有的观察总和除以总额说所得之商,简称为平均数或均数。算数平均数是反映同质对象观察值的平均水平与集中趋势的统计量。· 3,反映集中趋势的数称为集中量数。 4.中位数是将数依据数值大小顺序排列后,位于序列中央位置的数,用★表示。偶数,则中间两个的平均数是中位数。 5,标准差是带有与原观察值相同单位的名数。它对两种不同或相同而两个平均数相差较大的资料,都无法比较差异的大小,必须用变异系数进行比较。所谓变异系数是指标准差与平均数的百分比 6,★ 四.1在一定条件下可能发生的可能不发生的现象成为随机现象。对于随机现象的一次观察可以看作一次实验,这样的实验成为随机实验。 2如果事件A发生的可能性的大小可以用一个常数P来表示,则P称为随机事件A在该试验条件下的概率。记作P(A)=P。事件A 的概率取值范围为[0,1]。 3一般正态曲线有如下性质:(1)分布曲线位于X轴的上方,即f(x)>0;(2)分布曲线以μ和σ为正态参数;(3)x的取值范围是整个X轴;(4)曲线与X轴之间的面积为1。 4我们将μ=0,σ=1的正态分布称为标准正态分布,∷∷∷∷∷∷∷∷ 以0为均数,以1为标准差的标准正态分布记为μ~N(0,1)。 5标准正态分布下几个常用的概率:P(-1.96<μ<1.96)=0.9500 P(-2.58<μ<2.58)=0.9902;P(-3<μ<3)=0.9974。 6例题已知x~N(μ,σ2)求: P(μ-σ 1) 46当极端数据出现时,宜采用(中位数)反 映该数列的集中趋势 47在正态分布的曲线 生物统计学考试题及答案 重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96 考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128 体育统计学 名词解释 1、回归、回归直线(第九章: 回归分析) 2、指标、因素、水平(第七章: 方差分析) 3、相关分析线性相关系数正相关负相关(相关分析) 4、随机误差系统误差抽样误差点估计区间估计假设检验第I类错误第二类错误小概率事件原理(第六章统计推断) 5、中位数众数集中位置量数离中位置量数极差四分位间距方差标准差变异系数(第三章样本特征数) 6、简单随机抽样分层抽样整群抽样(第二章统计资料的收集与整理) 7、描述性统计推断性统计体育统计总体随机样本(第一章绪论) 简答题 1、 2、 3、简述相关分析与回归分析的联系与区别(第九章回归分析)简述为什么要进行相关系数的检验(第八章相关分析)简述在什么条件下必须对平均数进行多重比较(第七章方差分析) 4、 5、简述方差分析应用的前提条件(第七章方差分析) 简述假设检验中的两类错误(第六章统计推断) 6、 7、 8、 9、简述假设检验的基本步骤(第六章统计推断) 简述假设检验的基本思想(第六章统计推断) 简述常用的几种统一变量单位的方法(第五章正态分布)正态分布曲线有哪些性质(第五章正态分布) 10、常用的抽样方法有几种(第二章统计资料的收集与整理) 11、体育统计工作的基本过程有哪三个步骤?每步工作的主要任务是什么?(第一章绪论) 12、假设检验时,当P比0.05小时,则拒绝H0,理论依据是什么?(第六章统计推断) 13、对称分布在“平均值±1.96标准差”的范围内,也包括95%的观察值吗?(第三章样本特征数) 14、试述极差、四分间距、标准差及变异系数的适用范围?(第三章样本特征数) 15、同一资料的标准差是否一定小于均数?(第三章样本特征数) 16、某年级甲班、乙班各有男生50人。从两个班各抽取10人测量其身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?(第一章绪论)判断题 1、两变量间的关系越密切,其相关系数r值越大.(错误)第八章相关分析 2、样本均数的标准误越小,则对总体均数的估计越精确(正确) 3、对同一参数的估计,99%置信区间比90%置信区间好。(错误) 方差分析的原理 (1)方差分析的概念 方差分析的目的是推断多组资料的总体均数是否相同,也即检验多组数据之间的均数差异是否有统计意义。当我们用多个t 检验来完成这一过程时,相当于从t 分布中随机抽取多个t 值,这样落在临界范围之外的可能大大增加,从而增加了Ⅰ型错误的概率。我们可以把方差分析看作t 检验的增强版。 (2)方差的可分解性 方差分析依据的基本原理就是方差的可加性原则。作为一种统计方法,方差分析把实验数据的总变异分解为若干个不同来源的分量。数据的变异由两部分组成: 组内变异:由于实验中一些希望加以控制的非实验因素和一些未被有效控制的未知因素造成的变异,如个体差异、随机误差 组内变异是具体某一个处理水平之内的,因此在对总体变异进行估计的时候不涉及研究的处理效应。 组间差异:不仅包括组内变异的误差因素,还包括了是不同组所接受的实验处理不同造成的影响 如果研究数据的总变异是由处理效应造成的,那么组间变异在总变异中应该占较大比例。 B M S 表示组间方差,B B B SS M S df =,1B df k =-,k 表示实验条件的个数 W M S 表示组内方差,W W W SS M S df =,()1W df k n =-,n 表示每种实验条件中的被试个数 (3)方差分析的基本假定 ①样本必须来自正态分布的总体 ②每次观察得到的几组数据必须彼此独立 ③各实验处理内的方差应彼此无显著差异 为了满足这一假定,我们可采用最大F 比率法2m ax m ax 2m in s F s ,求出各样本中方差最 大值与最小值的比,通过查表判断。 文章来源:博仁教育 统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x 研究生《生物统计学》课程 第五讲方差分析 主要内容: 一、单因素方差分析 二、两因素方差分析 三、多因素方差分析 一、单因素方差分析[Analyze]=>[Compare Means]=>[ One-Way ANOVA] 1、案例分析:某水产研究所比较四种饲料对鱼的饲喂效果 (1)建立数据文件,在Variable Vew中定义变量“饲料”、“增重”,“饲料”小数位数为0,用1、2、3、4分别代表甲、乙、丙、丁4种饲料。输入数据。 (2)方差分析:[Analyze]=>[Compare Means]=>[ One-Way ANOVA],打开[One-Way ANOVA]主对话框。选定“增重”使之进入[Dependent List](样本观测值)框,选定“饲料”使之进入[Factor](因素)框 (3)单击[Options]进入“选项”对话框,选择[Descriptive]要求输出描述统计量, [Homogeneity of Variance tese](方差齐性检验),[Continue]返回; (4)单击[Post Hoc]打开[One-Way ANOVA: Post Hoc Multiple Comparisions](单因素方差分析:验后多重比较)对话框,可选择确定多重比较方法,如LSD法、Duncan 法,[Continue]返回; (5)单击[OK],运行单因素方差分析。 结果显示:方差分析表: (P=0.005<0.01 不同饲料对鱼增重的作用差异极显著) 多重比较:LSD法 (解释:甲与其他三种饲料都具有显著差异,乙、丙、丁间差异不显著) Duncan法 、总体参数:在统计学中,反映总体地一些数量特征称为总体参数 样本统计量:由样本所获得地一些数量特征称为样本统计量 随机事件:在一定地实验条件下,有可能发生也有可能不发生地事件为随机事件 集中位置量数:反映一群性质相同地观察地平均水平或集中趋势地统计指标 、频数:是将数据资料按一定顺序分成若干组,并数出各组中所含有地数据. 统计推断: 抽样误差:抽出地样本统计量与总体参数间地偏差,立要由于个体间地差异所造成. 相对数:相对数也称为相对指标,是两个有联系地指标地比率,它可以从数量上反映两个相互联系地事物(或现象)之间地对比关系. 文档来自于网络搜索 假设检验:在实际检验过程中,主要地问题是要判定被检验地统计量之间地偏差是由抽样误差造成地,还是由于总体参数不同所造成地,要作出判断就需要对总体先建立某种假设,然后通过统计量地计算及概率判断,对所建立地假设是否成立进行检验.这类方法称为假设检验. 文档来自于网络搜索 平均数:反映一群性质相同地观察值地平均水平或集中趋势地统计指标 、变异系数:也是反映变量离散程度地统计指标,它是以样本标准差与平均数地百分数来表示地!记作:、总体与样本:文档来自于网络搜索 离中位置量数:描述一群性质相同值地离散程度地统计指标、抽样:指在总体中抽取一定含量地样本 、系统误差:宏观世界是由实验对象本身地条件,或者仪器不准,场地品格出现故障,训练方法,手段不同所造成地,可使测试结果杨倾向性偏大或偏小. 文档来自于网络搜索 、结构相对数:是在分组基础上,以各个分组全计数值与总值对比地相对数. 、或:指检验水准称小概率水平、中位数:将样本地观察值按其数值大小顺序排列起来,处于中间位置地那个数值就是中位数,中位数通常用表示,它处于频数分配地中点,不受极端数值地影响. 、组距:组距指地是组与组之间地区间长度.文档来自于网络搜索 二、填空题. 、和在统计学中称为(小概率水平)、抽样误差是由于(个体间地差异)造成地. 、标准误差是反映(数据地离散程度)地指标. 、(随机变量)用来度量随机事件地可能性大小. 、(算术)平均数量是最简单最常用最有效地统计量. 、由样本所获得地数量特征称为样本统计量,反映总体地一些数量特征称为(总体参数)、标准误是反映(度量抽样误差大小)地指标. 、在资料地收集过程中,一般要求(资料地准确性)(资料地齐同性)和(资料地随机性). 、在一组观察值中,最大值与最小值之差叫(极差). 、表示集中位置地指标主要有(中位数)(众数)(平均数). 文档来自于网络搜索 单项选择题. 、以下适合描述定量资料,离散趋势地指标是()、均数、标准差、方差、极差、标准差、中位数、中位数、均数、变异系数、标准差、变异系数文档来自于网络搜索 下列关于标准差地说法中错误地是()、标准差一定大于. 、标准差和方差属于描述变异程度地同类指标、同一资料和标准差一定小于均数、标准差常用于描述正态公布资料地变异程度.文档来自于网络搜索 进行假设检验地目地是()、判断样本统计量地差异仅仅是抽样引起地还是样本与总体原本就不同、由样本统计量估计总体参数、确定发生该观察结果地概率、计算统计文档来自于网络搜索 抽样误差原因是()、观察对象不纯、资料不是正态分布、个体差异、随机方法错误 《管理统计学》导学资料六——2χ检验和方差分析这一讲的内容包括两个部分开平方检验和方差分析,重点是方差分析,在本章的学习 χ检验的作用和用途。学会和掌握方差分析表的使用,中,同学们要了解方差分析的用途,2 了解自由度的计算和F检验的作用,记住方差分析表中的五个等式和含义。 本章的关键术语: 方差分析(Analysis of Variance, 常简称为ANOV A)是用来检验两个以上样本的均值差异的显著程度,由此判断样本究竟是否抽自具有同一均值总体的方法。 SST-总离差方和(Sum of Square in Total )为各样本观察值与总均值的离差平方和。 SSTR-组间离差方和(Sum of Square Treatment)表示不同的样本组之间,由于因素取不同的水平所产生的离差平方和。 SSE-组内离差方和(Sum of Square Error)表示同一样本组内,由于随机因素影响所产生的离差平方和,简称为组内离差平方和。 本章学完后,你应当能够: 1、掌握用2χ检验来解决独立性检验和拟合性检验的原理和基本方法,能解决最常见的这类检验问题。 2、了解和懂得单因素方差分析的原理和基本方法,能应用计算机解决最常见的方差分析问题。 一、2χ检验 2 χ检验的用途是检验两个变量之间的独立性和检验数据是否服从某个概率分布得拟合检验。 我们经常会遇到受两个或两个以上因素(变量)影响的实验或观察数据,并要求判断两个变量之间是否存在相互联系的问题。如果两个变量之间没有联系则称作是独立的,否则就是不独立的。 χ分布可以检验两个变量之间的独立性问题。此时我们首先将研究对象的观察用2 数据按两个变量分别进行分类。。例如,按行对第一个变量进行分类,按列对第二个变量进行分类。按这种方法把所有的试验观察数据排列成的表称为列联表。 2 χ独立性检验的程序和前面介绍的参数假设检验一样,首先也要建立假设,然后 χ,再根据问计算检验统计量的值。这次采用的检验统计这次采用的检验统计量就是2 χ分布表,得到当原假设成立时检验统计量允许的最大临界题规定的显著性水平查2 χ值作比较,得出接受或拒绝原假设的结论。具体步骤如下: 值,与计算所得的2 1.提出假设 H:两个变量是独立的,即相互之间没有影响, 第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(生物统计学考试题及答案
生物统计学考试试卷及答案
体育统计学资料(1)
方差分析的原理
生物统计学期末复习题
生物统计上机操作第五讲 方差分析
体育统计学参考资料
检验和方差分析的原理和基本方法
生物统计学期末复习题库及答案