文档库 最新最全的文档下载
当前位置:文档库 › 生物统计学第六章

生物统计学第六章

生物统计学第六章
生物统计学第六章

第六章参数估计

6.1以每天每千克体重52 μmol 5-羟色胺处理家兔 14天后,对血液中血清素含量的影响如下表[9]:

y/(μg · L-1)s/(μg · L-1)n

建立对照组和5-羟色胺处理组平均数差的0.95置信限。

答:程序如下:

options nodate;

data common;

alpha=0.05;

input n1 m1 s1 n2 m2 s2;

dfa=n1-1; dfb=n2-1;

vara=s1**2; varb=s2**2;

if vara>varb then F=vara/varb;

else F=varb/vara;

if vara>varb then Futailp=1-probf(F,dfa,dfb);

else Futailp=1-probf(F,dfb,dfa);

df=n1+n2-2;

t=tinv(1-alpha/2,df);

d=abs(m1-m2);

lcldmseq=d-t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1 /n2));

ucldmseq=d+t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1 /n2));

k=vara/n1/(vara/n1+varb/n2);

df0=1/(k**2/dfa+(1-K)**2/dfb);

t0=tinv(1-alpha/2,df0);

lcldmsun=d-t0*sqrt(vara/n1+varb/n2);

ucldmsun=d+t0*sqrt(vara/n1+varb/n2);

cards;

12 4.20 0.35 9 8.49 0.37

;

proc print;

id f;

var Futailp alpha lcldmseq ucldmseq lcldmsun ucldmsun;

title1 'Confidence Limits on the Difference of Means';

title2 'for Non-Primal Data';

run;

结果见下表:

Confidence Limits on the Difference of Means

for Non-Primal Data

F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

1.11755 0.42066 0.05 3.95907 4.62093 3.95336 4.62664

首先,方差是具齐性的。在方差具齐性的情况下,平均数差的0.95置信下限为3.959 07,置信上限为4.620 93。0.95置信区间为3.959 07 ~ 4.620 93。

6.2不同年龄的雄岩羊角角基端距如下表[27]:

年龄/a y/cm s/cm n

建立平均数差的0.95置信区间,对应于H0:μ1-μ2=0,H A:μ1-μ 2 ≠ 0的假设,推断两者间的差异显著性。

答:结果如下:

Confidence Limits on the Difference of Means

for Non-Primal Data

F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

1.26433 0.34528 0.05 0.93873 4.84127 0.90910 4.87090

因为方差具齐性,所以平均数差的0.95置信区间为:0.938 73 ~ 4.841 27。置信区间内不包括0,因此两者间的差异是显著的。

6.3了解我国风险识别、风险评价和风险缓解的现状,对于应对突发事件有重要作用。以下是关于应对突发公共卫生事件能力调查(共调查了60个单位)的部分数据[28]:

6

作重点

分别计算上述三个项目的0.95置信区间。

答:程序如下:

options nodate;

data clbi;

n=60; m=35; p=m/n; alpha=0.05;

do lphi=0.0001 to p by 0.00001;

ltailp=1-probbnml(lphi,n,m-1);

if abs(ltailp-alpha/2)<0.00001 then goto lower;

end;

lower:put m n p ltailp lphi;

do uphi=p to 0.9999 by 0.00001;

utailp=probbnml(uphi,n,m);

if abs(utailp-alpha/2)<0.00001 then goto upper;

end;

upper:put m n p utailp uphi;

proc print;

id m;

var n p ltailp utailp lphi uphi;

title 'Confidence Limits for Binomial Population';

run;

结果如下:

项目(1):

Confidence Limits for Binomial Population

M N P LTAILP UTAILP LPHI UPHI

35 60 0.58333 0.024993 0.025006 0.44883 0.70931

项目(2):

Confidence Limits for Binomial Population

M N P LTAILP UTAILP LPHI UPHI

17 60 0.28333 0.024993 0.025002 0.1745 0.41443

项目(3):

Confidence Limits for Binomial Population

M N P LTAILP UTAILP LPHI UPHI

6 60 0.1 0.024996 0.025008 0.03759 0.20505

6.4乳腺癌患者有着沉重的心理负担,主要表现为:焦虑、怀疑和否认、恐惧、依赖、自私、悲观失望等。经心理护理后,在很多方面都到改善,护理前和

y )见下表[29]:

护理后的评分(s

表现心理护理前/评分心理护理后/评分样本含量(n)

计算上述各种表现平均数差的0.95置信区间。(注意方差不具齐性的情况。)答:结果见下表:

表现 F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

神经衰弱 2.42397 .00034969 0.05 1.74559 4.03441 1.74360 4.03640

6.5紫杉烷类物质具有优良的抗癌作用,近年来已成功地开发出紫杉烷类抗癌新药紫杉醇和多烯紫杉醇。由此也引起人们对药源植物云南红豆杉的关注,测定了紫杉烷类物质在不同类型云南红豆杉中的含量。下面给出其中的两种物质的测定结果[30]:

种类y/%s/%n

计算两种物质平均数差的0.95置信区间,并以H0:μ1-μ2=0,H A:μ1-μ 2 ≠ 0的假设推断两者间的差异显著性。

答:结果见下表:

Confidence Limits on the Difference of Means

for Non-Primal Data

F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

1.28444 0.037999 0.05 .00026156 .0021384 .00026152 .0021385

F的显著性概率P=0.037 999,P>0.025,方差具齐性。方差具齐性时的0.95置信区间为:0.000 261 56 ~ 0.002 138 4。在置信区间内不包括0,因此紫杉醇和三尖杉宁碱的含量差异显著。

6.6流行病学调查表明,高同型半胱氨酸(Homocysteine,Hcy)是导致动脉粥样硬化性血管病的一个新的独立危险因素。测定了脑梗死组和对照组的Hcy,结果(s

y )如下表[31]:

组别n Hcy/(μ

-1

计算两组平均数差的0.95置信区间,并解释所计算的结果。

答:结果如下:

Confidence Limits on the Difference of Means

for Non-Primal Data

F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

2.69346 .0000020008 0.05

3.92068 6.61932 3.93589 6.60411

可以很明显看出,方差是不具齐性的。0.95置信区间为:3.935 89 ~ 6.604 11。置信区间内不包含0,因此脑梗死病人的同型半胱氨酸显著高于对照组。高同型半胱氨酸很可能是动脉粥样硬化性血管病的危险因素之一。

6.7 30名受试者同时采取两份静脉血,分别用传统的魏氏法和自动血沉仪测定血沉[32],结果为分别:)h /mm (7266.0=魏氏法-血沉仪法y ,

)mm/h (5993.2=魏氏法-血沉仪法s 。在α = 0.05水平上,通过置信区间检验两种方法的差异显著性。

答:所用程序如下:

options nodate; data esr;

input n mean std ; alpha=0.05;

talpha=-tinv(alpha/2,n-1); lclm=mean-talpha*std/sqrt(n); uclm=mean+talpha*std/sqrt(n); cards;

30 0.2667 2.9935

;

proc print;

id n;

var mean std alpha lclm uclm ;

title1 'Confidence Limits for Mu';

title2 'Sigma Is Unknown';

run;

结果见下表:

Confidence Limits for Mu

Sigma Is Unknown

N MEAN STD ALPHA LCLM UCLM

30 0.2667 2.9935 0.05 -0.85109 1.38449

在置信区间内包含0,因此传统魏氏法和自动血沉仪法测得的结果差异不显著。

6.8生长激素缺乏症的患儿,在用生长激素治疗前和治疗6个月后的身高和体重数据如下表[33]:

治疗前

s y±治疗后

s

n

先用t检验,推断治疗前和治疗后的平均身高和平均体重在α= 0.05水平上的差异显著性,再用治疗前和治疗后的平均数差数的0.95置信区间验证。你认为这是一种很好的实验设计吗?怎样做检验的效果可能会更好?

答:1. 先做成组数据t检验:

(1)身高:

T-Test for Non-Primal Data

F FUTAILP T DF TUTAILP

1.17361 0.36536 1.51668 38.0000 0.068812

1.17361 0.36536 1.51668 37.7591 0.068838

(2)体重:

T-Test for Non-Primal Data

F FUTAILP T DF TUTAILP

3.82025 .0026673 3.05542 38.0000 .0020482

3.82025 .0026673 3.05542 28.3091 .0024304

2. 计算置信区间:

(1)身高:

Confidence Limits on the Difference of Means

for Non-Primal Data

F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

1.17361 0.36536 0.05 -

2.0085214.0085 -2.01020 14.0102

(2)体重:

Confidence Limits on the Difference of Means

for Non-Primal Data

F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN

3.82025 .0026673 0.05 1.11356 5.48644 1.088715.51129

根据问题的要求,本例的t检验应为双侧检验,当t的显著性概率小于0.025时拒绝H0。检验的结果,身高治疗前后的差异不显著。从置信区间计算的结果,可以看出,身高的置信区间包含0,因此身高的差异不显著,体重的置信区间不包含0,因此体重的差异显著。统计假设检验与置信区间得到的结果是一致的。

另外,本例的实验设计是配对设计,但在处理数据时,作者按成组设计计算的,虽不能算是错误,但减低了检验效率。

6.9血小板可能是冠心病(CHD)血栓形成的关键因素。一项研究,测定了92例CHD患者血小板的一些相关指标,结果如下[34]:123456

y )0.95置信区间

项目结果(s

8.50±1.80 8.127 23 8.872 77

L-PLT⑥/

(109·L-1)

注:①PLT:血小板数。

②MPV:平均血小板体积。

③PDW:血小板分布宽度。

④MPC:平均血小板内容物浓度。

⑤MPM:平均血小板内容物含量。

⑥L-PTL:大血小板

将表中各个项目的0.95置信区间填入表中。

答:所用程序如下:

options nodate;

data chd;

input n mean std ;

alpha=0.05;

talpha=-tinv(alpha/2,n-1);

lclm=mean-talpha*std/sqrt(n);

uclm=mean+talpha*std/sqrt(n);

cards;

92 177 49

;

proc print;

id n;

var mean std alpha lclm uclm ;

title1 'Confidence Limits for Mu';

title2 'Sigma Is Unknown and Non-primal Data';

run;

更换项目时,只要将CARDS语句后的数据行,更改为相应的数据即可。

6.10同型半胱氨酸(Hcy)含量可能与心脑血管疾病、慢性肾病、糖尿病以及神经精神疾病等都有关系,下面给出了抑郁症患者在治疗前和治疗后Hcy的含量[35]:

n -1

推断治疗前和治疗后个体间变异的0.95置信区间,根据置信区间推断个体间变异的显著性。

答:所使用的程序如下:

options nodate;

data clrs;

input n1 s1 n2 s2 @@;

alpha=0.05;

dfa=n1-1; dfb=n2-1;

vara=s1**2; varb=s2**2;

F=vara/varb; sqrtf=sqrt(f);

uf=finv(1-alpha/2,dfa,dfb);

lf=finv(alpha/2,dfa,dfb);

uclrs=sqrt(f/lf); lclrs=sqrt(f/uf);

cards;

18 8.36 18 6.68

;

proc print;

id dfa;

var dfb vara varb sqrtF lclrs uclrs ;

title 'Confidence Limits on the Ratio of two sigmas';

run;

结果见下表:

Confidence Limits on the Ratio of two sigmas

DFA DFB VARA VARB SQRTF LCLRS UCLRS

17 17 69.8896 44.6224 1.25150 0.76543 2.04623在置信区间内包含1,因此个体间变异的程度差异不显著。

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

生物统计学答案 第一章 统计数据的收集与整理

第一章 统计数据的收集与整理 1.1 算术平均数是怎样计算的?为什么要计算平均数? 答:算数平均数由下式计算:,含义为将全部观测值相加再被观测值的个数 除,所得之商称为算术平均数。计算算数平均数的目的,是用平均数表示样本数据的集中点, 或是说是样本数据的代表。 1.2 既然方差和标准差都是衡量数据变异程度的,有了方差为什么还要计算标准差? 答:标准差的单位与数据的原始单位一致,能更直观地反映数据地离散程度。 1.3 标准差是描述数据变异程度的量,变异系数也是描述数据变异程度的量,两者之间有什么不同? 答:变异系数可以说是用平均数标准化了的标准差。在比较两个平均数不同的样本时所得结果更可靠。 1.4 完整地描述一组数据需要哪几个特征数? 答:平均数、标准差、偏斜度和峭度。 1.5 下表是我国青年男子体重(kg )。由于测量精度的要求,从表面上看像是离散型数据,不要忘记,体重是通过度量得到的,属于连续型数据。根据表中所给出的数据编制频数分布表。 66 69 64 65 64 66 68 65 62 64 69 61 61 68 66 57 66 69 66 65 70 64 58 67 66 66 67 66 66 62 66 66 64 62 62 65 64 65 66 72 60 66 65 61 61 66 67 62 65 65 61 64 62 64 65 62 65 68 68 65 67 68 62 63 70 65 64 65 62 66 62 63 68 65 68 57 67 66 68 63 64 66 68 64 63 60 64 69 65 66 67 67 67 65 67 67 66 68 64 67 59 66 65 63 56 66 63 63 66 67 63 70 67 70 62 64 72 69 67 67 66 68 64 65 71 61 63 61 64 64 67 69 70 66 64 65 64 63 70 64 62 69 70 68 65 63 65 66 64 68 69 65 63 67 63 70 65 68 67 69 66 65 67 66 74 64 69 65 64 65 65 68 67 65 65 66 67 72 65 67 62 67 71 69 65 65 75 62 69 68 68 65 63 66 66 65 62 61 68 65 64 67 66 64 60 61 68 67 63 59 65 60 64 63 69 62 71 69 60 63 59 67 61 68 69 66 64 69 65 68 67 64 64 66 69 73 68 60 60 63 38 62 67 65 65 69 65 67 65 72 66 67 64 61 64 66 63 63 66 66 66 63 65 63 67 68 66 62 63 61 66 61 63 68 65 66 69 64 66 70 69 70 63 64 65 64 67 67 65 66 62 61 65 65 60 63 65 62 66 64 答:首先建立一个外部数据文件,名称和路径为:E:\data\exer1-5e.dat 。所用的SAS 程序和计算结果如下: proc format; value hfmt 56-57='56-57' 58-59='58-59' 60-61='60-61' 62-63='62-63' 64-65='64-65' 66-67='66-67' 68-69='68-69' 70-71='70-71' 72-73='72-73' 74-75='74-75'; run; n y y n i i ∑== 1

生物统计学答案 第八章 单因素方差分析

第八章单因素方差分析 8.1黄花蒿中所含的青蒿素是当前抗疟首选药物,研究不同播期对黄花蒿种子产量的影响,试验采用完全随机化设计,得到以下结果(kg/小区)[47]: 重复2月19日3月9 3月28日4月13日 日 1 0.26 0.14 0.1 2 0.03 2 0.49 0.24 0.11 0.02 3 0.36 0.21 0.15 0.04 对上述结果做方差分析。 答:所用程序及结果如下: options linesize=76 nodate; data mugwort; do date=1 to 4; do repetit=1 to 3; input yield @@; output; end; end; cards; 0.26 0.49 0.36 0.14 0.24 0.21 0.12 0.11 0.15 0.03 0.02 0.04 ; run; proc anova; class date; model yield=date; means date/duncan; run; One-Way ANOVA Analysis of Variance Procedure Class Level Information Class Levels Values DATE 4 1 2 3 4 Number of observations in data set = 12 One-Way ANOVA Analysis of Variance Procedure Dependent Variable: YIELD Sum of Mean Source DF Squares Square F Value Pr > F Model 3 0.18515833 0.06171944 14.99 0.0012 Error 8 0.03293333 0.00411667 Corrected Total 11 0.21809167

生物统计学习题(1)

第一章绪论 一、填空 1 变量按其性质可以分为___变量和_____变量。 2 样本统计数是总体__估计量。 3 生物统计学是研究生命过程中以样本来推断__ __的一门学科。 4 生物统计学的基本内容包括_、----两大部分。 5 统计学的发展过程经历了_ _3个阶段。 6 生物学研究中,一般将样本容量_n大于等于30_称为大样本。 7 试验误差可以分为__ _两类。 二、判断 (-)1 对于有限总体不必用统计推断方法。 (- )2 资料的精确性高,其准确性也一定高。 ( + ) 3 在试验设计中,随机误差只能减少,而不可能完全消除。(- )4 统计学上的试验误差,通常指随机误差。 第二章试验资料的整理与特征数的计算 一、填空 1 资料按生物的性状特征可分为_ _变量和__变量。 2 直方图适合于表示__ _资料的次数分布。

3 变量的分布具有两个明显基本特征,即_和__ _。 4 反映变量集中性的特征数是_____ __,反映变量离散性的特征数是__ _。 5 样本标准差的计算公式s=__√∑(x-x横杆)平方/(n-1)_____。 二、判断 ( - ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。 ( - ) 2 条形图和多边形图均适合于表示计数资料的次数分布。(+)3 离均差平方和为最小。 (+ )4 资料中出现最多的那个观测值或最多一组的中点值,称为众数。 (- )5 变异系数是样本变量的绝对变异量。 四、单项选择 1 下面变量中属于非连续性变量的是_____。 A 身高 B 体重 C 血型 D 血压 2 对某鱼塘不同年龄鱼的尾数进行统计分析时,可做成__ _图来表示。 A 条形图 B 直方图 C 多边形图 D 折线图 3 关于平均数,下列说法正确的是__ __。 A 正态分布的算术均数与几何平均数相等 B 正态分布的算术平均数与中位数相等 C 正态分布的中位数与几何平均数相等

生物统计学

生物统计学

————————————————————————————————作者: ————————————————————————————————日期:

第七章回归分析 第一节回归和相关的概念 方差分析检验一个或多个因子对某一生物变量是否有影响,只涉及一种变量。两个以上变量之间的定量关系的统计分析需要回归分析来解决。在自然界,两个或多个变量相互制约、相互依存的现象很常见。 变量间的关系一般分为两种:一种是因果关系,即一个变量的变化受另一个变量或几个变量的制约,如微生物的繁殖速度受温度、湿度、光照等因素的影响,子女的身高是受着父母身高的影响;另一种是平行关系,即两个以上变量之间共同受到另外因素的影响,如人的身高与体重之间的关系,兄弟身高之间的关系等都属于平行关系。 设有两个随机变量X和Y,如果变量X的每一个可能的值,都有随机变量Y的一个分布相对应,则称随机变量Y对变量X存在回归(Regression)。 X也是随机变量时,X和Y相互存在回归关系,这两个随机变量间就存在相关(Correlation)关系。在实际应用中,并不严格区分相关和回归。 在回归和相关分析中,必然注意下面一些问题,以避免统计方法的误用。 (1)变量间是否存在相关以及在什么条件下会发生什么相关等问题,都必须由各具体学科本身来决定。回归和相关只能作为一种统计分析手段,帮助认识和解释事物的客观规律,决不能把风马牛不相及的资料凑到一起进行分析; (2)由于自然界各种事物间的相互联系和相互制约,一个变量的变化通常会受到许多其他变量的影响,因此,在研究两个变量之间的关系时,要求其余变量尽量保持在同一水平,否则,回归和相关分析就可能会导致不可靠甚至完全虚假的结果。例如人的身高和胸围之间的关系,如果体重固定,身高越高的人,胸围一定较小,当体重在变化时,其结果就会相反; (3)在进行回归与相关分析时,两个变量成对观测值应尽可能多一些,这样可提高分析的准确性,一般至少有5对以上的观测值。同时变量x的取值范围要尽可能大一些,这样才容易发现两个变量间的回归关系; (4)回归与相关分析一般是在变量一定取值区间内对两个变量间的关系进行描述,超出这个区间,变量间的关系类型可能会发生改变,所以回归预测必须限制自变量Y的取值区间,外推要谨慎,否则会得出错误的结果。 第二节一元线性回归 研究两个随机变量的关系时首先要收集成对数据。 7.1研究土壤中NaCl的含量对植物单位叶面积物质干重的影响时,收集到如下成对数据。问二者的回归关系如何? NaCl的含量0.00.8 1.6 2.4 3.2 4.0 4.8 单位叶面积干重80 90 95 1 根据数据作散点图,分析:1. X与Y的关系密切否?2.线性还是曲线关系?3. 有无偏

生物统计学最新名词解释

第一章绪论与第二章概率论基础 1总体:指研究对象的全体,它是由研究对象中的所有单元组成的。总体中包含单 元的数目称作总体容量(或大小)用 N 表示。 2个体: 3样本:是指按照抽样规则所抽中的那部分单元所组成的集合。 4样本含量:样本所包含的单位数用 n 表示,称为样本含量。 5随机样本:总体是唯一的、确定的,而样本是不确定的、可变的、随机的。 6参数:反映总体数量特征的综合指标称为总体参数。常见的总体参数主要有:总 体总和;总体均值;总体比率;总体比例等。 7统计量:反映样本数量特征的综合指标称之为统计量。统计量是n元样本的一个 实值函数,是一个随机变量,统计量的一个具体取值即为统计值。主要样本统计量有:样本总和、样本均值、样本比率、样本比例等。 8准确性 9精确性 10必然现象 11随机现象:带有随机性、偶然性的现象. 12随机试验:如果每次试验的可能结果不止一个,且事先不能肯定会出现哪一个结果,这样的试验称为随机试验. 13随机事件:在一次试验中可能发生也可能不发生的事件称为随机事件,简称事件.

14概率的统计定义:验后概率,在相同条件下随机试验n次,某事件A出现m次(m ) , 则比值称为事件 A 发生频率。 15小概率原理 16随机变量:在随机试验中所得到的取值具有随机性的量,称为随机变量。 17 离散型随机变量:所有取值可以逐个一一列举 18连续型随机变量:全部可能取值不仅无穷多,而且还不能一一列举,而是充满一个区间. 19标准正态分布: μ=0,σ=0的正态分布 20标准正态变量 21双侧概率(两尾概率):把随机变量X落在平均数μ加减不同倍数标准差σ区间之外的概率称为两尾概率,记做α。 22单侧概率(一尾概率):随机变量X小于μ-kσ或者大于μ+kσ的概率,称为一尾概率,记做α/2. 23贝努利试验:二项试验,满足下列条件:一次试验只有两个可能结果,即“成功”和“失败”,“成功”是指我们感兴趣的某种特征;试验是相互独立的,并可以重复进行n次,在n次试验中,“成功”的次数对应一个离散型随机变量X。 24返回抽样 25不返回抽样 26标准误:平均数抽样总体的标准差,标准误的大小反映样本平均数y的抽样误差的大小,即精确性的高低。 27样本平均数的抽样总体:样本平均数的集合构成的一个新总体,

生物统计学期末复习题库及答案

生物统计学期末复习题 库及答案 https://www.wendangku.net/doc/ff16532349.html,work Information Technology Company.2020YEAR

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 122--∑∑n n x x )(

判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1.下列变量中属于非连续性变量的是( C ). A.身高 B.体重 C.血型 D.血压 2.对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A.条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A.正态分布的算术平均数和几何平均数相等. B.正态分布的算术平均数和中位数相等. C.正态分布的中位数和几何平均数相等. D.正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a,其标准差(D)。 A.扩大√a倍 B.扩大a倍 C.扩大a2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是(C)。 A.标准差 B.方差 C.变异系数 D.平均数 第三章 填空

生物统计学

第一章概论 一、什么是生物统计学?生物统计学主要内容和作用? 1、生物统计学是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。属于生物数学的范畴 2、主要内容 基本原则对比设计 试验设计方案制定随机区组设计 常用试验设计方法裂区设计 资料的搜集和整理拉丁方设计、正交设计 统计分析数据特征数的计算 统计推断、方差分析 协方差分析、回归和相关分析 3、生物统计学的基本作用: (1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征 (2)运用显著检验,判断试验结果的可靠性或可行性 (3)提供由样本推断总体的方法 (4)提供试验设计的一些重要原则 二、解释概念:总体、个体、样本、变量、参数、统计数、效应、试验误差 总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全体; 个体:组成总体的基本单元称为个体 样本:从总体中抽出若干个体所构成的集合称为样本 变量:变量,或变数,指相同性质的事物间表现差异性或差异特征的数据 参数:描述总体特征的数量称为参数,也称参量

统计数:描述样本特征的数量称为统计数,也称统计量 效应:通过施加试验处理,引起试验差异的作用称为效应 试验误差:误差也称为实验误差,是指观测值偏离真值的差异,可分为随机误差和系 统误差 三、准确性与精确性有何区别? 准确性,也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近 的程度。精确性,也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼 此接近的程度。准确性反应测量值与真值符合程度的大小,而精确性则是反映多次测 定值的变异程度。(具体在课本第7页) 第二章样本统计量与次数分布 一、算数平均数与加权平均数形式上有何不同?为什么说它们的实质是一致的? 1. 算术平均数定义:总体或样本资料中所有观测数的总和除以观测数 的个数所得的商,简称平均数、均数或均值 直接计算法或减去(加上)常数法 加权平均数 2、实质是一样的,是因为它们都反映的一组数据的平均水平 二、为了评价两种药物对于小鼠体重的影响,随机从两组各抽出20只测定其体重(g),结果如下: 药物A处理组: 15, 15, 23, 24, 26, 25, 22, 19, 15, 17, 15, 20, 23, 21, 19, 22, 26, 21, 18, 23 药物B处理组: 31, 28, 26, 31, 28, 34, 32, 29, 32, 35, 28, 29, 33, 30, 34, 32, 36, 38, 40, 38

生物统计学习题

第一章绪论 一、名词解释 总体个体样本样本含量随机样本参数统计量准确性精确性 第二章资料的整理 一、名词解释 数量性状资料质量性状资料半定量(等级)资料计数资料计量资料 第三章平均数、标准差与变异系数 一、名词解释 算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数 二、简答题 1、生物统计中常用的平均数有几种?各在什么情况下应用? 2、算术平均数有哪些基本性质? 3、标准差有哪些特性? 三、应用题 计算下面两个玉米品种的10个果穗长度(cm)的平均数、标准差和变异系数,解释所得结果。 BS24:19 21 20 20 18 19 22 21 21 19 金皇后:16 21 24 15 26 18 20 19 22 19 四、计算题 1、10头母猪第一胎的产仔数分别为:9、8、7、10、1 2、10、11、14、8、9头。试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。 2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。试利用加权法计算其平均数、标准差与变异系数。 组别组中值(x)次数(f) 80—84 2 88—92 10

96— 100 29 104— 108 28 112— 116 20 120— 124 15 128— 132 13 136— 140 3 3、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、 4、4、4、 5、9、12(天)。试求潜伏期的中位数。 4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。 5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。试计算平均世代规模。 6、调查甲、乙两地某品种成年母水牛的体高(cm )如下表,试比较两地成年母水牛体高的变异程度。 甲地 137 133 130 128 127 119 136 132 乙地 128 130 129 130 131 132 129 130 第四章 常用概率分布 一、名词解释 随机事件 概率的统计定义 小概率原理 正态分布 标准正态分布 双侧概率(两尾概率) 单侧概率(一尾概率) 二项分布 波松分布 标准误 二、简答题 1、事件的概率具有那些基本性质? 2、正态分布的密度曲线有何特点? 3、标准误与标准差有何联系与区别? 4、样本平均数抽样总体与原始总体的两个参数间有何联系? 三、计算题 1、 已知随机变量u 服从 N(0,1),求P(u <-1.4), P(u ≥1.49), P (|u |≥2.58), P(-1.21≤u <0.45),并作图示意。 2、已知随机变量u 服从N(0,1),求下列各式的αu 。 (1) P(u <-αu )+P(u ≥αu )=0.1;0.52 (2) P(-αu ≤u <αu )=0.42;0.95 3、猪血红蛋白含量x 服从正态分布N(12.86,1.332)

生物统计学第一章

《生物统计学》教案授课教师:陈彦云宁夏大学生命科学学院

教学内容与组织安排: 第一章绪论 讲述本章教学目标、概述 本课时主要内容摘要:生物统计学是数理统计学的原理和方法在生命科学领域的具体应用,它是运用统计的原理和方法对生物有机体开展调查和试验,目的是以样本的特征来估计总体的特征,对所研究的总体进行合理的推论,得到对客观事物本质和规律性的认识。生物统计学主要内容包括试验设计和统计分析两大部分,其作用主要有四个方面:提供整理、描述数据资料的可行方法并确定其数量特征;判断试验结果的可靠性;提供由样本推断总体的方法;提供试验设计的原则。生物体计学的发展概况及六组统计学常用术语。 重点内容:生物统计学的概念、内容及作用,常用术语。 第一节、生物统计学的概念及其重要性 统计学(Statistics)是把数学的语言引入具体的科学领域,把具体科学领域中要待研究的问题抽象为数学问题的过程,它是收集、分析、列示和解释数据的一门艺术和科学,目的是求得可靠的结果。它有许多分支,如工业统计、农业统计、卫生统计等等。 生物统计学是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法,分析、推断和解释生命过程中的各种现象和试验调查资料的科学。属于生物数学的范畴 第二节生物统计学的主要内容及作用 生物体计学主要内容包括试验设计和统计分析两大部分。 在试验设计中,主要介绍试验设计的有关概念、试验设计的基本原则,试验设计方案的制定,常用试验设计方法,其中主要有对比试验设计、随机区组设计、拉方设计,正交设计等;在统计分析中,主要包括数据资料的搜集与整理、数据特征数的计算、统计推断、方差分析、回归和相关分析等。 生物统计学的作用主要有四个方面: 1提供整理、描述数据资料的可行方法并确定其数量特征; 2判断试验结果的可靠性; 3提供油样本推断总体的方法; 4提供试验设计的一些重要原则。 第三节统计学的发展概况 由于人类的统计实践是随着计数活动而产生的,因此,统计发展史可以追溯到远古的原始社会,也就是说距今足有五千多年的漫长岁月。但是,能使人类的统计实践上升到理论上予以概括总结的程度,即开始成为一门系统的学科统计学,却是近代的事情,距今只有三百余年的短暂历史。统计学发展的概貌,大致可划分为古典记录统计

生物统计学教案(5)

生物统计学教案 第五章统计推断 教学时间:5学时 教学方法:课堂板书讲授 教学目的:重点掌握两个样本的差异显著性检验,掌握一个样本的差异显著性检验,了解二项分布的显著性检验。 讲授难点:一个、两个样本的差异显著性检验 统计假设检验:首先对总体参数提出一个假设,通过样本数据推断这个假设是否可以接受,如果可以接受,样本很可能抽自这个总体,否则拒绝该假设,样本抽自另外总体。 参数估计:通过样本统计量估计总体参数。 5.1 单个样本的统计假设检验 5.1.1 一般原理及两种类型的错误 例:已知动物体重服从正态分布N(μ,σ2),实验要求动物体重μ=10.00g。已知总体标准差σ=0.40g,总体平均数μ未知,为了得出对总体平均数μ的推断,以便决定是否接受这批动物,随机抽取含量为n的样本,通过样本平均数,推断μ。 1、假设: H 0: μ=μ 或H0: μ-μ0=0 H A : μ>μ μ<μ μ≠μ 三种情况中的一种。 本例的μ =10.00g,因此 H : μ=10.00 H A : μ>10.00或μ<10.00或μ≠10.00 2、小概率原理小概率的事件,在一次试验中几乎是不会发生的,若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而拒绝假设。 从动物群体中抽出含量为n的样本,计算样本平均数,假设该样本是从N(10.00,0.402)中抽取的,标准化的样本平均数

服从N (0,1)分布,可以从正态分布表中查出样本抽自平均数为μ的总体的概率,即 P (U >u ), P (U <-u ), 以及P (|U |>u )的概率。如果得到的值很小,则 x 抽自平均数 为μ0的总体的事件是一个小概率事件,它在一次试验中几乎是不会发生的,但实际上它发生了,说明假设的条件不正确,从而拒绝零假设,接受备择假设。 显著性检验:根据小概率原理建立起来的检验方法。 显著性水平:拒绝零假设时的概率值,记为α。通常采用α=0.05和α=0.01两个水平,当P < 0.05时称为差异显著,P < 0.01时称为差异极显著。 3、临界值 例 从上述动物群体中抽出含量n =10的样本,计算出 x =10.23g ,并已知 该批动物的总体平均数μ绝不会小于10.00g ,规定的显著水平α=0.05。根据以上条件进行统计推断。 H 0: μ=10.00 H A : μ>10.00 根据备择假设,为了得到x 落在上侧尾区的概率P (U > u ),将x 标准化,求 出u 值。 P (U >1.82)=0.03438,P < 0.05,拒绝H 0,接受 H A 。 在实际应用中,并不直接求出概率值,而是建立在α水平上H 0的拒绝域。从 正态分布上侧临界值表中查出P (U > u α)= α时的u α值,U > u α的区域称为在α水平上的H 0拒绝域,而U < u α的区域称为接受域。接受域的端点一般称为临界值。本例的u =1.82,从附表3可以查出u 0.05=1.645, u > u α,落在拒绝域内,拒绝H 0而接受H A 。 4、单侧检验和双侧检验 上尾单侧检验:上例中的H A :μ>μ0,相应的拒绝域为U > u α。对应于H A :μ>μ0时的检验称为上尾单侧检验。 下尾单侧检验:对应于H A :μ<μ0时的检验称为下尾单侧检验。 n x n x u 40 .000.100 -= -= σ μ82 .110 40 .000 .1023.100 =-= -= n x u σ μ

02078 生物统计学

高纲1023 江苏省高等教育自学考试大纲 02078生物统计学 江苏教育学院编 江苏省高等教育自学考试委员会办公室

一、课程性质及其设置目的与要求 (一)课程性质和特点 《生物统计学》是生物教育专业学生必修的一门专业课。它是一门理论性和实用性都较强的专业基础课。是一门收集、整理和分析统计数据的方法科学,其目的是探索数据的内在数量规律性。取得统计数据是进行统计分析的基础与前提,离开了统计数据,统计方法也就失去了用武之地。如何取得较为准确的统计数据是生物统计学研究的内容之一。统计数据的整理是数据收集与数据分析之间的一个必要环节,是通过对统计数据的加工处理使其系统化、条理化,符合统计分析的需要。统计数据的分析是生物统计学原理的核心内容,是通过统计描述和统计推断探索数据内在规律的过程。因此,生物统计学的内容体系包括描述统计(统计数据的收集、数据的整理与显示、数据分布特征的描述)、推断统计(概率与概率分布、抽样与参数估计、假设检验、方差分析、相关与回归)等几个部分。本门课程的目的主要是:培养学生合理地应用生物统计原理和方法对生物实验进行设计,对资料的整理和归纳,对数据进行处理和分析,推断生命活动规律性的能力,为胜任生物教学工作,打下坚实的基础。 (二)本课程的基本要求 本课程共分十二章。通过本课程的学习,要求应试者达到以下要求: 1、理论知识方面 ⑴了解生物统计学的基本原理。 ⑵弄清试验误差的概念、来源及其控制途径。 ⑶掌握试验设计的基本原则和常用设计方法的要点及特点。 ⑷掌握常用统计分析方法的意义、功用、应用条件,方法步骤与结果解释等基本知识。 2、技能技巧方面 ⑴根据所给试验条件,会正确选用试验设计方法,并做出试验设计。 ⑵对于试验资料,能够正确地进行初步整理,并能够选用适当的统计分析方法进行分析及对分析结果作出合理的解释。 (三)本课程与相关课程的关系 生物统计学是一门工具学科,是数理统计原理和方法在生物学中的具体应用。因此在学习本课程之前,学生应具备数理统计、计算机应用以及一定的专业基础或专业知识。 二、课程内容和考核目标 第一章统计数据的收集与整理 (一)课程内容 本章介绍了总体、抽样和样本等概念,介绍了数量资料表示的方式、数量资料的收集、数量资料的整理和样本特征数。 (二)学习要求 了解资料的整理方法与特征数的计算。 (三)考核要求 1、领会:不同类型数据资料的正确分别方法; 2、掌握:数据资料的表示方法。 3、熟练掌握:特征数的计算。

生物统计学(第四版)答案 1—6章

2.2试计算下列两个玉米品种10个果穗长度(cm)的标准差和变异系数,并解释所得结果。24号:19,21,20,20,18,19,22,21,21,19; 金皇后:16,21,24,15,26,18,20,19,22,19。 【答案】1=20,s1=1.247,CV1=6.235%;2=20,s2=3.400,CV2=17.0%。 2.3某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取50绳测其毛重(kg),结果分别如下: 单养50绳重量数据:45,45,33,53,36,45,42,43,29,25,47,50,43,49,36,30,39,44,35,38,46,51,42,38,51,45,41,51,50,47,44,43,46,55,42,27,42,35,46,53,32,41,4,50,51,46,41,34,44,46; 第三章概率与概率分布 3.3已知u服从标准正态分布N(0,1),试查表计算下列各小题的概率值: (1)P(0.3<u≤1.8);(2)P(-1<u≤1);(3)P(-2<u≤2);(4)P(-1.96<u≤1.96; (5)P(-2.58<u≤2.58)。 【答案】(1)0.34617;(2)0.6826;(3)0.9545;(4)0.95;(5)0.9901。 3.4设x服从正态分布N(4,16),试通过标准化变换后查表计算下列各题的概率值: (1)P(-3<x≤4);(2)P(x<2.44);(3)P(x>-1.5);(4)P(x≥-1)。 【答案】(1)0.4599;(2)0.3483;(3)0.9162;(4)0.8944。 3.5水稻糯和非糯为一对等位基因控制,糯稻纯合体为ww,非糯纯合体为WW,两个纯合亲本杂交后,其F1为非糯杂合体Ww。 (1)现以F1回交于糯稻亲本,在后代200株中试问预期有多少株为糯稻,多少株为非糯稻?试列出糯稻和非糯稻的概率; (2)当F1代自交,F2代性状分离,其中3/4为非糯,1/4为糯稻。假定F2代播种了2000株,试问糯稻株有多少?非糯株有多少? 课后答案网https://www.wendangku.net/doc/ff16532349.html,1=42.7,R=30,s1=7.078,CV1=16.58%;2=52.1,R=30,s2=6.335,CV2=12.16%。 第四章统计推断 课后答案网https://www.wendangku.net/doc/ff16532349.html,=0=21g,4.5接受HA:≠0;95%置信区间:(19.7648,20.2352)。 4.6核桃树枝条的常规含氮量为2.40%,现对一桃树新品种枝条的含氮量进行了10次测定,其结果为:2.38%、2.38%、2.41%、2.50%、2.47%、2.41%、2.38%、2.26%、2.32%、2.41%,试问该测定结果与常规枝条含氮量有无差别。 【答案】t=-0.371,接受H0:=0=2.40%。 4.7检查三化螟各世代每卵块的卵数,检查第一代128个卵块,其平均数为47.3粒,标准差为2 5.4粒;检查第二代69个卵块,其平均数为74.9粒,标准差为4 6.8粒。试检验两代每卵块的卵数有无显著差异。 【答案】u=-4.551,否定H0:1=2,接受HA:1≠2。 4.8假说:“北方动物比南方动物具有较短的附肢。”为验证这一假说,调查了如下鸟翅长(mm)资料:北方的:120,113,125,118,116,114,119;南方的:116,117,121,114,116,118,123,120。试检验这一假说。 【答案】t=-0.147,接受H0:1=2。 4.9用中草药青木香治疗高血压,记录了13个病例,所测定的舒张压(mmHg)数据如下:序

生物统计学 第八章 常用试验设计结果的统计分析

第八章 常用试验设计结果的统计分析 对比法试验结果的统计分析(A )。 A .无法得到无偏误差估计 B .可以得到无偏误差估计 C .无法计算误差方差 D .可以进行误差分析 对比法试验结果的精确程度比间比法(D )。 A .低 B .一样 C .无法比较 D .高 完全随机设计实验,(B )。 A .不可以进行方差分析 B .可以进行方差分析 C .误差方差比较小 D .上述说法均不正确 单因素随机区组实验资料的方差分析,实质上就是(C )。 A .两因素的方差分析 B .单因素的方差分析 C .两因素不具重复观察值的方差分析 D .两因素具重复观察值的方差分析 现有在三个处理,四个区组的完全随机区组设计资料如下,试完成方差分析表A 变异來源 平方和 处理 80 区组 50 误差 总合 150 ( )。 A . 变异來源 平方和 自由度 均方 F 值 处理 80 2 40 12.01 区组 50 3 16.67 5.01 误差 20 6 3.33 总和 150 11 B . 变异來源 平方和 自由度 均方 F 值 处理 80 1 8区组 50 3 16误差 20 6 3. 总和 150 11 C . 变异來源 平方和 自由度 均处理 80 2 4区组 50 3 16误差 20 4 5 总和 150 11 D . 变异來源 平方和 自由度 均处理 80 2 4区组 50 2 25 误差 20 6 3. 总和 150 11 以下是 4 个小麦品种 及 3 种 肥料 试验得到的部分数据 。 请问处理是否有效果?( D 。 变异来源 平 方 和 自由度 均方 品 种 140 肥料 30 误差 总 合 270 11 A .有效果 B .品种有效果 C .肥料有效果 D .没有效果 没有效果 变异来源 平方和 自由度 均方 品 种 (A) 140 3 46.667 肥料 (B) 30 2 15 误差 100 6 16.667 总和 270 11

生物统计学复习资料(整理)

生物统计学复习资料 第一章 1.生物统计学的基本作用: 1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征。 2)判断试验结果的可靠性 3)提供由样本推断总体的方法 4)提供试验设计的一些重要原则 2.统计学发展过程: 古典记录统计学近代描述统计学现代推断统计学 3.总体:具有相同性质的个体所组成的集合 4.个体:组成整体的基本单元 5.样本:从总体中抽出的若干个体所构成的集合 6.变量:相同性质的事物间表现差异性的某项特征。按其性质分为连续变量和非连续变量。变量可以是定量的,也可以是定性的。 7.连续变量:表示在变量范围内可抽出某一范围的所有值 8.非连续变量:也称离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。 9.常数:是不能给予不同数值的变量,它代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。 10.参数:对总体特征的度量 11.统计数:由测定样本的全部重复观测值算得的描述样本的特征的数。 12.效应:试验因素相对独立的作用 13.误差:是试验中不可控因素所引起的观测值偏离真值的差异 14.随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的差异,不可避免。 15.系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差,可避免。 16.错误:是指在试验过程中,人为因素所引起的差错。 17.准确性:在调查或试验中某一试验指标或性状的观测值与真实值接近程度 18.精确性:指调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。 第二章 1.次数分布:在不同区间内变量出现的次数所构成的分布。 2.资料根据生物的形状特性,可分为数量性状和质量性状 3.间断性变数:指用计数方法获得的数据,其各个观测值必须以整数表示,在两个相邻整数间不允许带有小数的值存在。 4.连续性变数:指称量、度量或测量方法所得到得数据,其各个观测值并不限制于整数,在两个数值之间可以有微量数值差异的第三个数值存在 5.质量性状资料的方法:统计次数法,评分法 统计次数法:于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别及其次数或相对次数 给分法:给予每类性状以相对数量的方法。 6.试验资料搜集方法:调查和试验 7.资料调查方法:普查和抽样调查

《生物统计学》复习题及答案

《生物统计学》复习题 一、 填空题(每空1分,共10分) 1.变量之间的相关关系主要有两大类:( 因果关系),(平行关系 ) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数 )、(调和平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生 ) 5.在标准正态分布中,P (-1≤u ≤1)=(0。6826 ) (已知随机变量1的临界值为0.1587) 6.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(依变量) 二、 单项选择题(每小题1分,共20分) 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合 格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布

5、方差分析适合于,数据资料的均数假设检验。 A、两组以上 B、两组 C、一组 D、任何 ,此差异是: 6、在t 检验时,如果t = t 0、01 A、显着水平 B、极显着水平 C、无显着差异 D、没法判断 7、生物统计中t检验常用来检验 A、两均数差异比较 B、两个数差异比较 C、两总体差异比较 D、多组数据差异比较 8、平均数是反映数据资料性的代表值。 A、变异性 B、集中性 C、差异性 D、独立性 9、在假设检验中,是以为前提。 A、肯定假设 B、备择假设 C、原假设 D、有效假设 10、抽取样本的基本首要原则是 A、统一性原则 B、随机性原则 C、完全性原则 D、重复性原则 11、统计学研究的事件属于事件。 A、不可能事件 B、必然事件 C、小概率事件 D、随机事件 12、下列属于大样本的是 A、40 B、30 C、20 D、10 13、一组数据有9个样本,其样本标准差是,该组数据的标本标准误(差)是 A、B、8.64 C、D、 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是。 A、正比关系 B、反比关系 C、加减关系 D、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是

相关文档
相关文档 最新文档