文档库 最新最全的文档下载
当前位置:文档库 › 修改统计学

修改统计学

修改统计学
修改统计学

一、单项选择

1. 下列数据中,测量数据是()( 参考答案 A 。)

A、17公斤

B、17人

C、17个班

D、17个样本

2. 下列数据中,计数数据是()( 参考答案 D 。)

A、53秒

B、53厘米

C、53公斤

D、53人

3. 有相等的单位又有绝对零的数据是()( 参考答案 A 。)

A、比率变量

B、名称变量

C、等距变量

D、顺序变量

4. 有相等单位,但无绝对零的数据是()( 参考答案 C 。)

A、比率变量

B、名称变量

C、等距变量

D、顺序变量

5. 既无相等单位,也无绝对零的数据是()( 参考答案 D )

A、比率变量

B、名称变量

C、等距变量

6. 身高、体重、反应时的物理量属于()( 参考答案) A 。

A、比率变量

B、名称变量

C、等距变量

D、顺序变量

7. 反应时,各种感觉阈值的物理量是()( 参考答案 A 。)

A、比率变量

B、名称变量

C、等距变量

D、顺序变量

8. 学生的各种智商能力测试分数是()( 参考答案 C 。)

A、比率变量

B、名称变量

C、等距变量

D、顺序变量

9. 学生的品德等级(能力等级)是()( 参考答案D 。)

A、比率变量

B、名称变量

C、等距变量

D、顺序变量

10. 样本和总样的关系为()( 参考答案D 。)

A、大于

B、小于

C、等于

D、小于等于11. 样本和总体的关系为()( 参考答案B)

A、大于等于

B、小于等于

C、小于

D、大于

13. 人数理统计学的奠基人是比利时的统计学家()( B)

A、韦特斯坦

B、凯特勒

C、高尔顿

D、皮尔逊

14. 人描述统计学产生于20世纪20年代之前,其代表人物是(D)

A、高斯和高而顿

B、高尔顿和皮尔逊

C、高斯和皮尔逊

D、高尔顿和费舍

15. 人推论统计学产生于20年代之后,其创始者是()(答案A)

A、费舍

B、高斯

C、皮尔逊

D、拉普拉斯

17. 1908年,以"学生"(Student)笔名提出t分布,开始建立小样本理论的统计学家是()( 参考答案B)

A、卡特尔

B、高赛特

C、桑代客

D、瑟斯顿

18. 根据实验所获得的一组观察值计算得到的量数是)(答案C)

A、参数

B、平均数

C、统计量

D、标准差

19. 下列描述样本数据集中情况的统计指标是()(答案B)

A、平均数和标准差

B、平均数、中数、众数

C、参数

D、统计量

20. 人描述总体情况的统计指标是()( 答案D)

A、平均数和标准差

B、方差和标准差

C、统计量

D、参数

21. 描述总体集中情况的统计指标称为()( 答案C)

A、总体平均数

B、期望值

C、总体平均数或期望值

D、总体期望值

二、填空题

1. 具有某种_____的变量称为随机变量。( 答案:变化规律。

4. 由____得到的数据,称为计数数据。 ( 参考答案) 计算个数。

5. 由计算个数得到的数据,称为______数据。 ( 参考答案) 计数。

6. 借助于一定的测量工具或一定的______,而获得的数据,称为测量数据。 ( 参考答案) 测量标准。

8. 实验数据按照由什么观测方法得来,可分为______和测量数据两大类。( 参考答案) 计数数据。10. 实验数据按其是否具有连续性可划分为______和______。( 参考答案) 连续变量离散变量。

12. 在相同条件下进行的实验或观察,其______不止一个,事先又无法确定的现象称为随机现象。( 参考答案) 可能结果。

15. 总体是指具有_____的一类事物的全体。( 答案) 某种特征。

16. 构成总体的每个______称为个体。( 参考答案) 基本单元。

17. 从总体中抽取的一部分______称为______的一个样本。( 参考答案) 个体,总体。

20. 在一定条件下,本质不同的事情可能出现也可能不出现,这种事情称为______。( 参考答案) 随机事件。

21.次数是指某一事件在______中出现的数目。 (答案) 某一类别。

22.某事件在无限次观测中,所能预料的______的次数即为该事件的概率。( 参考答案) 相对出现。

24.100人的考试分数中,得90分以上的有35人,那么得90分以上的概率为______。( 参考答案) 0.35。

25.标准差是表示一组数据______的统计量。( 参考答案) 离散程度或离中趋势。

26.平均数是表示一组数据______的统计量。( 参考答案) 集中程度或集中趋势。27.中数是表示一组数据______的统计量。(答案)集中程度或集中趋势。

28.众数是表示一组数据______的统计量。( 参考答案) 集中程度或集中趋势。

29.参数是指描述一个______情况的一些统计指标。( 答案) 总体。

30.表示某一事物两特性总体之间关系的统计指标称为______。 ( 参考答案) 相关系数。

31.在教育统计学中,将个体数目______的样本,称为大样本。( 参考答案) n>30.

32.在教育统计学中,将个体数目<30__的样本,称为小样本。

33.在实验或调查研究中,样本越大,对______的代表性就越好。( 参考答案) 总体。

34.σ、σ2是反映总体______的统计指标。 ( 参考答案) 离散程度或离中趋势。

35. μ是反映样本______的统计指标。(答案)集中程度或集中趋势。

36.描述总体集中情况的统计指标称为______。( 参考答案) 总体平均数或期望值。

37.描述总体情况的统计指标称为______。 ( 参考答案) 参数。

38.描述样本情况的统计指标称为______。( 参考答案) 统计量。

42 M. Md、M0是反映样本______的统计指标。( 参考答案) 集中程度或集中趋势。

43.S、S2是反映样本___的统计指标。(答案)离散程度或离中趋势。

44. μ、σ是反映______的统计指标。 ( 参考答案) 总体情况。

45. S是反映______的统计指标。( 参考答案) 样本情况。

46. 某一事物或某种情况在某一总体中出现的______叫做______。( 参考答案) 比率、概率。

48. 具有某种特征的______的全体称为______。( 参考答案) 一类事物、总体。

教育统计第一章练习题与思考题

一、单项选择题

1.性质类别数据只是反映事物在()上的不同。( 参考答案C)

A、组别

B、形式

C、组别、种类

D、形式、种类

3.以数据的取值大小为分类标志,并按顺序进行排列的数据是()( 参考答案B)

A、性质类别数据

B、数量类别数据

C、计数数据

D、测量数据

4.下列图形中,用于表示连续性资料的图形是()( 答案C)

A、直条图

B、圆形图

C、直方图

D、横条图

5. 以圆点的多少或疏密表示统计资料数量大小,以及变化趋势的图是()( 参考答案D)

A、条形图

B、圆形图

C、线形图

D、散点图

二、填空题

1. 统计分组就是根据被研究对象的______将所得数据划分到各个类别中去。 ( 参考答案) 特征

2、整理数据时的分类工作就是对______的分类再次核对加工使分类更趋合理、正确。( 参考答案) 观测值3. 对数据进行分类时,所依据的______称为分类的标志。( 参考答案) 特性

4、分类标志有____与数量类别两种形式。 (答案) 性质类别

5、在比较同一特质、不同样本之间______的大小时,标准差的值大(小),说明该组数据较分散(集中)。( 答案)离散程度

7、条形图适合于_____的数字资料。 ( 参考答案) 离散型

8. 圆形图用于______资料,其目的是显示各部分在整体中所占的比重。 ( 参考答案) 间断性资料

9. 线形图主要用于 _资料的变化发展趋势。(答案)连续性资料

10. 直方图是以矩形的面积表示______资料分布的一种条形图。 ( 参考答案) 连续性

11. 散点图是以圆点的大小和同大小圆点的多少或疏密表示______数量大小,以及______的图形。统计资料、变化趋势

12. 把一组大小不同的数据划出______的分组区间,再把数据按大小划入相应的组别内,所构成的表称为次数分布表。等距

教育统计第二章练习题与思考题

一、单项选择题

1. 当次数分布接近正态时,用皮尔逊的经验法计算理论众数公式为( A )

2. 集中量中,较易受极端数据影响的统计量是( A )

A、M

B、Md

C、M0

D、Mg

3. 当需要快速而粗略地寻求一组数据地代表值时,表示典型情况常

用( B )

A、M

B、M0

C、Md

D、Mg

4. 当一组数据出现不同质的情况时,用来表示典型情况的统计量是( A 。)

A、M0

B、M

C、Md

D、Mg

5. 在正偏态分布中, M、Md、M0三者的关系是( A )

6. 在负偏态分布中,M、Md、M0三者的关系是( C)

二、填空题

1、对于一组数据而言,最常用的统计量有两类,一类是表示数据_集中程度_的集中量数,另一类是表示数据_分散程度_的差异量数。数据的集中情况指一组数据的中心位置。

2.公式中的表示所有数据的和,即 x1+x2+…+xN。

4. 算术平均数缺点是_易受极端数据__的影响且若出现模糊不清的数据时,无法计算平均数.

5. 在次数分布中,若有含糊不清的数据,则用__中数____作为该组数据的代表值,描述其集中趋势。

6. 中数是指位于一组数据中较大一半与较小一半__中间位置__的那个数。

7. 一组数据 8、3、7、9、6、1 的中数 Md =_ 6.5 。一组数据 50、80、30、70、60 的中数 Md = 60。一组数据 30、50、70、75 的中数 Md =__ 60 。

8、次数分布表求中数的公式,其中为__中数所在区间__的精确下限。

9

、次数分布表求中数的公式,其中

为_

中数所在区间__的次数。

10、次数分布表求中数的公式

,其中为中数所

在区间的__精确上限____。。

11当一组观测结果中出现极端值时,常用_中数_____作为观测结果的代表值。

12、众数是指在次数分布中出现__次数最多____的那个数。

15. 次数分布接近正态分布时,用皮尔逊的检验法计算理论众数的公式为M0=__3Md-2M __。

16. 当需要快速而粗略地寻求一组数据的代表值时,常用_众数_____表示集中趋势。

17.当一组数据出现不同质的情况时,常用_众数_表示集中趋势。

18. 在一个正态分布中,M、Md、M0 三者的关系是__M=Md=M0。

21. 计算加权平均数时的"权数"是指各变量在_构成总体__中的相对重要性。

22. 在次数分配中,观察次数多的那一组的__组中值___为该分布的众数。

教育统计第三章练习题与思考题

一、单项选择题

1.下列度量数据分散程度的统计量是(D )

A、M

B、Md

C、r

D、S2

2.当用M描述一组数据集中情况时,描述差异程度的统计量为(D)

A、Md

B、M0

C、S2

D、S 二、填空题

1.对一组数据的______进行度量的统计量,称为差异量数。变异性,即离中趋势。

2 每一个数据与该组数据平均数之差乘方后的平均数称为方差。

3 每一个数据与该组数据平均数之差乘方后的平均数的算是平方根称为______。标准差。

4 四分差是指在一个次数分布中,中间50%的次数

的全距的一半。

教育统计第四章练习题与思考题

一、单项选择题

1 .假设两变量呈线性关系,如果两变量时等距或等比的数据,且均呈正态分布,那么计算相关时,应选用( A )

A、r

B、rR

C、rpb

D、rb

2 假设两变量呈线性关系,如果两变量时等距或等比的数据,但不是正态分布,那么计算相关时应选用( B )

A、r

B、rR

C、rb

D、w

3.假设两变量呈线性关系,一变量为正态等距变量,另一列变量也为正态变量,但被认为地分为两类,那么计算相关时应选用C

A、r

B、rR

C、rb

D、w

4.假设两变量呈线性关系,一变量为正态等距变量,另一变量也为正态变量,但被认为地分为多类,表示两变量相关时应选用D

A、r

B、rR

C、rpb

D、w

5. 假设两变量呈线性关系,一变量为正态等距变量,另一变量为二分名义变量,那么表示两变量相关时应选用C

A、r

B、rR

C、rpb

D、w

6. 假设两变量呈线性关系,且两变量均以等级表示,那么表示两变量相关时应选用( B )

A、r

B、rR

C、rpb

D、w 7. 两个变量中,当一个变量变化时,另一个变量呈或大或小与另一变量的变化方向相反,那么这两个变量呈B

A、正相关

B、负相关

C、高相关

D、低相关

8. 初学打字时练习的次数越多,出现错误的量就越少,这里“练习次数”与“错误量”间的相关关系为( C )

A、正相关

B、高相关

C、负相关

D、低相关

9. 相关系数的取值范围是( C )

A、 r ≥ - 1 B r≤ 1 C、- 1≤ r≤1 D、 -1< r< 1

二、填空题

1.事物相互间的关系,大概有:因果关系,共变关系和______三种。( ) 相关关系。

2.两个变量中,当一个变量变化时,另一个变量亦同时发生与前一种变量同方向的变动,那么这两个变量是_正相关_关系。

3.相关关系包括正相关、______和零相关。( )负相关。

4.相关系数是表示两列变量之间______的指标。( )相关关系。

5.相关系数的正负号表示______,而取值的大小表示相关的程度。( )相关方向。

8.相关系数______时,表示两个变量完全相关。| r | = 1

9.如果两个变量呈完全负相关关系,则r=______。( )-1。

10. 肯德尔W系数是表示多列____相关程度的方法。等级变量。

教育统计五章练习题与思考题

一、单项选择题

1.已知总体呈正态分布,当方差σ2 未知时,样本平均数的分布为(D )( 参考答案)

A、正态分布

B、 F 分布

C、χ2 分布

D、t 分布

4.已知总体为正态分布,当方差σ2 已知时,样本平均数的分布为( B)( 参考答案)

A、t 分布

B、正态分布

C、F 分布

D、χ2 分布

2.已知总体呈正态分布,当方差σ2 未知时,样本平均数分布的标准误为()( 参考答案)

3.已知总体呈正态分布,当方差 σ2 已知时,样本平均数分布的标准误为( )( 参考答案

) 二、填空题

1.不可能事件是指在一定条件下___的事件。(答案)必然不发生。

2.在一次调查或实验中,若事件 A 发生则事件 B______,则这两个事件为 互不相容 事件。( 参考答案) 一定不发生。

4.如果一个事件的出现对另一个事件的出现不产生影响,那么这两个事件为______事件。( 参考答案) 独立。

5.按照不同的标准,可将概率分布划分为离散分布与连续分布,______,基本随机变量分布与抽样分布。经验分布与理论分布。

6.按照随机变量是否具有连续性,可把概率分布划分为离散分布与______。( 参考答案) 连续分布。

7.按照分布函数来源,把概率分布划分为______与理论分布。( 参考答案) 经验分布。

8.按照概率分布所描述的数据特征,可把概率分布划分为______与抽样分布。( 参考答案) 基本随机变量分布。

9.当 -1≤Z ≤1 时,正态曲线下的面积 P =______。( 参考答案) 0.68268。 10.当-1.96<Z <1.96 时,正态曲线下的面积P =______。( 参考答案) 0.95。 11.当 -2.58<Z <2.58 时,正态曲线下的面积 P =____。(答案) 0.99。 12.当偏态量数 SK =0 时,次数分布呈______分布。(答案)对称。 13.当偏态分布 SK>0 时,次数分布呈____分布。(答案) 正偏态。 14.当偏态分布 SK<0 时,次数分布呈____分布。(答案) 负偏态。

15.当峰度系数 q2=0 时,次数分布的峰度为______的峰度。( 参考答案) 正态分布。 16.当峰度系数 q2<0时,次数分布的峰度比______的峰度低阔。( 参考答案) 正态分布。 17.当峰度系数 q2>0时,次数分布的峰度比______的峰度高狭。( 参考答案) 正态分布。 18.二项分布是指统计变量中只有______的两项群体的概率分布。( 参考答案) 性质不同。

19.二项分布中所指的两项群体是按两种______划分的统计变量,是二项试验的结果。( 参考答案) 不同性质。

21.当总体分布为正态,σ2 已知时,样本平均数分布的平均数 =______。( 参考答案) 。

22.当总体分布为正态,σ2 已知时,样本平均数分布的标准差=______,也称为标误。( 参考答案) 。 23.总体为非正态分布,但 σ2 已知,当样本容量______时,其样本平均数的分布为渐进态分布。( 参考答案) n>30。

教育统计第六章练习题与思考题

一、单项选择题

4. 总体相关系数的置信区间,根据下列哪种分布计算( )( 参考答案) B 。 A 、正态分布B 、t 分布C 、F 分布D 、

5.从正态分布的总体中,随机抽取容量为 n 的样本,其样本方差与总体方差比值的分布是( )( 参考答案 D 。) A 、渐进正态分布B 、t 分布C 、F 分布 D.

6. 从方差为和的两个总体中,分布随机抽取容量为和 n1和 n2的两个样本,其样本方差之比的分布是于( )( 参考答案) A 、渐进正态分布B 、t 分布C 、F 分布 D.

1. 当总体呈正态分布,总体方差已知,置信度 α=0.05 时,总体平均数置信区间为( )( 参考答案 C 。

)

2.当总体呈正态分布,总体方差已知,置信度 a=0.01 时,总体平均数的置信区间为( )( 参考答案 D 。

)

3. 当总体呈正态分布,总体方差未知时,总体平均 数的置信区间为( )( 参考答案 B 。

)

二、填空题

1. 用一个样本_____的值,对总体参数进行估计称为点估计。( 参考答案) 统计量。

2. 一个好的估计量应具备无偏性、______、有效性、充分性。( 参考答案) 一致性。

3. 区间估计是用数轴上的一段距离表示______可能落入的范围, 并指出落入某一范围的概率有多大。( 答案) 未知参数。

4. 置信度是指估计总体参数落在某一区间时,可能______的概率。( 答案) 犯错误。

5. 置信度又称显著性水平,在假设检验中,指______时可能出现的犯错误的概率水平。( 参考答案) 拒绝虚无假设。

6. 区间估计是根据__样本分布____理论,用样本分布的标准误计算区间长度,解释总体参数落入某置信

区间可能的概率。

7. 已知总体呈正态分布,总体方差已知,置信度α=0.05 时,总体平均数置信区间为

_。

8. 总体呈正态分布,总体方差已知,置信度α=0.01 时,总体平均数置信区间为

_。

10. 当样本容量 n>30 时,样本标准差的分布渐进正态分布,标准差的平均数=σ,标准差分布

的标准误σS=。

12.当n>30时,用样本标准差对总体标准差进行估计,其置信区间为______。( 参考答案)

13.从正态分布的总体中,随机抽取容量为 n 的样本,其样本方差与______比值的分布为χ2 分布。( 参

考答案) 总体方差。

14.从方差为σ 12 和σ 22 的两个总体中,分别随机抽取容量为 n1 和 n2 的两个样本,其方差之比

服从___F___分布。

15.当总体相关系数ρ为负值时,样本 r 的分布呈不同程度的______分布。( 参考答案) 负偏态。

16.当总体相关系数ρ为正值时,样本 r 的分布呈不同程度的______分布。( 参考答案) 正偏态。

17.当总体相关系数ρ=0 时,样本 r 的分布的标准误σ=______。( 参考答案) 。

18.当总体相关系数ρ=0 时,样本相关系数的分布服从自由度 df=______的 t 分布。( 参考答案) n

-2。

19.当时,斯皮尔曼等级相关系数 rR 的分布近似于 df =n-2,SEr=______的 t 分布。( 参考答案)

20.对总体平均数进行估计的具体方法有点估计和区间估计。

教育统计第七章练习题与思考题

一、单项选择题

1. 当总体服从正态分布,方差已知时,样本平均数与总体平均数差异检验方法是( A )( 参考

答案)

A、Z 检验

B、F 检验

C、χ 2 检验

D、q 检验

2. 当总体服从正态分布,方差未知时,样本平均数与总体平均数差异检验方法是()( 参考

答案)

A、Z 检验

B、t 检验

C、F 检验

D、q 检验

二、填空题

1. 假设是指根据已知______对研究对象所作的假定性说明。( 参考答案) 理论与事实。

2. 需要根据已有的理论和经验事先对研究结果作出一种预想的______的假设称为科学假设。( 参考答案)

希望证实。

3. 在假设的前提下,利用样本数据进行计算分析,根据______原理,以推翻或证实假设的过程称为假设

检验。小概率。

4. 统计学中的两个假设是______和对立假设。( 参考答案) 零假设,即原假设。

5. 统计学中把______时所犯的错误称为α错误。( 参考答案) 拒绝零假设。

6. 统计学中把______是所犯的错误称为β错误。( 参考答案) 接受零假设,即拒绝对立假设。

7. 如果原假设为真而______,则犯了α错误。( 答案) 被拒绝。

8. 如果原假设为假而______,则犯了β错误。( 答案) 被接受。

9. 假设检验中,犯______的可能性越大,则犯β错误的可能性越小。( 参考答案) α错误。

10. 假设检验中,只强调差异而______的检验为双侧检验。( 参考答案) 不强调方向。

11. 假设检验中,既强调差异又_____的检验为单侧检验。(答案) 强调方向。

12. 平均数的显著性检验是指对______的差异进行的显著性检验。( 参考答案) 样本平均数与总体平均

数。

13.总体服从正态分布,总体方差已知,H0 成立时样本平均数与总体平均数差异检验统计量为Z=

或 Z=。

14.总体服从正态分布,方差未知,H0 成立时,样本平均数与总体平均数差异检验统计量为______。

15.总体不服从正态分布,总体方差未知,但样本较大,H0 成立时,样本平均数与总体平均数差检验统

计量为__。

16. 平均数差异的显著性检验是指对______的差异进行的显著性检验。( 参考答案) 两个样本平均数。

17. 所谓相关样本是指两者之间存在______关系的样本。( 参考答案) 一一对应。

18.两个总体都是正态分布,方差未知,当两个样本独立时,对两个平均数差异进行显著性检验,首次检

验两个_总体方差_是否相等

19.通过两个独立样本方差的差异对其各自的总体方差是否有差异进行推断,当

的值在______范围时,说明方差差异不显著。( 参考答案) 。

教育统计第八章练习题与思考题

一、填空题

1.方差分析的主要功能是分析实验数据中不同来源的变异对_总变异_的贡献大小,从而确定实验中的自变

量是否对因变量有重要影响。

2.方差分析所依据的原理是______。( 答案) 变异的可加性。

3.方差分析中 SSb 是由不同的______而造成的变异。( 参考答案) 实验处理。

4.方差分析中 SSW 是由____(包括个体差异)造成的变异。( 参考答案) 实验误差。

5.随机区组设计的原则是______的被试应尽量同质。( 参考答案) 同一区组内。

6.随机区组设计的方差分析,把总平方和分解为组间平方和、区组平方和、______平方和。( 参考答案) 误

差项。

三、名词解释

1.变量( 参考答案) 某次实验或观察,受随机误差的影响,而且表现为实验结果的数值的确定性,因此

就称为变量。

2.教育统计学( 参考答案) 教育统计学是专门研究如何搜集、整理、分析在心理和教育方面由实验或调

查所获得的数字资料,并如何根据这些数字资料所传递的信息,进行科学推论找出客观规律的一门学科。

3.随机误差( 参考答案) 随机因素使测量产生的误差称作随机误差(或称偶然误差)。

4.随机因素( 参考答案) 在心理与教育实验或观察过程中一些偶然的不可控制的因素称为随机因素。

5.描述统计参考答案) 描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一

组数据的全貌,表达一件事物的性质。描述统计是教育统计学的内容之一。

6.推断统计( 参考答案) 推断统计是心理与教育的内容之一它主要研究如何通过局部数据所提供的信息,

推论总体(或全局)的情形。

7.随机现象( 参考答案) 在相同条件下进行的实验或观察,其可能结果不止一个,事件又无法确定的现

象称为随机现象。

8.随机变量( 参考答案) 具有变化规律的变量称为随机变量。

9.随机事件( 参考答案) 在一项研究中,对随机现象进行观察试验,在一定条件下,本质不同的事情可

能出现,也可能不出现,这种事情称为随机事件。

10.总体( 参考答案) 总体是指具有某种特征的一类事物的全体。

11样本(答案)从总体中抽取的一部分个体,称为总体的一个样本。

12.统计量( 参考答案) 统计量是根据科研实验所获得的一组观测值计算得到的一些量数,统计量又称

统计特征数。

13.参数( 参考答案) 参数是指描述一个总体情况的一些统计指标,参数又称总体参数。

14.样本容量( 参考答案) 实验中被试的数目,或一个观测重复的次数或样本中个体的数目称为样本容

量。

四、简答题

15.什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量?( 参考答案)

(1)具有变化规律的变量称为随机变量。(2)是

16.何谓教育统计学?学习它有何意义?( 参考答案)

(1)教育统计学是专门研究如何搜集、整理、分析在心理和教育方面由实验或调查所获得的数字资料,

并如何根据这些数字资料所传递的信息,进行科学推论找出客观规律的一门科学。

(2)学习教育统计学的意义可归纳为如下几个方面:

第一:心理与教育科学研究的需要;第二:科学化教育管理的需要;第三:科学训练的需要。

17学习与应用教育统计学要注意哪些问题?( 参考答案)

学习教育统计学时应注意:

(1)克服畏难情绪。因为教育统计学主要侧重于应用,涉及的计算并不复杂,只要有中学的数学知识就

具备了学好教育统计学的前提。(2)在学习时应把重点放在掌握各种统计方法使用的条件。(3)要进行一定的练习。

18.怎样理解总体、样本与个体?( 参考答案)

⑴总体是指具有某种特征的一类事物的全体。是某一类所欲研究的对象的全体。⑵样本是从总体中抽取出来的一部分研究对象。而个体是构成总体的一个单元。

19.何谓次数、频率及概率?( 参考答案)

(1)次数又称频数,是指某一事件在某一类别中出现的数目,通常用f表示。(2)频率又称相对次数,是指某一事件的次数被总的事件数目除,即某一数据出现的次数被这一组数据的总个数除。频率常用百分数表示。(3)概率又称机率,是指某事件在无限次观测中所能预料的相对出现的次数。或者说是某一事物或某种情况在某一总体中出现的比率,常用符号P表示。

20.何谓统计量与参数?二者有何区别?有何关系?( 参考答案)

⑴统计量又称统计特征数,是根据科研实验所获得的一组观测值计算出来的一些量数。⑵参数是指描述一个总体情况的一些统计指标。二者的区别在于:统计量是描述样本数据的特征,而参数则是描述总体数据的特征。二者之间的关系为:其一,当样本中数据的个数与总体中的数据个数相同时,统计量与参数是同一个统计指标。其二,统计量是总体参数的估计值。

22、下述一些数据,哪些是测量数据?哪些是计数数据?其数值意味什么?

( 参考答案) 测量数据a、b、c、f。计数数据d、e。

a. l7.0公斤 b.89.85厘米 c. 199.2秒

d.17人 e.25本 f. 93.5分

三、名词解释

1. 次数分布表( 参考答案)对于一组大小不同的数据划出等距的分组区间,然后将数据按其数值大小列入各个相应的组别内,便可以出现一个有规律的表,此表称为次数分布表。

2. 条形图是以条形长短表示各事物间数量的大小与数量之间差异情况的统计图。条形图主要用于离散型的数字资料。

3. 圆形图是以相对数(如百分数)显示各部分在整体中所占的比重,以及各部分之间的比较的统计图。圆形图主要用于间断性资料。

4. 线形图是表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化情形的统计图。线形图主要用于连续性资料。

5. 直方图( 参考答案)直方图是以矩形的面积表示连续性资料频数分配的一种条形图。

6. 散点图( 参考答案)散点图是以圆点的大小和同大小圆点的多少或疏密表示统计资料数量大小,以及变化趋势的统计图。

7. 次数直方图( 参考答案)次数直方图是以矩形的面积表示连续性随机变量次数分布的统计图。

8. 次数多边图( 参考答案)次数多边图是线图的一种,是表示连续性随机变量次数分布的统计图。

1.相关关系两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定这两类现象之间哪个是因,哪个是果,也有理由认为不存在共变关系,则这两类现象间的关系为相关关系。

2.相关系数相关系数是表示两列变量间相关程度的数字表现形式(或数量指标)

3.点二列相关如果两列变量中有一列为等距或等比的测量数据,而且其总体分布为正态,另一列变量只是名义上的变量,而实际上是按事物的性质划分两类的变量。表示这两列变量的相关称为点二列相关。

4.二列相关如果两列变量均服从正态分布,但其中一列为等距或等比的测量数据,另一列变量被人为地划分为两类。表示这两类变量的相关称为二列相关。

四、简答题

1、简答编制次数分布表的步骤。( 参考答案)

(1)求全距(2)决定组数与组距(3)列出分组区间(4)登记次数(5)计算次数(6)抄录新表2.统计分组应注意哪些问题? 统计分组要分类正确,必须查明被研究现象的本质。分类标志要明确,要能包括所有的数据。

3.直条图适合哪种资料?自选资料绘制直条图。( 参考案) 直条图主要用于表示离散型的数字资料,即计数资料。

4.圆形图适合哪种资料?自选资料绘制圆形图。( 参考答案)圆形图主要用于表示间断性的数字资料。

1.简述算术平均数的特点:(1)在一组数据中,每个变量与平均数之差(离均差)地总和等于零。(2)在一组数据中,每一个数都加上一个常数 C,所得的平均数为原来的平均数加上 C。(3)在一组数据中,每一个数都乘以一个乘数 C,所得的平均数为原来的平均数乘以常数 C。

3. 应用算术平均数表示集中趋势要注意哪几个方面?

(1)一组数据中是否有极端值出现;(2)数据是否同质;(3)是否有模糊不清的数据。

4. 中数,众数,几何平均数,调和平均数各适用于心理与教育研究中的哪些资料?

(1)当一组数据中出现极端值时,当次数分布的两端数据或个别不清楚时,或者要快速估计一组数据的代表值时,用中数表示几种趋势。(2)当需要快速而粗略地寻求一组数据的代表值时,当一组数据出现不同质的情况时,或当次数分布中有极端值时,常用众数表示几种趋势。当粗略估计次数分布的形态时,有时用平均数与众数之差表示次数分布是否偏态的指标。(3)一组实验数据中有少数数据偏大或偏小,数据分布成偏态时,用几何平均数作为几种趋势的代表值。在心理物理学的等距与等比量表实验中,如果出现有部分数据变异较大,则适宜用几何平均数。(4)在心理与教育研究方面,调和平均数主要是用于描述学习速度方面的问题。

1. 简述差异(变异)系数的用途

(1)同一团体不同观测值离散程度的比较。(2)对于平均水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。

2. 简述标准 Z 分数的用途( ) (1)Z 分布可以比较性质不同的观测值在各自数据分布中相对位置的高低。(2)当已知各不同度的观测值的次数分布为正态时,可用 Z 分数求不同的观测值的总和或平均值的总和或平均数,以示在团体中的相对位置。3)用 Z 分数表示标准测验分数。

3. 度量高中趋势的差异量数有哪些?为什么要度量离中趋势?

标准差、方差、全距、平均差、四分差及其它百分差。

4. 各种差异量数各有什么特点?

(1)方差与标准差的特点:反应灵敏、严密确定、容易计算、适合代数运算、简单明了、受抽样变动的影响较小。此外,方差还具有可加性的特点;(2)全距不稳定、不可靠、不灵敏、受抽样变动的影响;(3)平均差具有类似标准差的优点,但不利于代数运算;(4)四分差不受极端数据的影响,但反应不够灵敏,不适合代数运算;(5)各种百分差具有类似四分差的特点。

5. 标准差在心理与教育研究中除度量数据的离散程度外还有哪些用途?( )

计算差异系数,标准分数,对异常值进行取舍。

6. 应用标准分数求不同质的数据总和时应注意什么问题?

各个不同值的观测值的次数分布为正态分布。

四、简答题

1.简述积差相关的适用资料

(1)两列都是测量数据,且各自的总体均服从正态分布。(2)两列变量具有线性关系

2.简述斯皮尔曼等级相关系数的适用资料

(1)两变量具有线性关系2)两变量均为等级变量或按取值大小赋予等级顺序的等距或等比性质的变量。

3.简述肯德尔W系数的适用资料

肯德尔W系数是表示多列等级变量相关程度的一种方法。(1)K个评价者对N件事物或N种作品进行等级评定,每个评价者都对N件事物(或作品)按照优劣或高低排出一个等级顺序,得到的K列等级变量资料。(2)一个评价者先后K次评价N件事物或N件作品,所得到的K列等级变量资料

4.简述点二列相关的适用资料

(1)两列变量中有一列为等距或等比的测量数据且相应的总体呈正态分布。(2)有一列是名义变量,而实际上是按事物的性质划分成两类的变量。点二列相关多用于编制是非测验时评价测验内部一致性等问题。

5. 简述二列相关的适用资料

(1)两列均为呈正态分布的变量且具有线性关系(2)一列变量为等距或等比的测量数据,另一列变量被人为地划分为两类地

二分名义变量。在心理与教育研究中,二列相关常用于对项目区分度指标地确定。

6.假设两变量为线性关系,计算下列各种情况的相关时,应用什么方法?

①两列变量是等距或等比的数据且均为正态分布(参考答案:积差相关法)

②两列变量是等距或等比的数据但不为正态分布(参考答案:斯皮尔曼等级相关法)

⑧一变量为正态等距变量,另一列变量也为正态变量,但被人为地分为两类(参考答案:二列相关法)

④一变量为正态等距变量,另一列变量也为正态变量,但被人为地分为多类(参考答案:肯德尔W系数)

⑤一变量为正态等距变量,另一列变量为二分名义变量(参考答案:点二列相关法)

⑥两变量均以等级表示 ( ) (参考答案:肯德尔等级相关法)

1.简述概率的基本性质( 参考答案)

(1)概率的公理系统①、任何一个随机事件 A 的概率都是非负的②、必然事件的概率为 1③、不可能事件的概率为 0(2)两个互不相容的事件 A、B 之和的概率等于两个事件概率之和。(3)两个独立事件同时出现的概率等于两个独立事件概率的积。

2.简述正态分布具有哪些特征( 参考答案)

(1)正态分布的函数为(2)正态分布的单峰对称分布(3)正态分布的中央点(即平均数)最高,然后向两侧无限延伸但始终不与基线相交。(4)正态曲线下的面积为 1,且标准差与概率(面积)有一定的数量关系。(5)正态分布是一族分布。6)正态分布中各种差异量数的值皆有固定比率。

3.概率分布的类型有哪些?教育统计中常用的概率分布是什么?( 参考答案)

(1)依随机变量是否具有连续性来划分,概率分布有两类,即离散分布与连续分布。如果按分布函数的来源划分,概率分布的类型有经验分布与理论分布,如果按概率分布所描述的数据特征,可把概率分布划分为基本随机变量分布与抽样分布。(2)教育统计中常用的概率分布是基本随机变量分布与抽样分布。常用的基本随机变量分布有二项分布与正态分布,抽样分布则是样本统计量的理论分布,它们是统计推论的重要依据。

4.简述什么是样本平均数的分布?( 参考答案)

从一个正态总体中,随机抽取一个容积为 n 的样本,可计算得到一个样本平均数,然后把样本放回总体,又随机抽取一个容量为 n 的样本,又可计算得到一个平均数,和不一定相等。用同样的方法,反复从总体中抽取容量为 n 的样本共 N 个,这 N 个样本平均数各不相同,由这 N 个平均数构成的分布即为样本平均数的分布。

5.简述 F 分布所具有的特点:( 参考答案)

(1) F 分布呈正偏态分布,分布曲线形式随分子自由度 df1 ,分母自由度 df2 的不同而不同,随着、的增加而逐渐趋向正态分布(2) F 值始终是正值

6.简述χ2 分布的特点( 参考答案)

(1)χ2 分布呈正偏态分布,它随抽取的随机变量个数 n 的不同,其分布曲线的形状不同,当 n 或 n -1 越小,分布越偏斜, df 很大时,接近正态分布,当 df→∞时,χ2 分布为正态分布。(2)χ2 值均为正值。(3)χ2 分布的和也是χ2 分布(4)当 df>2 时,χ2 分布的平均数与方差分别为和(5)χ2 分布是连续型分布(有些离散型分布也近似χ2 分布)

7.简述 t 分布的特征( 参考答案)

(1)t 分布的平均值为 0(2)是对于平均值 0 对称的分布,分布左侧 t 为负值,分布右侧 t 为正值(3变量取值在-∞-+∞之间(4)当样本容量趋向于∞时,t 分布为正态分布

三、名词解释

1. 点估计( 参考答案) 用样本统计量的值估计未知总体参数的值,这类估计称为点估计。

2. 区间估计( 参考答案) 是用数轴上的一段距离表示未知参数可能落入的范围,并指出总体未知参数落入某一区间的概率的大小,这类估计称为区间估计。

1、算术平均数将所有数据相加,再被数据的个数除所得到的值称为算术平均数。

1. 科学假设(参考答案) :科学假设是根据已有的理论和经验,事先对研究结果作出一种预想的希望证实的假设

2、中数中数是指位于一组数据中较大一半与较小一半中间位置上的那个数,通常用符号 Md 表示。

3、众数众数是指在次数分布中出现次数最多的那个数的数值,通常用符号M0表示。

1.完全随机设计( 参考答案) 如果把被试随机分成若干个组,每个组分别接受一种实验处理,则设计中有几种实验处理,被试就必须随机分成几组。这样的实验设计叫做完全随机设计。

2.随机区组设计( 参考答案) 把同一个总体中抽取的被试,按条件相同的原则分成各个组(称为区组),使每个区组内的被试尽量同质。同一区组中的被试随机地接受某一(或多种)实验处理。这种实验设计叫做随机区组设计。

四、简答题

1. 简述总体平均数区间估计的步骤( 参考答案)

(1)根据样本数据,计算平均数与标准差(2)计算平均数分布的标准误(3)确定置信间距或显著性水平(4)根据样本平均数的分布,确定或(5)确定并计算置信区间(6)解释总体平均数的置信区间

1. 假设检验的一般步骤( 参考答案)

(1)根据题意提出假设(2)计算标准误和检验统计量的值(3)统计决断

2. 简述两个平均数差异的显著性检验增加了哪些前提条件?

(1)两个样本是否相关(2)两个样本容量是否相等(3)两个样本独立时,总体方差是否一致。

1. 简述方差分析的一般步骤。( 参考答案)

(1)计算平方和(2)确定自由度(3)求均方(4)进行F检验(5)列方差分析表

2.方差分析必须满足哪几个基本条件?( 参考答案)

(1)总体正态分布(2 变异的可加性(3)各处理内的方差一致

3.简述随机区组设计的优点和不足。( 参考答案)

(1)随机区组设计的原则是同一区组内的被试应尽量同质。

每一区组内被试的人数分配大致有三种情况:

①、一个被试作为一个区组,不同的被试(区组)均需接受全部K个实验处理。

②、每一区组内被试的人数是实验处理数的整数倍。

③、区组内的基本单元不是个别被试,而是以一个团体为单元。

(2)与完全随机设计相比,随机区组设计的优点是考虑到各个差异的影响(即区组效应),可以将这种影响从组内变异中分离出来,从而提高效率,其不足是如果不能得证同一区组内尽量同质,则有出现更大误差得可能。

应用统计学论文

应用统计学课程论文 经过这学期短暂的学习应用统计学,我对这门学科也有了一定认识。应用统计学是一门运用统计学的原理和方法,研究各个领域有关数据收集、整理、分析的科学是经济、管理类专业的一门重要专业基础课程。掌握统计学的基本理论和方法,具有较好的科学素养,能熟练地运用计算机分析数据,能从事统计调查、统计信息管理、数量分析、市场研究、质量控制等工作。在当前的社会发展中,是市场经济和信息经济的时代,社会各个方面的发展都需要对信息进行收集、分析和整理,所以学好应用统计对不久即将走向社会的我们是只有好处,没有坏处的。 绪论 一、应用统计学的发展: 从统计学的发展过程来看,可以把统计学大致分为古典统计学、近代统计学和现代统计学三个时期。 第一、古典统计学时期: 古典统计学时期是指17世纪初至18世纪末,这是统计学的创立时期,亦称古典统计学时期。在这时期出现了政治算术学派和德国的国势学派两个统计学派. 1、国势学派 国势学派又称记述学派,产生于17世纪的德国。由于该学派主要以文字记述国家的显著事项,故称记述学派。 2、政治算术学派 政治算术学派产生于19世纪中叶的英国,其创始人是威廉和约翰.“算术”是指统计方法。主要利用实际资料,运用数字、重量和尺度等统计方法对实际情况作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础。 第二、近代统计学时期: 近代统计学是指18世纪末到19世纪末这一百年的统计学,它是古典统计学的继续和发展,是古典统计学向现代统计学过渡的统计学。近代统计学的发端,不能不提到著名的统计学家阿道夫·凯特勒的卓越员献。他既继承了国势学和政治算术的传统,把统计学从作为管理国家行政的“政治医学”,扩展到作为研究社会内在矛盾及其规律性数量表现的科学认识方法,又积极地把古典概率引人统计学,以研究社会经济现象偶然变化中的规律性表现。 1、数理统计学派 指概率论引进统计学形成数理统计学,以概率作为理论基础,抽象掉统 计学的社会经济现象内涵,变成了抽象的数学分析和推断技术. 2、社会统计学派 指研究社会现象变动的原因和规律性的实质性科学。社会统计学在这里也称为社会经济统计学,包括政治统计.经济统计.人口统计.犯罪统计等多方面内容. 第三、现代统计学时期:

生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 122 --∑∑n n x x )(

2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 三 填空 1.如果事件A 和事件B 为独立事件,则事件A 与事件B 同时发生的概率P (AB )= P (A )?P (B )。 2.二项分布的形状是由( n )和( p )两个参数决定的。 3.正态分布曲线上,( μ )确定曲线在x 轴上的中心位置,( σ )确定曲线的展开程度。 4.样本平均数的标准误 =( )。 5.t 分布曲线与正态分布曲线相比,顶部偏( 低 ),尾部偏( 高 )。 n /σx σ

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

生物统计学

生物统计学

————————————————————————————————作者: ————————————————————————————————日期:

第七章回归分析 第一节回归和相关的概念 方差分析检验一个或多个因子对某一生物变量是否有影响,只涉及一种变量。两个以上变量之间的定量关系的统计分析需要回归分析来解决。在自然界,两个或多个变量相互制约、相互依存的现象很常见。 变量间的关系一般分为两种:一种是因果关系,即一个变量的变化受另一个变量或几个变量的制约,如微生物的繁殖速度受温度、湿度、光照等因素的影响,子女的身高是受着父母身高的影响;另一种是平行关系,即两个以上变量之间共同受到另外因素的影响,如人的身高与体重之间的关系,兄弟身高之间的关系等都属于平行关系。 设有两个随机变量X和Y,如果变量X的每一个可能的值,都有随机变量Y的一个分布相对应,则称随机变量Y对变量X存在回归(Regression)。 X也是随机变量时,X和Y相互存在回归关系,这两个随机变量间就存在相关(Correlation)关系。在实际应用中,并不严格区分相关和回归。 在回归和相关分析中,必然注意下面一些问题,以避免统计方法的误用。 (1)变量间是否存在相关以及在什么条件下会发生什么相关等问题,都必须由各具体学科本身来决定。回归和相关只能作为一种统计分析手段,帮助认识和解释事物的客观规律,决不能把风马牛不相及的资料凑到一起进行分析; (2)由于自然界各种事物间的相互联系和相互制约,一个变量的变化通常会受到许多其他变量的影响,因此,在研究两个变量之间的关系时,要求其余变量尽量保持在同一水平,否则,回归和相关分析就可能会导致不可靠甚至完全虚假的结果。例如人的身高和胸围之间的关系,如果体重固定,身高越高的人,胸围一定较小,当体重在变化时,其结果就会相反; (3)在进行回归与相关分析时,两个变量成对观测值应尽可能多一些,这样可提高分析的准确性,一般至少有5对以上的观测值。同时变量x的取值范围要尽可能大一些,这样才容易发现两个变量间的回归关系; (4)回归与相关分析一般是在变量一定取值区间内对两个变量间的关系进行描述,超出这个区间,变量间的关系类型可能会发生改变,所以回归预测必须限制自变量Y的取值区间,外推要谨慎,否则会得出错误的结果。 第二节一元线性回归 研究两个随机变量的关系时首先要收集成对数据。 7.1研究土壤中NaCl的含量对植物单位叶面积物质干重的影响时,收集到如下成对数据。问二者的回归关系如何? NaCl的含量0.00.8 1.6 2.4 3.2 4.0 4.8 单位叶面积干重80 90 95 1 根据数据作散点图,分析:1. X与Y的关系密切否?2.线性还是曲线关系?3. 有无偏

应用统计学

应用统计学 课程编码:202136 课程英文译名:Practical Statistics 课程类别:学科基础选修课 开课对象:工业工程专业 开课学期:5 学分: 2学分; 总学时: 32学时; 理论课学时: 32 学时; 实验学时: 0学时; 上机学时: 0 学时 先修课程:概率论 教材:应用统计,朱洪文,高等教育出版社,2001.2 参考书:【1】应用统计学,倪加勋,中国人民大学出版社,1994 一、课程的性质、目的和任务 应用统计学是一门认识方法论的科学,通过对社会经济现象的数量方面资料的搜索、整理、分析和推断,阐明社会经济现象本质及其内在的规律性,以达到对社会经济现象整体的具体的认识。该课程作为经济、管理类专业的专业基础课开设。 通过本课程的教育需达到以下目的:1、为经济管理提供统计调查,资料整理汇总和统计分析的一般原则和方法;2、为进一步学习有关专业知识,奠定理论和方法基础;3、为学习其他经济管理课程和从事经济研究工作提供数量分析的方法。学习中要正确理解课程中的各个基本概念,了解统计工作的各个阶段,掌握统计的基础理论和基本方法,并能综合运用所学的理论知识分析应用经济统计信息,以满足工作的需要。 二、课程的基本要求 1.明确统计的对象及其特点,了解统计的性质与作用以及统计工作的基本环节。透彻理解统计学中的基本范畴,初步建立统计思想。 2.理解统计调查的概念,了解统计调查方法的种类,掌握统计报表制度和各种专门调查的概念、特点以及各种调查方法的结合运用。 3.了解统计调查方案的基本内容,理解统计整理的概念,统计分组的概念和作用,了解次数分布的类型,统计表的结构,掌握制表的一

应用统计学概念整理

应用统计学概念整理 第一章:导论 1.只能归类于某一类别的非数字型数据称为分类数据 2.只能归于某一有序类别的非数字型数据称为顺序数据 3.按数字尺度测量的观测值称为数值型数据 4.包含所研究的全部个体的集合称为总体 5.从总体中抽取的一部分的元素的集合称为样本 6.用来描述总体特征的的概括性数字度量称为参数 7.用来描述样本特征的概括性数字度量称为统计量 8.说明事物类别的一个名称称为分类变量 9.说明事物有序类别的一个名称称为顺序变量 10.说明事物数字特征的一个名称称为数值型变量 11.只能取可数值的变量称为离散型变量 12.可以在一个或多个区间中取任何值的变量称为连续型变量 第二章:数据收集 1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征 的数据收集方法,称为抽样调查。 2.为特定目的而专门组织的全面调查称为普查 3.按照国家有关法律规定,自上而下地统一布置,自下而上地逐级提供基本数据的调查方 式称为统计报表 第三章:数据的图表展示 1.落在某一特定类别或组中的数据个数,称为频数 2.把各个类别及其落在其中的相应频数全部列出,并用表格形式表示出来,称为频数分布 3.一个样本或总体中各个部分的数据与全部数据之比,称为比例 4.将比例乘以100得到的数值,称为百分比或百分数,用%表示 5.样本或总体中各不同类别数值之间的比值,称为比率 6.分类数据的图示:条形图,pareto图,对比条形图,饼图 7.将各有序类别或组的频数逐级累加起来得到的频数称为累计频数 8.将各有序类别或组的百分比逐级累加起来称为累计频率 9.顺序数据的图示:累计频数分布图,环形图 10.根据统计研究的需要,将原始数据按照某种标准划分成不同的组别称为数据分组 11.分组后的数据称为分组数据 12.把变量值作为一组称为单变量值分组 13.将全部变量值一次划分为若干个区间,并将这一区间的变量值作为一组,称为组距分组 14.在组距分组中,一个组的最小值称为下限,最大值称为上限 15.一个组的上限与下限的差称为组距 16.各组组距相等的组距分组称为等距分组 17.各组组距不相等的组距分组称为不等距分组 18.每一组的下限和上限之间的重点值称为组中值

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

生物统计学期末考试试题A

漳州师范学院 生物系_____________专业_____级本科_______班 《生物统计学》课程期末考试卷(A) (2011—2012学年度第一学期) 学号___________姓名________考试时间:2011-12-29 一、名词解释(6×2) 1统计数: 2小概率原理: 3无偏估计: 4准确性: 5纳伪错误: 6方差: 二、判断题:请在下列正确的题目后面打“√”,错误的打“×”。(12×1) 1 t分布曲线的平均数与中位数相等(√) 2众数是总体中出现最多个体的次数。(×) 3 正态分布曲线形状与样本容量n无关(√) 4 假设检验显著水平越高,检验效果越好(×) 5 样本频率假设检验如果需要连续性矫正时,矫正系数=0. 5(×) 6 样本标准差是总体标准差的无偏估计(×) 7计算相关系数的两个变量都是随机变量(√) 8 试验因素的任一水平就是一个处理(×) 9 在同一显著水平下,双尾检验的临界正态离差大于单位检验(√) 10 LSD检验方法实质上就是t检验(×) 11对多个样本平均数仍可采用t测验进行两两独立比较。(×)

12假设测验结果或犯α错误或犯β错误。( × ) 三、选择题(18×2) 1、某学生某门课成绩为75分,则其中的变量为[ ] A. 某学生 B. 某门课成绩 C. 75分 D. 某学生的成绩 2、算术平均数的重要特性之一是离均差之和[ ] A 、最小 B 、最大 C 、等于零 D 、接近零 3、在回归直线y=a+bx 中,若b <0,则x 与y 之间的相关系数[ ] A. r=0 B. r=1 C. 0<r <1 D. -1<r <0 4、假定我国和美国的居民年龄的方差相同。现在各自用重复抽方 法抽取本国人口的1%计算平均年龄,则平均年龄的标准误 [ ] A.两者相等 B.前者比后者大 C 前者比后者小 D.不能确定大小 5、1-α是[ ] A.置信限 B.置信区间 C.置信距 D 置信水平 6、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是[ ] A 、12 B 、10 C 、8 D 、2 7、两个二项成数的差异显著性一般用[ ]测验。 A 、t B 、F C 、u D 、卡方测验 8、测验回归截距的显著性时,()/a t a s α=-遵循自由度为[ ] 的学生氏分布。 A 、n -1 B 、n -2 C 、n -m -1 D 、n 9、对一批大麦种子做发芽试验,抽样1000粒,得发芽种子870粒,若规定发芽率达90%为合格,测验这批种子是否合格的差异显著性为[ ]。 A 、不显著 B 、显著 C 、极显著 D 、不好确定 10设容量为16人的简单随机样本,平均完成工作需时13分钟。 已知总体标准差为3分钟。若想对完成工作所需时间总体构 造一个90%置信区间,则[ ] A 应用标准正态概率表查出u 值 B.应用t 分布表查出t 值 C.应用卡方分布表查出卡方值 D.应用F 分布表查出F 值

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

应用统计学的基本概念

第八讲 应用统计学的基本概念 Dr. Alan Moses 我是Alan Moses博士, 是马萨诸塞州波士顿的Joslin糖尿病中心的高级副院长和首席医生。在这部分讲座中,我们将学习应用统计学的基本概念。我们首先回顾在临床研究中统计学的作用。然后学习统计学的基本概念及常用统计学检验。最后我们将讨论一些所谓的“数据分析中的捣蛋鬼”。 临床研究中统计学的作用是什么?我们所做的就是区分事实和偶然性。我们需要比较组间差异,并检验干预的效应。 那么,临床研究中生物统计学家的作用是什么?虽然我们希望得到令人满意数据并知道如何设计试验及进行分析数据,但通常我们需要依靠生物统计学家的专业知识来选择适当的试验设计和计算适合的样本量。我们都应认识到样本量是由对结果的测定决定的,涉及其精确度、准确度、可重复性和可行性。此外,在进行数据分析时,生物统计学家帮助我们决定使用何种分析工具。在试验开始之前就应确定所使用的统计方法,非常重要的是, 分析方法决不能在试验完成之后加以改变. 在对试验进行分析时,统计学的作用是什么?我们应当记住,统计方法仅仅是一种帮助我们解释试验中所获得的数据的工具。它们是一种工具而不是试验的最终结果。而且像任何工具一样,使用统计工具必须小心。计算机可以产生一些或有统计学意义的数据,但是只有研究者才知道该使用何种统计学检验来进行统计学分析。已参加培训的研究者可以很容易地选择统计学检验方法,必须记住的很重要的一点是,对于没有足够知识的人而言,有强大功能的统计软件包可能导致致命性的错误。 生物统计学的重要概念之一是其正确性(validity)。对于关键性的数据分析、试验的结果尤其是结果的发表,正确性都是其核心。有两种正确性: 内部的和外部的(可推广性)。 内部的正确性就是在设定的试验范围内结果是准确的,使用的方法和分析经受得住检验,数据和相关的医学文献均支持研究者对试验结果的解释和结论。 外部正确性或可推广性决定了试验设计是否能够允许所做的观察和所得的结论推广到整个人群。试验人群的选择决定了最大可推广范围,这个概念我们在这个讲座的其它部分已经谈到过。如果研究对象包括男性、女性、不同的种族、不同的年龄分层,那么就有更多的机会将临床试验的结果应用于普通人群。另一方面,受试者的选择也将决定研究和结论可应用的人群范围。例如,如果在临床试验中选择年龄介于5-10岁的儿童,那么该试验的结果就仅能应用于该人群。如果选择45岁以上的亚洲男性作为受试者,那么试验结果就只能应用于这个人群。 在正确性的概念中,应该认识到须有足够的样本量以支持所得出的结论,同时要选择适当的对照人群,特别是强调随机双盲对照这一临床研究的根本的科学方法。著名科学家Isaac

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

《生物统计学-2019》复习题

《生物统计学》复习题 1.变量之间的相关关系主要有两大类:(因果关系),(平行关系) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生) 5.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(因变量) ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于 事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是

生物统计学(第三版)

概论 名词: 生物统计:将概率论和数理统计的原理应用到生物学中以分析和解释其数量资料的科学 试验设计:试验工作未进行之前应用生物统计原理,来制定合理的试验方案,包括选择动物,分组和对比以及相应的资料搜集整理和统计分析的方法。 总体与样本 ?数据具有不齐性。 ?根据研究目的确定的研究对象的全体称为总体(population); ?含有有限个个体的总体称为有限总体; ?包含有无限多个个体的总体叫无限总体; ?总体中的一个研究单位称为个体(individual); ?从总体中随机抽出一部分具有代表性的个体称为样本(sample); ?样本中所包含的个体数目叫样本容量或大小,常记为n。 ?通常把n≤30的样本叫小样本,n >30的样本叫大样本。 随机抽取(random sampling) 的样本是指总体中的每一个个体都有同等的机会被抽取组成 样本。 变数与变异数列、变量: ?变数:研究中对样本个体的观察值。 ?变量:相同性质的事物间表现差异性的某种特征。如:身高、体重。 ?变异数列:将变数按从小到大的顺序排列的一组数列。 参数与统计量 ?由总体计算的特征数叫参数(parameter); ?由样本计算的特征数叫统计量(staistic)。 准确性与精确性 ?准确性(accuracy)也叫准确度,指观测值与其真值接近的程度。若x与μ相差的 绝对值|x-μ|小,则观测值x的准确性高;反之则低。 ?精确性(precision)也叫精确度,指重复观测值彼此接近的程度。若观测值彼此接 近,即任意二个观测值xi、xj相差的绝对值|xi -xj |小,则观测值精确性高;反之 则低。 ?调查或试验的准确性、精确性合称为正确性。由于真值μ常常不知道,所以准确性 不易度量,但利用统计方法可度量精确性。 随机误差与系统误差 随机误差也叫抽样误差(sampling error) ,是由于许多无法控制的内在和外在的偶然因素所造成。带有偶然性质,在试验中,即使十分小心也难以消除。随机误差影响试验的精确性。统计上的试验误差指随机误差。这种误差愈小,试验的精确性愈高。 系统误差也叫片面误差(lopsided error),是试验处理之外的其他条件明显不一致所带来的偏差。是由于试验动物的初始条件相差较大,饲料种类、品质、数量、饲养条件未控制相同,测量的仪器不准、标准试剂未经校正,以及观测、记载、抄录、计算中的错误所引起。系统误差影响试验的准确性。 系统误差是一种有原因的偏差,因而在试验过程中要防止这种偏差的出现。随机误差是偶然性的。整个试验过程中涉及的随机波动因素愈多,试验的环节愈多,时间愈长,随机误差发生的可能性及波动程度愈大。随机误差不可避免,但可减少,这主要依赖控制试验过程,尤

相关文档