文档库 最新最全的文档下载
当前位置:文档库 › 统计学--精品课程

统计学--精品课程

统计学--精品课程
统计学--精品课程

第一章、总论

一、单项选择题(在每小题的四个备选答案中,选出一个正确答案)

1.在下列叙述中,不正确的是( D )。

A.“statistics”可以表示统计学 B.“statistics”可以表示统计数据

C.“statistics”可以表示统计资料

D.“statistics”可以表示统计检验

2. 政治算术学派的创始人( B )。

A.提出“统计学“的科学命名了

B. 创立了数量对比分析的方法

C.将概率论引入到统计学研究中

D.开展了国际性的统计学术交流

3.在下列叙述中,关于推断统计的描述是( B )。

A.一个饼图描述了某医院治疗的癌症类型,其中2%是肾癌,19%是乳腺癌

B.从一个果园中抽取36个橘子的样本用该样本的平均重量估计果园中橘子的平均重量

C.一个大型城市在元月份的平均汽油价格

D.反映大学生统计学成绩的条形图

4.为了统计职工工资收入的一般水平,从全部职工中抽出足够多的职工进行调查,这个方法体现了统计的(D )。

A.平均法

B.综合法

C.分组法

D.大量观察法

5.以下各项属于品质标志的有( B )。

A.工龄

B.健康状况

C.工资水平

D.劳动时间利用率

6.连续变量(C )。

A.表现形式为整数

B.取值可一一列举

C.取值连续不断,不能一一列举

D.一般都四舍五入取整数

7.下列项目中属离散性变量的是( D )。

A.资产占有量

B.经济类型

C.生产经营方向

D.职工人数

8.统计指标(A )。

A.都是可计量的

B.都是数量指标

C.都有具体数值

D.都表现为绝对数

9.总体单位组成统计总体的条件是( A )。

A.同质性

B.大量性

C.依存性

D.差异性

10.某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。在研究中,该研究人员感兴趣的变量是( A )。

A.该大学一年级新生的教科书费用

B.该大学的学生数

C.该大学一年级新生的教科书数量

D.大学生的生活成本

11.根据样本计算的用于描述总体特征的度量工具(如均值)被称为( A )。

A.参数

B.总体

C.样本

D.统计量

12.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该研究中,样本是(D )。

A.100所中学

B.20个城市

C.全国的高中生

D.100所中学的高中生

13.性别的数据所采用的计量尺度是(C )。

A.定距尺度 B.定序尺度 C.定类尺度 D.定比尺度

14.考分的数据所采用的计量尺度是( A )。

A.定距尺度 B.定序尺度 C.定类尺度 D.定比尺度

15.以一个企业作为总体,下列属于质量统计指标的是( B )。

A.商品销售额

B.产品合格率

C.商品库存量

D.产品产量

16.了解某市失业人员基本情况,下列属于标志的是( D )

A.该市失业人员总数

B.该市男性失业人员数

C.该市失业人员性别构成

D.该市每位失业人员的性别

17.某人身高为“0”,表示没有这个人。因此,身高属于( D )

A.列名尺度

B.顺序尺度

C.间隔尺度

D.比例尺度

18.某手机厂商认为,如果流水线上组装的手机出现故障的比率每天不超过3%,则组装过程是令人满意的。为了检验某天生产的手机质量,厂商从当天生产的手机中随机抽取了30部进行检验。手机厂商感兴趣的总体是( C )

A.抽取的30部手机

B.30部手机的检测结果

C.当天生产的全部手机

D.3%有故障的手机

19.了解某公司职工文化程度情况,总体单位是( B )

A.该公司全体职工

B.该公司每一位职工

C.该公司全体职工文化程度

D.该公司每一位职工文化程度

20.某位学生期末考试成绩为“0”分,则成绩属于( C )

A.列名尺度

B.顺序尺度

C.定距尺度

D.定比尺度

21.统计的含义包括( D )

A.社会经济统计和数理统计

B.描述统计和推断统计

C.理论统计和应用统计

D.统计工作、统计资料和统计学

22.在数据的计量尺度中,要求必须有一个绝对固定“零点”的尺度是(D )

A.定类尺度

B.定序尺度

C.定距尺度

D.定比尺度

二、多项选择题(在每小题的五个备选答案中,选出二至五个正确答案)

1.统计研究大量客观现象的数量方面的含义是(BCE )。

A.只研究数量方面,不涉及质的方面

B.在质与量的辨证统一中研究现象数量方面

C.将个别现象的调查结果综合起来的总体数量方面

D.只研究总体的数量方面而与个别现象的数量无关

E.研究数量方面的出发点和目的地都是认识现象质的特征

2.统计研究对象的基本特点有(AC )。

A.数量性

B.抽象性

C.总体性

D.复杂性

E.个体性

3.总体单位是指(ADE )。

A.构成总体的各个个别事物

B.任何一个个别事物

C.统计指标说明的对象

D.标志说明的对象

E.组成总体的基本单位

4.下列各项中属于数量标志(数量变量)的有(BCE )。

A.企业的地址

B.企业注册资金

C.企业开工时间

D.企业经营方向

E.企业产品品种数

5.在人口普查中(ABCDE )。

A.被普查的每个人是总体单位

B.性别是属性变量

C.年龄是数量变量

D.女性人口比重是统计指标

E.总人口是数量指标

6.离散型变量的变量值(ABCDE )。

A.是间断的(非连续的)

B.表现形式为整数

C.可以一一列举

D.相邻数值间不可分割

E.要用点数的方法取得资料

7.构成统计指标的基本要素有(ABCDE )。

A.指标名称

B.计算方法

C.计量单位

D.具体数值

E.时间及空间限制

8.研究某市运输企业生产情况(ABCDE )。

A.总体是该市全部运输企业

B.总体单位是该市每个运输企业

C.各个运输企业的“货物周转量”是标志

D.全部运输企业“货物周转量”是指标

E.该市公路货运量与水路货运量的比例是指标

9.在工业普查中(ABCDE )。

A.各工业企业设备台数是离散型变量

B.某机械工业企业的年生产能力3万台是标志值

C.某企业的产品合格率97%是标志值

D.工业企业职工总人数是统计指标

E.具有高级职称的职工人数是质量指标

10.下面有关变量的描述中正确的是(ABCDE )

A.变量是指说明现象某种特征的概念

B.变量的具体表现称为变量值

C.统计数据就是变量的具体表现

D.变量有品质变量和数量变量

E.数量变量分为离散变量和连续变量

11.统计学是一门(CDE )统计数据的科学,其目的是探索数据内在的数量规律性。

A.设计

B.鉴别

C.收集

D.整理

E.分析

三、判断题(正确的打“√”,错误的打“×”)

1.统计工作实质就是一种单纯的计数活动。×

2.统计研究的是现象的抽象数量方面。×

3.统计总体的同质性要求构成总体的各个总体单位必须具有许多相同的属性或特征。×4.在职工文化素质调查中,“大专文化程度”是品质标志。×

5.“工业增加植1000万元”不是一个要素完整的统计指标。√

6.统计指标的概念只能理解为“反映总体现象数量特征的概念(或范畴)及其具体数值。”×

7. 所有统计指标的数值大小都由研究范围的大小来决定。×

8. 描述统计是推断统计的基础。√

9. 质量指标就是反映产品质量和工作质量的指标。×

第二章、统计数据的搜集与整理

一、单项选择题(在每小题的四个备选答案中,选出一个正确答案)

1.在某市工业设备普查中,调查单位是(D )。

A. 该市每一家工业企业

B. 该市全部工业设备

C. 该市全部工业企业

D. 该市全部工业企业中的每一台工业生产设备

2.某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商场、超市随机调查了200名顾客。该公司采用的调查方法是(C )。

A. 直接观察法

B. 报告法

C. 访问法

D.很难判断

3.企业要对流水生产线上的产品质量实行严格把关,那么,在质量检验时最合适采用的调查组织方式是( D )。

A. 普查

B. 重点调查

C.典型调查

D. 抽样调查

4. 统计资料按数量标志分组后,处于每组两端的数值叫(C )。

A. 组距

B. 组数

C. 组限

D. 组中值

5. 统计表中的主词是指( C )。

A. 统计表的横行标题

B. 统计表的纵栏标题

C. 统计表所要说明的总体

D. 说明总体的统计指标

6.某电视台要对一知名栏目的收视情况进行调查,宜采用( C )

A.普查

B.重点调查

C.抽样调查

D.典型调查

7.在全距一定的情况下,若编制等距变量数列,则组距的大小与组数的多少( A )。

A.成反比

B.成正比

C. 有时成正比有时成反比

D. 无关系

8.统计表的宾词是(A )。

A.说明总体的统计指标

B.总体单位的名称

C.统计表的类型

D.说明总体的性质

9.调查单位是( B )

A.调查研究的总体或调查范围

B.调查项目的承担者或载体

C.填报单位

D.调查对象

10.按“上组限不在内”原则,凡遇到某标志值刚好等于相邻组上、下限时,一般是( B )

A.将此值归入上限所在组

B. 将此值归入下限所在组

C.将此值归入上限所在组或下限所在组均可

D.另设一组

二、多项选择题(在每小题的五个备选答案中,选出二至五个正确答案)

1. 统计调查方案的基本内容包括(ABCDE )。

A. 确定调查目的

B. 确定调查对象和调查单位

C. 确定调查项目,拟定调查表

D. 确定调查时间

E. 确定调查方法以及调查工作的组织及实施计划

2.下面调查中属于一次性调查的是( ACD )。

A. 近10年我国利用外资情况调查

B. 按月统计的钢产量调查

C.2006年全国大学毕业生分配去向调查

D. 10年一次的人口普查

E. 一批产品合格率的检查

3. 统计整理的步骤一般为(DACEB )。(排序)

A. 审核统计资料

B. 编制统计数列和统计表

C. 选择标志对总体进行分组

D. 设计统计整理方案

E. 计算和汇总

4.下列各项中按数量标志分组的有( ACDE )。

A. 人口按年龄分组

B. 人口按文化程度分组

C. 家庭按子女数分组

D. 家庭按月收入分组

E. 企业按年产值分组

5.统计表从形式上看,它是由(ABCE )构成的。

A. 总标题

B. 纵栏标题

C. 横行标题

D. 主词与宾词

E. 数字资料

6.普查是(BCD )

A.非全面调查

B.全面调查

C.专门调查

D.一次性调查

E.经常性调查

7.在组距式分组中,(ACDE )

A.遵循“不重不漏”原则

B.习惯上规定“下组限不在内”

C.离散变量可采用相邻两组组限间断的方法

D.连续变量可采用相邻两组组限层叠的方法

E.开口组通常以相邻组的组距作为其组距

8.在某地区居民家庭按月消费支出分组为500元以下、500-800元、800-1500元、1500元以上的资料中( BCD )。

A.第一组假定下限为0

B.属于异距分组

C.第一组和最后一组是开口组

D.相邻组限是重叠的

E.某家庭月消费支出为1500元,应归入800-1500组

9.次数分配数列( ACDE )

A.是由总体各个组及各组次数或频率两个要素构成

B.是由组距、组限和组中值构成

C.包括品质数列和变量数列

D.可以用图形来表示

E.可以说明总体结构和分布特征

10.统计表按用途不同,可分为(ACD )

A.调查表 B.简单表 C.分析表 D.整理表 E.分组表

三、判断题(正确的打“√”,错误的打“×”)

1. 各种调查方式必须结合运用。×

2. 统计整理只是一个从调查到分析的中间环节,在统计工作过程中可以进行,也可以不进行。×

3. 统计分组的关键问题是确定分组标志和划分分组界限√。

4. 为了保证总体中每一个单位在分组时不被遗漏,分组时应满足最小组的下限低于最小变量值、最大组的上限高于最大变量值这个条件。×

5. 组中值可以近似地表示各组变量值的平均水平。√

6. 变量数列按其表现形式可以分为等距数列和异距数列两种。×

7. 如果总体中存在极大值或极小值,则可以在组距数列中使用开口组。√

8. 统计分组是编制次数分配数列的基础。√

9. 调查单位可以是人、社会组织,也可以是物或其他任何事物,但报告单位只能是人或组织。√

10.调查单位和填报单位都是资料的承担者。×

第三章、统计数据的简单描述

一、单项选择题(在每小题的四个备选答案中,选出一个正确答案)

1. 在总量指标中,综合性最强的统计指标是(B )。

A. 实物指标

B. 价值指标

C. 劳动量指标

D. 标准实物量指标

2.“某年中国人均收入是美国人均收入的1/3”,这一指标是(C )。

A. 平均指标

B.比例相对指标

C.比较相对指标

D.强度相对指标

3. 我国国有工业企业产值占全部工业产值的比重,这一指标是( A )。

A. 结构相对指标

B. 比例相对指标

C. 比较相对指标

D. 动态相对指标

E. 强度相对指标

4. 我国1999年的税收收入是20年前的5倍,这一指标是( D )。

A. 结构相对指标

B. 比例相对指标

C. 比较相对指标

D. 动态相对指标

E. 强度相对指标

5. 某厂1996年完成产值2000万元,1997年计划增长10%,实际完成2310万元,超额完成计划( B )。

A. 5.5%

B. 5%

C. 115.5%

D. 15.5%

6. 将比较的基数确定为10,计算出来的相对数是(B )。

A. 系数

B. 成数

C. 百分数

D. 千分数

E. 倍数

7. 以一个企业为总体,该企业报告期职工人数200人,全年工资总额2500万元,则(D )。

A.企业职工人数是总体标志总量,工资总额是总体单位总量

B.企业职工人数是总体单位总量,工资总额也是总体单位总量

C.企业职工人数是总体标志总量,工资总额也是总体标志总量

D.企业职工人数是总体单位总量,工资总额是总体标志总量

8. 在相对指标中,用有名数形式表现的统计指标是( E )。

A. 结构相对指标

B. 比例相对指标

C. 比较相对指标

D. 动态相对指标

E. 强度相对指标

9.在总量指标中,指标数值与时间长短直接相关的是( A )

A. 时期指标

B. 时点指标

C. 平均指标

D. 相对指标

10. 某地区2008年年平均人数为1000万人,商业零售企业4000个,则商业网点密度指标为( D )

A.2.54个/人 B.0.25个/千人 C.250个/人 D.2500人/个

二、多项选择题(在每小题的五个备选答案中,选出二至五个正确答案)

1. 以一个企业作为总体,下列属于总量指标的是( AB )。

A. 职业人数

B. 工业总产值

C. 人均产值

D. 平均工资

E.产值利税率

2. 以一个企业作为总体,下列属于相对指标的是( ABCD)。

A. 资产负债率

B. 产值利润率

C.流动资金周转率

D.职工出勤率

E.人均收入

3. 以一个企业作为总体,下列属于质量指标的是( ABE )。

A. 劳动生产率

B. 产品合格率

C. 商品库存量

D. 产品产量

E. 产值利税率

4. 在相对指标中,分子指标与分母指标可以互换的是(BCE )。

A. 结构相对指标

B. 比例相对指标

C. 比较相对指标

D. 动态相对指标

E. 强度相对指标

5. 相对指标的表现形式有( AE )

A.有名数 B. 样本数 C.抽样数 D.平均数 E.无名数

6. 相对指标中属于不同总体内数值对比的是( CD )

A.结构相对指标 B.比例相对指标 C. 比较相对指标

D.强度相对指标 E. 动态相对指标

7. 下列属于强度相对指标的有( ABCE )

A. 人均国内生产总值

B. 人口密度

C. 人均粮食产量

D.人均粮食消耗量 E. 人口自然增长率

8. 以统计分组为计算前提的相对指标有( AB )

A.结构相对指标 B.比例相对指标 C. 比较相对指标

D.强度相对指标 E. 动态相对指标

三、判断题(正确的打“√”,错误的打“×”)

1. 用劳动单位表示的总量指标,称为劳动量指标,它是不能直接相加的×。

2. 强度相对指标的数值是用复名数表示的,可以计算它的正指标和逆指标。√

3. 计划完成相对指标数值越大,说明完成计划的情况越好×。

4. 甲、乙两个地区的国内生产总值分别为20亿元、15亿元,甲地区比乙地区多5亿元,以上指标均属于总量指标。√

5. 新增职工人数属于时点指标。×

6.某厂产值计划在去年的基础上提高8%,计划的执行结果是仅提高4%,产值的计划任务仅实现一半。×

第四章、统计数据分布特征的描述

一、单项选择题(在每小题的四个备选答案中,选出一个正确答案)

1. 调和平均数是( C)。

A. 总体标志总量指标与总体单位总量指标的比值

B. 总体各单位变量值倒数的算术平均数

C. 总体各单位变量值倒数算术平均数的倒数

D. 总体各单位变量值连乘积的平方根

2. 在分组的情况下,总体平均指标数值的大小( C )。

A. 只受各组变量值水平的影响,与各组单位数无关

B. 只受各组单位数的影响,与各组变量值水平无关

C. 既受各组变量值水平的影响,又与各组次数有关

D. 既不受各组变量值水平的影响,也部受各组次数的影响

3. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是(D )。

A. 各组次数必须相等

B. 各组必须是闭口组

C. 总体各单位变量值水平相等

D. 总体各单位变量值水平在各组内呈均匀分布

4. 标志变异指标反映了总体各单位变量值分布的( B ).

A. 集中趋势

B. 离散趋势

C. 变动趋势

D. 长期趋势

5. 下列变异指标中,受极端数值影响最大的是(A )。

A. 全距

B. 平均差

C. 标准差

D. 变异系数

6. 算术平均数与总体单位数的乘积等于( A )。

A. 总体各单位变量值的总和

B. 总体各单位变量值的连乘积

C. 总体各单位变量值与平均数的离差

D. 总体各单位变量值与平均数离差的平方

7. 权数对算术平均数的影响作用,实质上取决于( A )。

A. 作为权数的各组单位数占总体单位数比重的大小

B. 各组变量值占总体标志总量比重的大小

C. 变量值本身的大小

D. 变量值数量的多少

8.平均指标反映了总体分布的(A )。

A. 集中趋势

B. 离散趋势

C. 变动趋势

D. 长期趋势

9.数据观察值与均值之差的和( A )。

A.等于零

B.大于1

C.为最大

D.为最小

10.如果一组数据是右偏分布,则 X 、Me 、Mo 三者之间的关系表现为( B )

A.X=Me=Mo

B. X >Me >Mo c. X <Me <Mo D. X >Mo >Me

11.若男青年组体重均值为55公斤,标准差为4.2公斤,离散系数为7.6%;女青年组体重均值为48公斤,标准差为3.9公斤,离散系数为8.1%,则( B )。

A.男青年组体重差异大于女青年组

B.男青年组体重差异小于女青年组

C.男青年组体重差异与女青年组相同

D.男女青年组体重差异无法确定

12.算术平均数(均值)的数学性质( C ) A.min )(1=-∑=N i X X B.min 1=-∑=N

i X X C.()min 21=-∑=N i X X D.()max 21=-∑=N i X X

13.如果一组数据是左偏分布,则X 、

e M 、o M 三者之间的关系表现为(C ) A.X =e M =o M B.X >e M >o M

C.X

D.X

14.有下列资料:75、78、80、82、87、90、91、92,中位数是( B )

A.82

B.84.5

C.87

D.90

二、多项选择题(在每小题的五个备选答案中,选出二至五个正确答案)

1. 数值平均数的计算方法有( ADE )。

A. 算术平均法

B. 众数法

C. 中位数法

D. 调和平均法

E. 几何平均数

2.位置平均数的计算方法有( BC )。

A. 算术平均法

B. 众数法

C. 中位数法

D. 调和平均法

E. 几何平均数

3. 在下列条件下,加权算术平均数和简单算术平均数相等(ADE )。

A. 各组次数相等

B. 各组变量值不等

C. 变量数列为组距数列

D. 各组次数都为1

E. 各组次数占总次数的比重相等

4. 数据集中趋势的测度值主要有(ABCDE )

A.众数

B.中位数

C.均值

D. 调和平均数

E.几何平均数

5.众数( ABCDE )

A.是一组数据中出现次数最多的变量值

B.从分布的角度看,是一组数据分布的最高峰点所对应的数值

C.是位置平均数

D.不受数据中极端值的影响

E.不一定存在,若存在也不一定是唯一的

6.在一个正态分布下,中位数( AC )

A. 等于算术平均数

B. 小于算术平均数

C. 等于众数

D. 大于众数

E. 无法判断

7. 加权算术平均数的大小( ABC )

A. 受各组次数多少的影响

B. 受各组标志值大小的影响

C. 受各组标志值和次数的影响

D. 不受标志值的影响

E. 与各组次数分布无关

三、判断题(正确的打“√”,错误的打“×”)

1. 根据组距数列计算的平均指标是一个近似值。√

2. 众数是变量数列中最大的次数。×

3. 平均指标反映了现象的一般水平,但掩盖了总体各单位的差异,因此仅通过这个指标不能全面反映总体的特征。√

4. 所有冠以“平均”一词的统计指标都是平均指标。×

5. 变量的变异程度越高,其平均指标的代表性就越高;反之就越低。×

6. 比较不同总体变异程度的高低,既可以用变异系数,也可以用标准差或其他变异指标。×

7. 用加权平均数法计算标准差,既适用于分组资料,也适用于未分组资料。×

8. 平均指标必须而且只能在同质总体中计算。√

9. 根据组距数列计算中位数,其假定条件是变量值在中位数组分布均匀。√

10. 根据组距数列计算众数时,如果众数组前一组次数等于其后一组次数,则众数等于众数组的组中值。√

11.根据组距数列计算的平均指标是不精确的。

12. 众数在统计分布中不一定存在,若存在也不一定是唯一的。

13. 标准差和标准差变异(离散)系数都是反映变量离散的绝对水平的。

14. 中位数是指总体中出现次数最多的变量值。

15. 变量值与中位数之差的绝对值之和小于变量值与均值之差的绝对值之和。

第六章、抽样估计

一、单项选择题(在每小题的四个备选答案中,选出一个正确答案)

1,抽样误差是指( C )

A. 由于观察、计算等差错所引起的登记误差

B.抽样中违反随机原则出现的系统误差

C. 随机抽样而产生的代表性误差

D.认为原因所造成的误差

2.抽样误差( D )

A.既可以避免,也可以控制 B. 既不可以避免,也不可以控制

C. 可以避免, 但不可以控制

D. 不能避免, 但可以控制

3. 抽样平均误差反映了样本估计量与总体参数之间的( C )

A. 实际误差

B. 可能误差范围

C. 平均差异程度

D. 实际误差的绝对值

4.抽样平均误差是(C )

A. 总体参数的标准差

B. 样本的标准差

C.样本估计量的标准差

D. 样本估计量的平均差

5.在其他条件不变的情况下, 不重复抽样的抽样误差比重复抽样的抽样误差( B )

A. 大

B. 小

C. 可大可小

D. 相等

6. 反映样本估计量与总体参数之间抽样误差的可能范围的是( B )

A. 抽样平均误差

B. 抽样极限误差

C. 实际抽样误差

D. 置信水平

7.简单随机抽样条件下, 当极限误差扩大一倍, 则样本容量( B )

A. 只需原来的1/2

B. 只需原来的1/4

C. 需要原来的1倍

D. 需要原来的4倍

8.在其他条件不变的情况下, 总体方差越大, 所需样本容量(A )

A. 越多

B. 越少

C. 可多可少

D. 不受影响

9.下列描述不正确的是( B )

A.样本统计量是一种随机变量

B.样本统计量不是一种随机变量

C.每个随机变量都有其概率分布

D.样本统计量概率分布就是抽样分布

10.中心极限定理证明了:当总体期望值μ和方差2

σ存在、且有限时,随机抽样下的大

样本均值服从下列分布( C )

A.N(0,1)

B.N(

2

μ) C.N(

2

1

μ

n) D.t(n-1)

11.某大学经管学院为调查学生思想状况,从全院80个自然班中抽取5个班组成样本,抽中班的所有学生均为样本单位。该抽样方法属于( D )

A.简单随机抽样

B.分层抽样

C.系统抽样

D.整群抽样

12.在参数估计中,当样本容量确定时,置信区间的宽度随置信水平的增大而( A )

A.增大

B.减小

C.不变

D.可大可小

13.以下关于标准正态分布的描述不正确的是(C )

A.以纵坐标为中心的对称分布

B.密度函数已知

C.期望值为1,方差为0

D.分布形状为两头小中间大的钟形分布

14.如果数据是钟形分布,则根据经验规则可以判断,落在均值的两个标准差附近的数据所占比例大约为( C )

A.68%

B.75%

C.95%

D.99%

15.某大学商学院为调查毕业生就业倾向,从所设5个专业中抽取45人组成样本,具体为:会计15人、金融10人、市场营销8人、经济管理6人、信息管理6人。该抽样方法属于( B )。

A.简单随机抽样

B.分层抽样

C.系统抽样

D.整群抽样

16.在参数估计其他条件不变情况下,可接受的允许误差越大,所需样本容量( A )。

A.越小

B.越大

C.不变

D.可大可小

二、多项选择题(在每小题的五个备选答案中,选出二至五个正确答案)

1.用样本估计量估计总体参数应满足( BCE )

A. 代表性

B.无偏性

C.有效性

D.优良性

E.一致性

2.影响抽样误差的因素包括( ABCE )

A. 总体标准差

B.样本容量

C.抽样方法

D.抽样目的

E.抽样组织形式

3.在一定的极限误差要求下( BC )

A. 概率度大, 要求可靠性低, 样本容量相应要多

B. 概率度大, 要求可靠性高, 样本容量相应要多

C. 概率度小, 要求可靠性低, 样本容量相应要少

D. 概率度小, 要求可靠性高, 样本容量相应要少

E. 概率度小, 要求可靠性低, 样本容量相应要多

4.影响必要样本容量的因素有( ABCDE )

A. 置信水平

B. 抽样极限误差

C. 抽样组织形式

D. 总体方差

E. 抽样方法

5.抽样误差是( ABE )

A.代表性误差 B.样本统计量的标准差 C.登记性误差

D. 系统性误差

E.随机误差

6.在抽样误差一定的条件下( ADE )

A.扩大极限误差,可以提高估计的可靠程度

B. 缩小极限误差,可以提高估计的可靠程度

C.扩大极限误差,只能降低估计的可靠程度

D.缩小极限误差,只能降低估计的可靠程度

E.极限误差的变化必然引起可靠程度的变化

7.在抽样估计中应用的抽样误差有( BD )

A.实际抽样误差 B. 抽样平均误差 C. 抽样平均数

D. 抽样极限误差

E. 抽样误差的概率度

三、判断题(正确的打“√”,错误的打“×”)

1.抽样估计是用样本统计量对总体参数进行估计的, 不可避免会产生误差,而且这种误差的大小是不能进行控制的。×

2.抽样平均误差随样本估计值的不同而变化.因此,抽样平均误差是随机变量。×

3.抽样极限误差可以大于、等于或小于抽样平均误差。√

4.当抽样平均误差一定时,概率度越小,估计的可信度越高。×

5.在极限误差一定的条件下,如果有两次比率的资料P1、P2,其中P1>P2,则应根据P1

计算必要样本容量。×

6.不重复抽样的抽样平均误差是在重复抽样的抽样平均误差的基础上乘以修正系数(N-n)/(N-1)。×

7. x抽样分布形式只与样本容量的大小有关,而与原有总体分布无关×

8. 随机变量都有概率分布,随机抽样的样本是随机的,所以也有其概率分布。√

9. 不重复抽样与重复抽样的抽样平均误差相等。×

10. 在参数估计中,样本容量与总体方差成反比。×

第八章、相关与回归分析

一、单项选择题(在每小题的四个备选答案中,选出一个正确答案)

1.若物价上涨,商品的需求量相应减少,则物价与商品需求量之间的关系为( B )

A. 不相关

B. 负相关

C. 正相关

D. 复相关

2.判断现象间线性相关关系的密切程度的主要方法是( D )

A. 对现象做定性分析

B. 编相关表

C. 绘相关图

D. 计算相关系数

3.相关系数可以说明( C )

A. 现象之间的因果关系

B. 现象之间的函数关系

C. 相关关系的方向和密切程度

D. 相关关系的表现形式

4.相关系数r的取值范围( C )

A. 0≤r≤1

B. -1<r<1

C. -1≤r≤1

D. -1≤r≤0

5.配合一元线性回归方程对资料的要求是( B)

A. 因变量是给定的数值, 自变量是随机的

B.自变量是给定的数值, 因变量是随机的

C. 自变量和因变量都是随机的

D.自变量和因变量都不是随机的

6.产品产量与单位成本的相关系数是-0.88, 单位成本与利润率的相关系数是-0.94, 产量与利润之间的相关系数是0.81, 因此( B )

A. 产量与利润的相关程度最高

B. 单位成本与利润率的相关程度最高

C. 产量与单位成本的相关程度最高

D.看不出哪对变量间的相关程度最高

7.每吨铸件成本(元)和每一个工人劳动生产率(吨)之间的回归方程为

x y5.0

270-

=

,

这意味着劳动生产率提高1吨,单位成本平均将(C )

A. 降低269.5元

B. 提高269.5元

C. 降低0.5元

D. 提高0.5元

8.每吨铸件成本(元)和铸件废品率(%)之间的回归方程为

x

y8

56+

=

, 这意味着( C )

A. 废品率每增加1%, 每吨成本平均增加64元

B. 废品率每增加1%, 每吨成本平均增加8%

C. 废品率每增加1%, 每吨成本平均增加8元

D. 废品率每增加1%, 则每吨成本为56元

9.下列不属于相关关系的是( C )

A.劳动生产率与工资的关系

B.投资额与国民收入的关系

C.销售额与销售价格、销售量的关系

D. 施肥量与单产量的关系

10.下列不属于相关关系的是( A )

A.工资总额与员工人数的关系

B.储蓄额与利率、物价指数的关系

C.销售额与广告费的关系

D.工业产值与固定资产投资的关系

11.用最小二乘法估计简单线性回归模型中的参数,需满足( B )

A.实际观察值等于回归估计值

B.实际观察值与回归估计值离差和等于最小值

C.实际观察值与回归估计值离差平方和等于最小值

D.实际观察值与回归估计值离差平方和等于零

12.当相关系数0< r <1,表明x与y( C )

A.完全线性相关

B.没有线性相关

C.存在一定线性相关

D.存在一定非线性相关

13.由同一资料计算的相关系数r与回归系数b之间的关系是( D )

A.r大,b也大

B.r小,b也小

C.r与b同值

D.r与b的正负号相同

二、多项选择题(在每小题的五个备选答案中,选出二至五个正确答案)

1.下列属于正相关的现象是( ABE )

A. 家庭收入越多, 其消费支出也越多

B. 某产品产量随工人劳动生产率的提高而增加

C. 流通费用率随商品销售额的增加而减少

D. 生产单位产品所耗工时随劳动生产率的提高而减少

E. 产品产量随生产用固定资产价值的减少而减少

2.下列属于负相关的现象是( ABD )

A. 品流转的规模越大, 流通费用水平越低

B. 流通费用率随商品销售额的增加而减少

C. 国民收入随投资额的增加而增长

D. 生产单位产品所耗工时随劳动生产率的提高而减少

E. 某产品产量随工人劳动生产率的提高而增加

3.若两个变量之间的相关系数为-1, 则这两个变量是( AD )

A. 负相关关系

B. 正相关关系

C. 不相关

D. 完全相关

E. 不完全相关

4.回归分析的特点有( ABDE )

A. 两个变量是不对等的

B. 必须区分自变量和因变量

C. 两个变量都是随机的

D. 因变量是随机的

E. 自变量是给定的

5.工人的工资(元)依劳动生产率(千元)的回归方程为:

x

y70

10+

=

, 这意味着( DE )

A. 若劳动生产率为1000元, 则工人工资为70元

B. 若劳动生产率每增加1000元, 则工人工资增长80元

C. 若劳动生产率不变, 工人工资为80元

D. 若劳动生产率减少500元, 工人工资减少35元

E. 若劳动生产率增加1000元, 工人工资提高70元

6. 从变量相关关系的表现形式看,相关关系可以分为( BC )

A.完全相关

B.线性相关

C.非线性相关

D.单相关

E.不完全相关

7. 从变量相关的程度看,相关关系可以分为( ACE )。

A.完全相关

B.线性相关

C.不相关

D.简单相关

E.不完全相关

8. 判定现象间有无相关关系的方法有( ABC )

A.对现象作定性分析 B. 编制相关表 C. 绘制相关图

D. 计算相关系数

E. 计算估计标准误

三、判断题(正确的打“√”,错误的打“×”)

1.相关与回归分析所研究的变量之间不是对等的,必须确定其中的自变量和因变量。×

2.若变量X和Y之间具有线性相关关系,就可以建立一元线性回归模型进行回归分析。×

3.一元线性回归方程中的回归系数表示:当自变量x变动一个单位时,因变量y平均改

变的数量。√

4.一元线性回归方程

x

y578

.0

844

.3+

-

=

,说明自变量和因变量之间存在负相关关系。

×

5.相关系数不仅能反映变量间线性相关程度,也能确定变量的因果关系。×

6.相关系数r只反映变量间的线性相关程度,不能说明非线性相关关系。√

7.两变量呈正相关,则必定为线性相关。×

8.单变量分组相关表是将因变量进行分组后编制的相关表。×

第九章、时间序列分析

一、单项选择题(在每小题的四个备选答案中,选出一个正确答案)

1.构成时间序列的两个基本要素是(C )

A.主词与宾词

B.变量与频数

C.现象所属时间与指标数值

D.现象所属时间与次数

2.下面数列哪个属于时间序列( D )

A.学生按成绩分组形成的数列

B.人口按性别分组形成的数列

C.家禽按重量分组形成的数列

D.产量按时间先后形成的数列

3.把最近10年来每年的居民储蓄存款额按时间先后排列形成的时间序列称为( C )

A.变量序列

B.时期序列

C.时点序列

D.平均数序列

4.某企业2006年1月初职工人数为190人,2月初职工人数为215人,3月初职工人数为220人,4月初职工人数为230人.则第一季度的平均职工人数为( A )

A.209人

B.208人

C.214人

D.215人

5.在时间序列中,累计增长量等于与之对应的各个逐期增长量之(A )

A.和

B.差

C.积

D.商

6.在时间序列中,定基发展速度等于相应各期环比发展速度之( C )

A.和

B.差

C.积

D.商

7.根据间隔不相等的间断时点序列计算平均发展水平的方法是( B )

A.简单算术平均法

B.加权序时平均法

C.加权算术平均法

D.首尾折半法

8.已知环比增长速度分别为20%、15%、12%和8%,则定基增长速度为(D )

A.20%×15%×12%×8% B. 120%×115%×112%×108%

C.(20%×15%×12%×8%)-100% D. (120%×115%×112%×108%)-100%

9.某产品产量2006年比2001年增长了35%,那么该产品产量的平均发展速度是( B )

A.35%的5次方根

B.135%的5次方根

C.35%的6次方根

D. 135%的6次方根

10.某企业历年产量发展速度资料如下:2000-2003各年均为110%,2004-2006各年均为

108%,则该企业2000-2006年产量平均发展速度为( C )

A.

%

108

%

110?

B.

7%

108

%

110?

C.73

4%

108

%

110?

D.

63

3%

108

%

110?

11.有某公司2002-2006年商品销售额资料,以该时间序列中间项为原点,配合直线趋势方

程y=610+73t,利用该直线趋势方程预测2008年商品销售额为( D )

A.683

B.756

C.829

D.902

12.已知中国海关出口商品总额1999年比上年增长6.11%、2000年比上年增长27.84%、2001年比上年增长6.8%、2002年比上年增长22.33%,则中国海关出口商品总额2002年比1998年增长了( D )

A.6.11%×27.84%×6.8%×22.33%

B.6.11%+27.84%+6.8%+22.33%

C.106.11%×127.84%×106.8%×122.33%

D.(106.11%×127.84%×106.8%×122.33%)-100%

13.影响时间序列的因素不包括( C )

A.长期趋势

B.季节变动与循环变动

C.确定性变动

D.不规则变动

14.若某公司2008年第二季度商品库存量为:3月末66件、4月末72件、5月末64件、6月末68件。则该公司第二季度商品月平均库存量为( C )

A.(66+72+64+68)÷4

B.(72+64+68)÷3

C.(66/2+72+64+68/2)÷3

D.(66/2+72+64+68/2)÷4

15.计算平均发展速度时,如果是侧重于所研究现象最末期的水平,则应采用( C )

A.算术平均法

B.调和平均法

C.几何平均法

D.方程式法

16.时期数列与时点数列的特点之一是( C )

A.时期数列与时点数列都具有可累加性

B.时期数列与时点数列都不具有可累加性

C.时期数列具有可累加性,时点数列不具有可累加性

D.时期数列不具有可累加性,时点数列具有可累加性

17.季节比率说明的是( D )

A.各季节趋势的影响

B.各季节的不规则差异

C.各季节绝对水平的差异

D.各季节相对差异

二、多项选择题(在每小题的五个备选答案中,选出二至五个正确答案)

1.平均增长量的计算方法有(AE ) A.逐期增长量个数逐期增长量之和 B.1-逐期增长量个数逐期增长量之和 C.累计增长量个数累计增长量之和 D.时间序列项数累计增长量

E.1-时间序列项数累计增长量

2.增长速度的计算方法有( BE )

A.报告期发展水平与基期发展水平之比

B.增长量与基期水平之比

C.增长量与报告期水平之比

D.平均增长量与基期水平之比

E.发展速度-1

3.用几何平均法计算平均发展速度时,被开方的指标是(ACD )

A.环比发展速度的连乘积

B.环比增长速度的连乘积

C.发展总速度

D.最末发展水平与最初发展水平之比

E.发展水平之和

4.一般而言,影响时间序列的因素有( ABCE )

A.长期趋势

B.季节变动

C.循环变动

D.确定性变动

E.不规则变动

5.关于序时平均数的计算下列描述正确的是(BCDE )。

A.时点序列都采用序时平均法计算

B.时期序列应采用算术平均法计算

C.逐日登记的时点序列也应采用算术平均法计算

D.间隔相等的时点序列可采用首末折半法计算

E.间隔不相等的时点序列采用加权序时平均法计算

6.时间序列的水平分析指标有( BCE )

A. 发展速度

B. 发展水平

C. 平均发展水平

D. 增长速度

E. 平均增长量

7.下列属于时期序列的有( BE )

A. 商品流转次数时间序列

B. 毕业生人数时间序列

C. 黄金储备量时间序列

D.库存量时间序列

E. 总成本时间序列

三、判断题(正确的打“√”,错误的打“×”)

1.时间序列中的各项指标数值都可以直接相加。×

2.依据间断时点序列计算序时平均数,一般假设相邻时点之间现象是均匀的。因此,以此种假设为前提计算出的只是一个近似值。√

3.由于定基发展速度等于相应各环比发展速度的连乘积,所以定基增长速度也等于相应

医学统计学简答题35506

医学统计学简答题 1.简述标准差、标准误的区别与联系? 区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。 (2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。 (3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。 联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。 2.简述假设检验的基本步骤。 1.建立假设,确定检验水准。 2.选择适当的假设检验方法,计算相应的检验统计量。 3.确定P值,下结论 3.正态分布的特点和应用: 特点:1、集中性:正态曲线的高峰位于正中央,即均数所在的位置; 2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交; 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均

匀下降; 4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平; 5、u变换:为了便于描述和应用,常将正态变量作数据转换; 应用: 1.估计医学参考值范围 2.质量控制 3.正态分布是许多统计方法的理论基础 4.简述参考值范围与均数的可信区间的区别和联系 可信区间与参考值范围的意义、计算公式和用途均不同。 1.从意义来看95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指95%可信度估计的总体均数的所在范围 2.从计算公式看若指标服从正态分布,95%参考值范围的公式是:±1.96s。总体均数95%可信区间的公式是:前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。 5.频数表的用途和基本步骤。 用途:(1)揭示资料的分布特征和分布类型;(2)便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。 基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。 6.非参数统计检验的适用条件。 (1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能

统计学习题集含答案

第一章绪论 一、填空题 1、统计一词有三种涵义,分别是统计工作、统计资料和统计学。 2、从统计发挥作用的层次来看,统计工作的基本职能可概括为信息职能、咨询职能和监督职能。 3、统计资料按计量方法不同,分为计点资料和计量资料。 4、统计资料按是否直接取得,分为原始资料和次级资料。 5、统计资料按时间属性不同,分为时期资料和时点资料。 6、统计资料按所覆盖的范围不同,分为全面资料和非全面资料。 7、历史上“有统计学之名,无统计学之实”的统计学派是国势学派,“有统计学之实,无统计学之名”的统计学派是政治算术学派。 8、凯特勒是近代统计学的先驱者,同时也是数理统计学的奠基人。 9、统计学的性质可概括为:统计学是研究现象总体的数量表现和规律性的方法论科学。 10、统计学按其发展阶段不同,可分为描述统计学和推断统计学。 11、统计学按其理论与实践的关系不同,可分为理论统计学和应用统计学。 12、统计信息与其它信息相比,具有客观性,总体性、数量性和扩展性几大特征。 13、统计是随着社会生产的发展和适应国家管理_的需要而产生和发展起来的。 14、统计学作为一门独立的科学,始于17世纪中叶,距今有300多年历史。 15、统计学是一门方法论科学,而不是研究实质性问题的科学。 16、在统计研究方法体系中,最主要、最基本的研究方法有大量观察法、统计分组法、综合指标法和归纳推断法。 17、统计研究方法中的归纳法是一种从个别到一般的推理方法。 18、统计分析是对统计整理后的数据进行再加工和深加工的过程。 二、单选题

1、统计最基本的职能是( A )。 A.信息职能 B.咨询职能 C.反映职能 D.监督职能 2、统计学作为统计实践活动的理论总结和概括的一门独立的科学,始于( C )。 A.15世纪末叶 B.16世纪末叶C。17世纪末叶 D.18世纪末叶 3、历史上最先提出统计学一词的统计学家是(B )。 A.威廉·配弟 B.阿亨瓦尔 C.康令 D.约翰·格朗特 4、历史上“有统计学之名,无统计学之实”的统计学派是( B )。 A.政治算术学派B.国势学派 C.数理统计学派 D.社会统计学派 5、历史上“有统计学之实,无统计学之名”的统计学派是(A )。 A.政治算术学派 B.国势学派 C.数理统计学派 D.社会统计学派 6、统计学的创始人一般认为是(A )。 A.威廉·配弟 B.阿亨瓦尔 C.康令 D.约翰·格朗特 7、“统计”一词的三种涵义是( A )。 A.统计活动、统计资料和统计学 B.统计调查、统计整理和统计分析 C.统计设计、统计分析和统计预测 D.统计方法、统计分析和统计预测 8、统计活动的特点是(B )。 A.数量性、总体性、同质性和客观性B.数量性、总体性、具体性和社会性C.数量性、总体性、差异性和客观性 D.数量性、总体性、同质性和差异性 9、统计活动过程一般由四个环节构成,即( D )。 A.统计调查、统计整理、统计分析和统计决策 B.统计调查、统计整理、统汁分析和统计预测 C.统计设计、统计调查、统计审核和统计分析 D.统计设计、统计调查、统计整理和统计分析 三、多选题 l、统计资料或统计信息与其它信息相比,具有以下特征(A )(B )( D )( E )()。 A.客观性 B.总体性 C.社会性D.数量性 E.扩展性

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

现代心理与教育统计学的复习资料

第一章心理与教育统计学基础知识 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 比率数据 2、变量、随机变量、观测值 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数

5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章统计图表 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 %100 N f

武汉大学考研报录比(2017-2005)历年报录情况统计汇总

报考武汉大学硕士研究生考试的同学,都比较关注武汉大学各学院各专业历年的报考和录取人数基本情况。新祥旭考研收集整理了武汉大学2004年开始的历年分专业报录比数据以供报考武汉大学的同学参考。 在此首先对武汉大学近几年的硕士研究生招生情况大概梳理下: 武汉大学2017年计划招收硕士研究生9300多名(含拟接收推荐免试生2700名)。其中:全日制硕士研究生约5410(学术学位硕士研究生约3700名,专业学位硕士研究生约1710名),非全日制硕士研究生3900多名。各培养单位招生人数将在录取时根据国家下达的正式招生计划和报名考试情况做适当调整。另外,我校“国家少数民族高层次骨干人才培养计划”招收硕士研究生68名(限报专业学位专业),“高层次人才强军计划”招收硕士研究生60名(限报专业学位专业)、“退役大学生士兵专项硕士招生计划”招收硕士研究生40名(限报专业学位专业)。 2016年武汉大学计划招收硕士研究生约5800 名(含拟接收推荐免试生2400名)。其中:学术学位硕士研究生约3350 名,专业学位硕士研究生约2450 名,各培养单位招生人数将在录取时根据国家下达的正式招生计划和报名考试情况做适当调整。另外,我校“国家少数民族高层次骨干人才培养计划”招收硕士研究生70 名(限报专业学位专业),“高层次人才强军计划”招收硕士研究生60名(限报专业学位专业)、“退役大学生士兵专项硕士招生计划”招收硕士研究生40名(限报专业学位专业)。 2015年武汉大学计划招收硕士研究生约5900 名(含拟接收推荐免试生2100名)。其中:学术学位硕士研究生约3300 名,专业学位硕士研究生约2600 名,各培养单位招生人数将在录取时根据国家下达的正式招生计划和报名考试情况做适当调整。另外,我校“国家少数民族高层次骨干人才培养计划”招收硕士研究生70 名(限报专业学位专业),“高层次人才强军计划”招收硕士研究生60名(限报专业学位专业)。 2014年武汉大学计划招收硕士研究生约6000 名(含拟接收推荐免试生1550名)。其中:学术学位硕士研究生约3400 名,专业学位硕士研究生约2600 名,各培养单位招生人数将在录取时根据国家下达的正式招生计划和报名考试情况做适当调整。另外,我校“国家少数民族高层次骨干人才培养计划”招收硕士研究生70 名(专业不限),“高层次人才强军计划”招收硕士研究生60名。 2013年武汉大学计划招收硕士研究生约6000 名(含拟接收推荐免试生1500名),其中:学术学位硕士研究生约3300 名,专业学位硕士研究生约2700 名,各培养单位招生人数将在录取时根据国家下达的正式招生计划和考试情况做适当调整。另外,我校“国家少数民族高层次骨干人才培养计划”招收硕士研究生70 名(专业不限),“高层次人才强军计划”招收硕士研究生60名。 武汉大学2017年的招生人数达到9300人,增加的部分基本上是非全日制录取人数。全日制硕士学位中学硕和专硕招生情况武大跟国家整体方针保持一致,专业硕士学位在招生中所占的比例有所提高。请报考的同学注意这一点。

医学统计学第七版课后答案及解析

练习题答案 第一章医学统计中的基本概念 练习题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 二、简答题 1.常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案] 常见的三类误差是:

(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校 正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 (2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正, 但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素 造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳 压器、恒温装置等措施,从而达到控制的目的。 (3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本 均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引 起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。 2.抽样中要求每一个样本应该具有哪三性? [参考答案] 从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。 (1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。 (3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测 总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出 其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生 困难,所以应以“足够”为准。需要作“样本例数估计”。 3.什么是两个样本之间的可比性? [参考答案] 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 (马斌荣) 第二章集中趋势的统计描述 练习题 一、单项选择题 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是

武汉大学统计学复习题

第一章 绪论 思考题: 1. 医药统计研究的过程是什么? 2. 统计资料主要分为哪几种类型? 3. 什么是总体;什么是样本。 4. 概率与常用概率分布 练习与思考 1.瓶中装有100片药片,其中有5片次品,从中任取10片,求: (1)10片全是正品的概率; (2)恰有2片次品的概率。 2.10把钥匙中有3把能打开锁,任取2把,求能打开锁的概率。 3.设A ,B ,C 是三个随机事件,试用A ,B ,C 表示下列事件: (1)A 不发生而B ,C 都发生; (2)A 不发生而B ,C 中至少有一个发生; (3)A ,B ,C 中至少有两个发生; (4)A ,B ,C 中恰有两个发生。 4.某药厂的针剂车间灌注一批注射液,需4道工序,已知由于割瓶时掉入玻璃屑而成废品的概率为0.5,由于安瓿洗涤不洁而造成废品的概率为0.2,由于灌药时污染而成废品的概率为0.1,由于封口不严而成废品的概率为0.8,试求产品合格的概率。 5.甲乙两个反应罐在1小时内需要工人照顾的概率分别为0.1和0.2。求在1小时内: (1)甲乙两罐都需要照顾的概率; (2)甲乙两罐都不需要照顾的概率; (3)一罐需要照顾而一罐不需要照顾的概率。 6.设()0.2, ()0.3, (/)0.3,P A P B P A B ===试求: (1)()P AB ; (2)(/)P B A ; (3)()P AB ; (4)()P A B +。 7.三个射手向一敌机射击,射中的概率分别为0.4,0.6,0.7。如果一人射中,敌机被击落的概率为0.2;二人射中,敌机被击落的概率为0.6;三人射中则必被击落。已知敌机被击中,求该机是三人击中的概率? 8.已知X 的可能取值为0,±1,±2,且 }1|{|}2{,6.0}1|{|,3.0}0{,4.0}21{==≥=≤===<<-X P X P X P X P X P 试求:X 的概率分布? 9.已知在8次独立试验中,事件A 至少发生一次的概率为0.57,试求在一次试验中事件A 发生的概率? 10.当投掷五枚分币时,已知至少出现两个正面,问:正面数刚好是三个的条件概率? 11.设X 服从泊松分布,且已知{}{}12P X P X ===,求{}4P X =。 12.设k 在[0,5]上服从均匀分布,求方程02442 =+++k kx x 有实根的概率? 13.设随机变量X 的概率密度函数为

医学统计学简答题

医学统计学简答题 1.简述标准差、标准误得区别与联系? 区别:(1)含义不同:标准差S表示观察值得变异程度,描述个体变量值(X)之间得变异度大小,S越大,变量值(X)越分散;反之变量值越集 中,均数得代表性越强。标准误、、估计均数得抽样误差得大小,就是描述样本均数之间得变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。(2)与n得关系不同:n增大时,S趋于。(恒定),标准误减少并趋于 0(不存在抽样误差)。 (3)用途不同:标准差表示X得变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间与假设检验。联系:二者均为变异度指标,样本均数得标准差即为标准误,标准差与标准误成正比。 2.简述假设检验得基本步骤。 1.建立假设,确定检验水准。 2.选择适当得假设检验方法,计算相应得检验统计量。 3、确定P值,下结论3.正态分布得特点与应用: 特点:1、集中性:正态曲线得高峰位于正中央,即均数所在得位置; 2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交; 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均 匀下降; 4、正态分布有两个参数,即均数》与标准差0 ,可记作N(?,。):均数卩决定正态曲线得中心位置;标准差。决定正态曲线得陡峭或扁平程度。0越小,

曲线越陡峭;0越大,曲线越扁平; 5、U变换:为了便于描述与应用,常将正态变量作数据转换; 应用:1、估计医学参考值范围2、质量控制3、正态分布就是许多统计方法得理论基础 4.简述参考值范围与均数得可信区间得区别与联系 可信区间与参考值范围得意义、计算公式与用途均不同。 1、从意义来瞧95%参考值范围就是指同质总体内包括95%个体值得估计范围,而总体均数95%可信区间就是指95%可信度估计得总体均数得所在范围 2、从计算公式瞧若指标服从正态分布,95%参考值范围得公式就是: ±l、96s。总体均数95%可信区间得公式就是:前者用标准差,后者用标准误。前者用1、96,后者用a为0、05,自由度为V得t界值。 5.频数表得用途与基本步骤。 用途:(1)揭示资料得分布特征与分布类型;(2)便于进一步计算指标与分析处理;(3)便于发现某些特大或特小可疑值。 基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距二R/组段数,但一般取一方便计算得数字;(4)列出各个组段并确定每一组段频数。 6.非参数统计检验得适用条件。 (1)资料不符合参数统计法得应用条件(总体为正态分布、且方差相等)或总体分布类型未知:(2)等级资料:(3)分布呈明显偏态又无适当得变量转换方法使之满足参数统计条件;(4)在资料满足参数检验得要 求时,应首选参数法,以免降低检验效能 7.线性回归得主要用途。

精品课程统计学导论学习心得

精品课程《统计学导论》学习心得 本人于XX年11月5日至7日在教育部高校教师网络培训中心参加了为期三天的《统计学导论》精品课程培训,通过李勇教授详细的讲解该课程,作为该门课程的老师,我感觉收获颇丰。不论在专业课程的教学还是课程建设中,都有很大的帮助。现将通过参加本次培训对统计学课程教学的一些心得体会总结如下: 首先:要更新理念,转变策略,适应现代社会对教学的要求 大学教学工作在于“教书育人”,主旨在于育人,但仍需以教学作为前提。教学工作是学校的中心工作,是学校工作的主旨和主线。学校的一切工作都要围绕这个中心,实际教学工作中,要根据学生的心理特征和实际情况,灵活运用各种教学技巧和方法。发挥课堂教学的调控和组织能力;掌握现代教育技术,李教授给大家讲述了在教学中要运用多媒体教学的优势及必要性,在继续学习和实际教学中运用自如;自觉加强中外文化修养,拓宽知识面。同时,要根据教学目标、学生的需要以及当地客观条件,积极地和有创造性地探索有效的教学方法;不断对自己的教学行为进行反思,努力使自己成为具有创新精神的研究型教师。只有在吃透课标、深钻教材、研究学生的前提下,才能做到精心备课,在教学

中胸有成竹和有的放矢。 其次,恰当的采用先进的教学方法 首先应该思考的就是运用多种教学方法来提高教学水平,但是在运用这些现代教学方法的同时不能忽略传统的教学方法,正如李教授所说,多媒体课件教学录像不能取代老师的作用,要根据课程的特点做到传统与现代教学方法相结合。再有,我们在教学过程中还可以采用其他教学方法,如互动式,教师引导学生讲;提问式;案例式;课内教学、课外辅导相结合;教师授课和师生研讨相结合;精读指定教材与泛读扩充性资料相结合等等,以便能够更好的来培养学生的自学能力,创新能力,口头表达能力,文字表达等综合能力。 再次,尽量结合经济管理的实际,设置一些应用性问题根据经管类专业教学需要,我们可以在不同章节设置一些应用问题,可以将时下学生关心的经济数据与概率统计的知识相结合,引导学生理论联系实际。在讲解假设检验问题时,以我国人民币汇率的变化为例,可以让学生分析人民币汇率变化对于我国进出口的影响,以及对于各行业对外贸易波动性的影响;又或者提出近期的物价、房地产等热门话题,让学生去预测政策变化对于某一经济指标的影响。在实际应用过程中让学生去区分Z检验与t检验的差别,均值检验和方差检验的区别。为此可参考国家统计局网站、各地统计年

现代心理与教育统计学答案

第一章 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。(2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。

(完整版)医学统计学实习册第7版武汉大学答案

实习一 1 总体:根据研究目的所确定的同质观察单位的全体。 2 样本:从总体中随机抽取的部分个体。 3 参数:总体的统计指标或特征值。 4 统计量:由样本所算出的统计指标或特征值。 5 概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p, 这个常数p就称为事件A出现的概率,记作P(A)或P。 6 频率:在n次随机试验中,事件A发生了m次,则比值f=m/n=A发生的试验次数/试验的 总次数称为A在n次试验中出现的频率。 7 变异:同质事物间的差别。 8 指标:说明总体综合数量特征和数量关系的数字资料。 简答与思考题 1 什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是应用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科。 统计学:是研究数据的收集、整理、分析与推断的科学 卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。 生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计、取样、分析、资料整理与推论的科学。 2 医学统计资料主要来源于哪些方面?有何要求? 医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。 这些资料的收集过程中,必须进行治疗控制,包括它的统一性、确切性、可重复性。这些原始数据的精度和偏差应用明确的范围。

《医学统计学》样题一

《医学统计学》样题一 选择题答案表(涂黑所选答案,未填此表者不给分) 一、单选题(每题2分,共40分) 1. 样本率与总体率差别的假设检验可用。 A 四格表直接概率法计算 B 四格表χ2检验 C 不能检验 D 由样本率制定总体率的可信区间来判断 E 以上都不是 2.在抽样研究中,当样本例数逐渐增多时_____。 A 标准误逐渐加大 B 标准差逐渐加大 C 标准差逐渐减小 D 标准误逐渐减小 E 标准差趋近于0 3.2008年某乡卫生院接诊结核病患者100人,其中男性76人,女性24人,分别占76%和24%,则可以推断出的结论为。 A 该病男性易患 B 该病男女患病率不同 C该病女性易患 D 该病男女发病率不同 E 尚不能得出男女间患病率孰高孰低的结论 4.要减少抽样误差,通常的做法是_____。 A 适当增加样本例数 B 将个体变异控制在一个范围内 C 减少样本例数 D 增加抽样次数 E 减小系统误差 5. 同样性质的两项研究工作中,都作两样本均数差别的假设检验,结果均为P<0.05 P值越小,则获得的结论是。

A 两样本均数差别越大 B 两总体均数差别越大 C 越有理由说两总体均数不同 D 越有理由说两样本均数不同 E 越有理由说两总体均数差别很大 6 在两样本均数比较的t检验中,无效假设是_____。 A两样本均数不等 B 两样本均数相等 C 两总体均数不等 D两总体均数相等 E样本均数等于总体均数 7.要评价某市一名12岁男孩的身高是否偏高或偏矮,应选用的统计方法是。 A 用该市8岁女孩身高的95%或99%正常值范围来评价????????? B 作身高差别的假设检验来评价 C 用身高均数的95%或99%可信区间来评价 D 不能作评价 E 以上都不是 H是_____。 8.两个独立样本秩和检验时的 A 两样本秩和相等 B 两总体秩和相等 C 两总体均数相等 D 两总体分布相同 E 两总体分布没有关联 9.在配对设计数值变量资料的对比分析中,配对的目的是为了。 A 提高测量精度 B 操作方便 C 应用t检验 D 提高组间可比性 E 减少实验误差 10.配对t检验中,用药前的数据减去用药后的数据与用药后的数据减去用药前的数据,两次t检验的结果_____。 A t值符号相反,但结论相同 B t值符号相反,结论相反 C t值符号相同,但大小不同,结论相反 D t值符号相同,结论相同 E 结论可能相同或相反 11. 总体是由组成的。 A 部分个体 B 全部个体 C 相同的观察指标 D 全部研究对象 E 同质个体的所有观察值 12.关于构成比,不正确的是。 A 构成比中某一部分比重的增减相应地会影响其他部分的比重 B 构成比说明某现象发生的强度大小

概率与统计精品课程

《概率论与数理统计》试 题库 张忠群 六盘水师范高等专科学校数学系 六盘水师范高等专科学校数学系 《概率论与数理统计》试卷(一) 一、填空题(10×3=30分) 1、随机变量相互独立,且~P(2.3),~P(2.7),,则 , 。 2、随机变量ξ~N(0,4),则ξ的密度函数f(x)=,D(2ξ+1)= 。 3、随机变量~N(0,4;2,9;0),则,。 4、随机变量ξ~b(10,0.5),则E(ξ)= ,D(ξ)= 。 5、随机变量ξ的密度函数是,则C= ,。 二、设事件,P(A)=0.5,P(B)=0.3,P(AB)=0.2,试计算的值。 三、已知离散型随机变量的分布列为: 求的分布列。 四、设随机变量相互独立,且~U[0,2],~,求的联合密度函 数 五、掷20个骰子,求这20个骰子出现的点数之和的数学期望。

六、设相互独立,且,,试求: 的数学期望和方差。 七、两名大学生约定在时间12时和13时之间于预定地点见面,先到者等一刻钟后离 去,假定每个大学生可以在12时到13时之间的任意时刻到达,求他们相遇的概率。 八、设与的分布列为 试问:为何值时,与相互独立? 六盘水师范高等专科学校数学系 《概率论与数理统计》试卷(二) 一、填空题 1、随机变量相互独立,且~P(0.27),~P(1.73),,则, 。 2、随机变量ξ~N(0,9),则ξ的密度函数f(x)=,D(ξ+1)= 。 3、随机变量~N(0,4;2,9;0),则,的密度函数。 4、随机变量ξ~b(10,0.3),则E(ξ)= ,D(ξ)= 。 5、随机变量ξ的密度函数是,则C= ,。 二、设事件,P(A)=0.5,P(B)=0.3,P(AB)=0.2,试计算 的值。 三、设服从上的均匀分布,求方程有实根的概率。

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

2医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t r

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

武大医学统计学期末题

医学统计学试题(A )卷(闭卷) 2009--2010学年第一学期 学号:姓名: 一、A型题:请从备选答案中选出1个最佳答案并填在后面的括号里(每小题1分,共30分)。 1.流行病学研究内容的三个层次是指() A.疾病、伤害和健康 B.传染病、寄生虫病和地方病 C.传染性疾病、非传染病疾病和意外伤害 D.疾病分布、危险因素和预防控制措施 E.人群分布、时间分布和地区分布 2.提出由于维生素C缺乏引起身体虚弱的坏血病病因假说并开创了流行病学临床试验先河的医生是:() A.希波克拉底(Hippocrates) B.詹姆士·林德(James Lind) C.约翰斯诺(John Snow) D.路易斯(PCA Louis) E.葛郎特(John Graunt) 3.流行病学研究方法的核心思想是() A.预防为主的思想 B.研究对象为人群 C.对比思想 D.社会医学观念 E.生态学思想 4.流行病学任务的三个阶段是() A.观察性研究、实验性研究和理论性研究 B.揭示现象、找出原因和提供措施 C.描述分布、提出假设和验证假设 D.整理资料、分析资料和得出结论 E.早期发现、早期诊断和早期恰当治疗 5.关于率和比的描述,下列哪项是不正确的() A.大多数率是构成比,分子是分母的一部分 B.比表示分子和分母的数量关系,而不考虑分子和分母所来自的总体如何C.比的分子是分母的一部分 D.率也是比,但比不一定是率 E.率是用来描述变量随时间变化的动态指标 6.某单位发生一起食物中毒,为尽快查明原因,调查中应该使用的主要指标是() A.发病率 B.患病率C.罹患率D.病死率E.期间患病率 7.关于发病率的描述,下列哪项是不正确的() A.发病率可用来描述疾病的分布

相关文档
相关文档 最新文档