文档库 最新最全的文档下载
当前位置:文档库 › 医学统计学问答题

医学统计学问答题

医学统计学问答题
医学统计学问答题

简答题

0. 算术均数、几何均数和中位数各有什么适用条件?答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。

(2 )几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。

(3 )中位数:适用各种类型的资料,尤其以下情况:

A资料分布呈明显偏态;B资料一端或两端存在不确定数值(开口资料或无界资料);C资料分布不明。

X, S和X 1.96S,问各说明什么?

1.对于一组近似正态分布的资料,除样本含量n外,还可计算

(1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势

(2) S为标准差,说明正态分布或近似正态分布的离散趋势

(3)X 1.96S可估计正态指标的95%勺医学参考值范围,即此范围在理论上应包含95%的个体值。

2.试述正态分布、标准正态分布的联系和区别。

正态分布标准正态分布

原始值X 无需转换作u= (X-g)/ b转换

分布类型对称对称

集中趋势g g=0

均数与中位数的关系g =M g =M

参考:标准正态分布的均数为 0,标准差为1 ;正态分布的均数则为卩,标准差为a(g为任意数,而b为大于0的任意数)。标准正态分布的曲线只有一条,而正态分布曲线是一簇。任何正态分布都可以通过

标准正态变换转换成标准正态分布。标准正态分布是正态分布的特例。

3.说明频数分布表的用途。

1)描述频数分布的类型2)描述频数分布的持征 3)便于发现一些特大或持小的可疑值 4)便于进一步做统计分析和处理

4.变异系数的用途是什么?

多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。

5.试述正态分布的面积分布规律。

(1) X轴与正态曲线所夹的面积恒等于1或100%

(2)区间卩±6的面积为%区间卩±6的面积为%区间卩±6的面积为%。

6.试举例说明均数的标准差与标准误的区别与联系。

7.标准正态分布(u分布)与t分布有何不同?

t分布为抽样分布,标准正态分布(u分布)为理论分布。t分布比正态分布的峰值低,且尾部翘得更高。随着自由度的增大,t分布逐渐趋近于标准正态分布。即当自由度VT8时,t分布-标准正态分布。

8.均数的可信区间与参考值范围有何不同?

9.假设检验时,一般当产时,则拒绝H),理论根据是什么?

10.假设检验中和P的区别何在?

检验的应用条件是什么?

型错误与II型错误有何区别与联系?

I型错误是指拒绝了实际上成立的H0所犯的“弃真”错误,其概率大小用a表示。II型错误则是“接受”了实际上不成立的H0所犯的“取伪”错误,其概率大小用B表示。当样本含量n确定时,a愈小,

B 愈大;反之a 愈大,B 愈小。

13. 假设检验和区间估计有何联系?

假设检验用于推断质的不同即判断两个(或多个)总体参数是否不等,而可信区间用于说明量的大 小即判断总体

参数的范围。两者既互相联系,又有区另U 。假设检验与区间估计的联系在于可信区间亦可回 答假设检验的问题,若算得的可信区间包含了 H o ,则按a 水准,不拒绝H o ;若不包含H o ,则按a 水准, 拒绝H o ,接受H !。也就是说在判断两个(或多个)总体参数是否不等时,假设检验和可信区间是完全等 价的。

14. 为什么假设检验的结论不能绝对化?

因为通过假设检验推断作岀的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒 绝H o 时,有

可能犯I 型错误;“接受” H o 时可能犯II 型错误。无论哪类错误,假设检验都不可能将其 风险降为0,因此在结论中使用绝对化的字如“肯定”

,“一定”,“必定”就不恰当。

15 ?方差分析的基本思想和应用条件是什么?

方差分析的基本思想是:根据研究资料设计的类型及研究目的,把全部观察值总变异分 解为两个或

多个组成部分,其总自由度也分解为相应的几个部分。 例如完全随机设计的方差 分析,可把总变异分解为

组间变异和组内变异, 即SS 总=SS 组内+ SS 组间,总的自由度也 分解为相应的两部分,即v 总=v 组 内+v 组间。 离均差平方和除以自由度得均方 MS 组间 均方(MS 组间)与误差均方(MS 误差)之比为F

值;如果各组处理的效应一样,则组间均方等 于组内均方,即F =1 ;但由于抽样误差,F 值不正好等于

1, 而是接近1 ;如果F 值较大, 远离1,说明组间均方大于误差均方,反映各处理组的效应不一样,即 各组均数差别有意义, 至于F 值多大才能认为差别有意义,可查 F 界值表(方差分析用)来确定。

方差分析的应用条件:①各样本是相互独立的随机样本且来自正态总体②各组总体方差相等,即方差 齐性。

16.在完全随机设计方差分析中 SS 间、SS 内各表示什么含义? SS|间表示组间变异,指各组处理样本均数大小不等,是由处理因素(如果有)和随机误差造成的;

SSfi 内表示组内变异,指各处理组内变量值大小不等,是由随机误差造成的。 17.随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?

区别点

完全随机设计 随机区组设计 设计

采用完全随机化的分组方法,将全部试验 随机分配的次数要重复多次, 每次随机分配都对

对象分配到g 个处理组(水平组),各组

同一个区组内的受试对象进行,且各个受试对象 分别接受不同的处理。 数量相同,区组内均衡。

变异分解

三种变异:

SS 、=SSi 间+ SSi 内 四种变异:SS 、= SSi 理+ SS 区组+ ss 吴差

18. 以实例说明为什么不能以构成比代替率?

19. 秩和检验的优缺点?

20. 简述直线回归与直线相关的区别与联系。

联系:1对于既可做相关又可做回归分析的同一组数据,计算出的

b 与r 正负号一致。 二者的区别:(1)资料要求上:相关要求 X 、Y 服从双变量正态分布,这种资料进行回归分析称为H 型 回归;胡桂

要求Y 在给定某个X 值时服从正态分布,X 是可以精确测量和严格控制的变量,称为I 型回归。

(2)应用上:说明两变量间互相关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数 量关系用回归,说明 Y 如何依赖于X 而变化。(3)意义上:r 说明具有直线关系的两变量间相互关系的方

向和密切程度;b 表示X 每变化一个单位所导致 Y 的平均变化量。 2相关系数与回归的假设检验等价,即对于同一样本,

tb=tr 3同一组数据的相关系数和回归系数可以互相换算:

r=by , x*Sx/Sy 2

r s 気 大小决定了相关的密切程度,回归平方和越接近总平方和,则 / ss 总,当总和平方和固定时,回归平方和

的 2

(4 )计算上:r I xy / Jxx/I X y ,b

1

xy

/ 1

xx

(5)取值范围:-1 < r < 1,- s vbv s.

2、二项分布、Poission 分布的应用条件二项分布的应用条件:医学领域有许多二分类记数资料都符合二项分布(传染病和遗传病除外),但应用时仍应注意考察是否满足以下应用条件:(1)每次实验只有两类对

立的结果;(2) n 次事件相互独立;(3)每次实验某类结果的发生的概率是一个常数。Poisson 分布的

应用条件:医学领域中有很多稀有疾病(如肿瘤,交通事故等)资料都符合 Poisson分布,但应用中仍应注意要满足以下条件:(1)两类结果要相互对立;(2) n次试验相互独立;(3) n应很大,P应很小。

3、极差、四分位数间距、标准差、变异系数的适用范围有何异同?答:这四个指标的相同点在于均用于

描述计量资料的离散程度。其不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小

样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,不宜用极差来比较资料

的离散程度。四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标

准差常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程度。变异系数适用于比较计量

单位不同或均数相差悬殊的几组资料的离散程度。

4.中位数、均数、几何均数的适用条件有何异同。(1)均数适用于描述对称分布,特别是正态分布的数

值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布

或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),

或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。

5.第一类错误与第二类错误的区别与联系。当假设检验拒绝了实际上成立的零假设时,所犯的错误称为第

一类错误,其概率用a 表示。当假设检验接受实际上不成立的零假设时,所犯的错误称为第二类错误,其

概率用B表示。当样本含量一定时,a 愈大,B愈小,反之,a 愈小,B愈大。1—B称为检验效能或把握度,其意义是两总体确有差别,按a 水准能发现它们有差别的能力。

6.运用相对数时要注意哪些问题?应用相对数时应注意以下几个事项(1)计算率和构成比时观察单位不

宜过小; (2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的

可比性;(4)当比较两个总率时,若其内部构成不同,需要进行率的标准化;(5)两样本率比较时应进行假设检验。

7.方差分析后进行两两比较能否用t检验?为什么? t检验仅用在单因素两水平设计(包括配对设计和

成组设计)和单组设计(给岀一组数据和一个标准值的资料)的定量资料的均值检验场合;而方差分析用

在单因素k水平设计(k> 3)和多因素设计的定量资料的均值检验场合。方差分析有十几种,不同的方

差分析取决于不同的设计类型。t检验进行两两比较其一,将多因素各水平的不同组合、简单地看作单因素的多个水平(即视为单因素水平),混淆了因素与水平之间的区别,从而错误地确定了实验设计类型;其二,分析资料时,常错误用单因素多水平设计或仍采用多次t检验进行两两比较。误用这两种方法的

后果是,不仅无法分析因素之间的交互作用的大小,而且,由于所选用的数学模型与设计不匹配,易得出错误的结论。参数检验与非参数检验的区别何在?各有何优缺点?( 1)区别:参数检验:以已知分布(如正态分布)

为假定条件,对总体参数进行估计或检验。非参数检验:不依赖总体分布的具体形式,检验分布位置是否

相同。(2 )优缺点:参数检验:优点是符合条件时,检验效能高。缺点是对资料要求严格,如等级资料、分布不明或末端有不明确数据的资料不能用参数检验,要求资料的分布类型已知且总体方差相等。非参

数检验:优点是应用范围广、简便;缺点是对于符合参数统计的资料,如果用非参数统计会造成资料信息

的丢失,致使检验效能下降,犯第二类错误的概率增大。故符合参数统计条件的资料,要首先选用参数统

计的方法。当参数统计的应用条件得不到满足时,应选用非参数统计。

11.对于同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,应以何种结果为

准。当资料满足参数检验方法的条件时,应使用参数检验方法,当资料不满足参数检验方法的条件时,

必须采用非参数检验方法。

12、常见的统计图有哪些?如何根据资料的性质选用适当的统计图?常用的统计图及适用条件是:①条

图,适用于相互独立的资料,以表示其指标大小;②百分条图及远圆图,适用于构成比资料,反映各组成

部分的大小;③普通线图 : 适用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情

况。④半对数线图,适用于连续性资料,反映事物发展速度(相对比)。⑤直方图:适用于连续

性变量资料,反映连续变量的频数分布。⑥散点图:适用于成对数据,反映散点分布的趋势。

14. 极差、四分位数间距、标准差、变异系数的适用范围有何异同?答:这四个指标的相同点在于均用于

描述计量资料的离散程度。其不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,不宜用极差来比较资料

的离散程度。四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程度。变异系数适用于比较计量

单位不同或均数相差悬殊的几组资料的离散程度。

t 检验、 u 检验和 F 检验的应用条件各是什么 ?

t检验的应用条件是:①b 未知而且n较小时,要求样本来自正态总体;②两小样本均数比较时,还要求两样本所属总体的方差相等。u检验的应用条件是:①b 已知;②b未知但样本含量较大。方差分析的应

用条件是:①各样本是相互独立的随机样本;②各样本来自正态总体;③各处理组总体方差相等。

2.普通线图和半对数线图在制作和应用中有何主要区别?普通线图绘制时,纵轴的尺度为算术尺度,并且一般应从“ 0”开始;而半对数线图纵坐标的尺度为对数尺度,起点没有 0。应用上,普通线图反映某事物随时间变动的趋势或某现象随另一现象变迁的情况;而半对数线图用来比较两种或两种以上事物物随时间变动的速度(相对比)。

应用相对数的注意事项应用相对数时应注意以下几个事项( 1)计算率和构成比时观察单位不宜过小;(2)注意正确区分构成比和率,不能以比代率;( 3)对率和构成比进行比较时,应注意资料的可比性;(4)

当比较两个总率时,若其内部构成不同,需要进行率的标准化;(5)两样本率比较时应进行假设检验。

简述率的标准化法的基本思想当比较两个总率时,如果两组内部某种重要特征在构成上有差别,则直接比较这两个总率是不合理的;因为这些特征构成上的不同,往往造成总率的升高或下降,从而影响两个总率的对比。率标准化法的基本思想就是采用统一的内部构成计算标准化率,以消除内部构成不同对指标的影响,使算得的标准化率具有可比性。例如比较两人群的死亡率、出生率、患病率时,常要考虑人群性别、年龄的构成是否相同;试验组和对照组治愈率的比较时,常要考虑两组病情轻重、年龄、免疫状态等因素的构成是否相同。如其构成不同,需采用统一的标准进行校正,然后计算校正后的标准化率进行比较,这种方法称为标准化法。

简述非参数检验的适用资料。(1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各

组方差不齐,且转换后不能达到方差齐性。

简述进行直线相关回归分析应注意的事项(1)相关分析注意的事项相关系数 r 是用来描述两个变量间线

性相关关系的密切程度和方向的统计指标。所以,如果目的是想定量地描述两个变量间相互关系的密切程度和方向,则应作相关分析。而且, r 的绝对值大小,对利用回归方程进行变量预测具有指导意义,如果 r 的绝对值很小,利用回归方程从一个变量预测另一个变量的值是没有多大意义的。应用相关分析时应注意

的问题:①进行相关分析时要有实际意义,不能把毫无关联的两事物或现象作相关分析。②相关关系不

一定是因果关系,可能仅是表面上的伴随关系,或两个变量同时受另一因素的影响。③不能只根据相关系数绝对值的大小来推断两事物现象之间有无相关以及相关的密切程度,而必须进行相关系数的显著性检验。

另外,不要把相关系数的显著性误解为两事物或现象相关的强度。④关于相关分析的样本的合并与分层问

题,应审慎对待。⑤散点图在相关分析中具有重要作用,要充分利用。(2)回归分析的注意事项①作

回归分析要有实际意义,不能把毫无关联的两种现象,随意进行回归分析,忽视事物现象间的内在联系和规律。②直线回归分析的资料,一般要求因变量 Y是来自正态分布总体的随机变量,自变量X可以是正态

随机变量,也可以是精确测量和严格控制的值。③进行回归分析时,应先绘制散点图。④绘制散点图后,

若出现一些特大特小的离群值(异常点),则应及时复核检查。⑤回归直线不要外延。

均数、几何均数和中位数的适用范围是什么?( 1)均数适用于描述对称分布,特别是正态分布的数值变

量资料的平均水平;( 2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似

正态分布的数值变量资料的平均水平;( 3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。

全距、四分位数间距、方差、标准差、变异系数各有何特点?( 1)全距是一组观察值中最大值与最小值

之差,计算简单,意义明了,但全距的不能反映组内其他观察值之间的离散情况,并且容易受个别特大值

或特小值的影响,稳定性较差;(2)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值

的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度;(3)方差是离均差平方和的均数,克服了全距和四分位数间距不能反映组内每

个观察值离散度的缺点,但方差把观察值的原度量单位变成了平方单位,导致计算结果难于解释;(4 )方

差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度;(5)变异系

数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。

1、统计资料可以分成几类?

答:根据变量值的性质,可将统计资料分为数值变量资料(计量资料),无序分类变量资料(计数资料),有序分类变量资料(等级资料或半定量资料)。用定量方法测定某项指标量的大小,所得资料,即为计量资料;将观察对象按属性或类别分组,然后清点各组人数所得的资料,即为计数资料;按观察对象某种属性或特征不同程度分组,清点各组人数所得资料称为等级资料。

2、不同类型统计资料之间的关系如何?

答:根据分析需要,各类统计资料可以互相转化。如男孩的岀生体重,属于计量资料,如按体重正常与否分两类,则资料转化为计数资料;如按体重分为:低体重,正常体重,超体重,则资料转化为等级资

料。计数资料或等级资料也可经数量化后,转化为计量资料。如性别,结果为男或女,属于计数资料,如男性用0(或1),女性用1(或0)表示,则将计数资料转化为计量资料。

3、频数分布有哪两个重要特征?

答:频数分布有两个重要特征:集中趋势和离散趋势,是频数分布两个重要方面。将集中趋势和离散趋势结合起来分析,才能全面地反映事物的特征。一组同质观察值,其数值有大有小,但大多数观察值集中在某个数值范围,此种倾向称为集中趋势。另一方面有些观察值较大或较小,偏离观察值集中的位置较远,

此种倾向称为离散趋势。

4、标准差有什么用途?

答:标准差是描述变量值离散程度常用的指标,主要用途如下:①描述变量值的离散程度。两组同类

资料(总体或样本)均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差;反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好。② 结合均数描述正态分布特征;③结合均数计算变异系数CV;④结合样本含量计算标准误。

5、变异系数(CV)常用于哪几方面?

答:变异系数是变异指标之一,它常用于以下两个方面:①比较均数相差悬殊的几组资料的变异度。如比较儿童的体重与成年人体重的变异度,应使用 CV②比较度量衡单位不同的几组资料的变异度。如比较同性别,同年龄人群的身高和体重的变异度时,宜用 CU

6、制定参考值范围有几种方法?各自适用条件是什么?

答:制定参考值范围常用方法有两种:①正态分布法:此法是根据正态分布的原理,依据公式:

X± uS计算,仅适用于正态分布资料或对数正态分布资料。95%双侧参考值范围按:X 土计算;95%单侧参考

值范围是:以过低为异常者,则计算:X―,过高为异常者,计算 X+。若为对数正态分布资料,先求岀对数值的均数及标准差,求得正常值范围的界值后,反对数即可。②百分位数法。用?估计95%双侧参考值

范围;P5或P95为95%单侧正常值范围。百分位数法适用于各种分布的资料(包括分布未知),计算较简便,

快速。使用条件是样本含量较大,分布趋于稳定。一般应用于偏态分布资料、分布不明资料或开口资料。

7、计量资料中常用的集中趋势指标及适用条件各是什么?

答:常用的描述集中趋势的指标有:算术均数、几何均数及中位数。①算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态分布资料;②几何均数:用G表示,也称倍

数均数,反映变量值平均增减的倍数,适用于等比资料,对数正态分布资料;③中位数:用M表示,中

位数是一组观察值按大小顺序排列后,位置居中的那个观察值。它可用于任何分布类型的资料,但主要应用于偏态分布资料,分布不明资料或开口资料。

8标准差,标准误有何区别和联系?

答:标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别:①概念不同;标准差是描

述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同:当样本含量n足够大时,标准差趋向稳定;而标准误随 n的增大而减小,甚至趋于 0。联系:标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同。

9、统计推断包括哪几方面内容?

答:统计推断包括:参数估计及假设检验两方面。参数估计是指由样本统计量(样本均数,率)来估

计总体参数(总体均数及总体率),估计方法包括点值估计及区间估计。点值估计直接用样本统计量来代表总体参数,忽略了抽样误差;区间估计是按一定的可信度来估计总体参数所在的范围,按X± u 士或

X± U S X来估计。假设检验是根据样本所提供的信息,推断总体参数是否相等。—

10、假设检验的目的和意义是什么 ?

答: 在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造

成 : 其一是抽样误差所致,其二是由于样本来自不同总体。如果是由于抽样误差原因引起的差别,则这种差异没有统计学意义,认为两个或两个以上的样本来自同一总体,;另一方面如果样本是来自不同的总体而引起的差异,则这种差异有统计学意义,说明两个或两个以上样本所代表的总体的参数不相等。样本统计量之间的差异是由什么原因引起,可

医学统计学分析计算题_与解析

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012 ·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

卫生统计学线性回归练习题

一、是非题 1.单个自变量的线性回归就是直线回归。 2.直线回归就是指自变量和应变量的观察值落在在一条直线上。 3.直线回归中预测值Y 是固定某个X 值,Y 的总体均数估计值。 4.用逐步回归的方法评价自变量与应变量之间的关联性,只能推断某个自变量与应变量有关联性,不能推断无它们之间无关联性。 二、选择题 1.用最小二乘法确定直线回归方程的原则是各观察点() A . 距直线的纵向距离相等 B . 距直线的纵向距离的平方和最小 C . 与直线的垂直距离相等 D . 与直线的垂直距离的平方和最小 2.直线回归的系数假设检验() E . 只能利用相关系数r 的检验方法进行检验 F . 只能用t 检验 G . 只能用F 检验 H . 三者均可 3.Y ?=7+2X 是1~7岁儿童以年龄(岁)估计体重(公斤)的回归方程,若把体重的单位换成市斤, 则此方程( ) A .截矩改变 B .回归系数改变 C . 截矩与回归系数都改变 D .回归系数不变 E .截矩不变 4.直线回归系数的假设检验,其自由度为( ) A .n B .n-1 C .n-2 D .2n-1 E .2n-2 5.对应变量Y 的离均差平方和,下列哪个分解是正确的?( ) A .SS 剩=SS 回 B .SS 总=SS 剩 C .SS 总=SS 回 D .SS 总+SS 剩=SS 回 E .SS 总+SS 回=SS 剩 三、计算分析题

1.15名儿童的身高与肺死腔容积的观察值如表15-3所示。 表15-3 儿童身高与肺死腔容积的观测数据 对象号 身高(cm) X 肺死腔容积(ml) Y 对象号 身高(cm) X 肺死腔容积(ml) Y 1 110 45 9 175 102 2 116 32 10 167 111 3 123 41 11 165 88 4 130 45 12 160 65 5 129 43 13 157 79 6 142 67 14 156 92 7 147 58 15 149 58 8 153 57 试用该资料进行回归分析: (1)计算样本回归方程的截矩与回归系数; (2)进行回归系数等于0的假设检验; (3)验证是否存在F t b =的关系; (4)估计回归系数β的95%置信区间。 2.一名产科医生收集的12名产妇24h 的尿,测量其中雌三醇的含量,同时记录了产儿的体重,见表15-4。 表15-4 待产妇尿中雌三醇含量与新生儿体重 编号 尿雌三醇(mg/24h) X 新生儿体重(kg) Y 编号 尿雌三醇(mg/24h) X 新生儿体重(kg) Y 1 7 2.5 7 19 3.1 2 9 2.5 8 21 3.0 3 12 2.7 9 22 3.5 4 14 2.7 10 24 3.4 5 16 3.7 11 25 3.9 6 17 3.0 12 27 3.4 (1)试用该数据进行回归分析; (2)求回归系数的95%置信区间; (3)试求当待产妇尿中雌三醇含量为18(mg/24h)时,新生儿体重个体值的95%预测区间。

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109 /L ~9.1×109 /L ,其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料

医学统计学分析计算题-答案

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

复旦大学医学统计学练习

姓名学号 一、是非题:(答错倒扣1分) 1.配对t检验是否要求方差齐性? 2.随机区组方差分析要求观察指标服从正态分布还是残差正态分布? 3.随机区组设计的资料能否用完全随机设计的方差分析进行检验啊? 二、选择题 1.对3个均数作方差分析,结果有统计学意义,可认为。 A. 3个总体均数完全不同 B. 3个样本均数完全不同 C. 其中2个总体均数不同 D. 其中2个样本均数不同 E. 2个或3个总体均数不同 2.方差分析中,离均差平方和为SS,方差为MS;下标T, B, W分别表示总的、组间和组内,则必有。 A. SS W

医学统计学分析计算题_答案与解析

WORD 文档下载可编辑 第二单元计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指标性别例数均数标准差标准值* 红细胞数/1012·L -1男360 4.66 0.58 4.84 女255 4.18 0.29 4.33 血红蛋白/g·L -1男360 134.5 7.1 140.2 女255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1 解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一 致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数CV S 100% X S 0.29 4.18 100% 6.94% 10.2 女性血红蛋白含量的变异系数CV 100% 100% 8.67% X 117.6

由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误S X 来表示,由表 4 计算各项指标的标准误。 男性红细胞数的标准误S X S 0.58 0.031 ( 1012 /L ) n 360 S 男性血红蛋白含量的标准误S X n 7.1 360 0.374 (g/L ) 女性红细胞数的标准误S X S 0.29 0.018 ( 1012 /L) n 255 女性血红蛋白含量的标准误S X S 10.2 0.639 (g/L ) n 255 (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100 ,可视为大样本。未知,但n 足够大,故总体均数的区间估计按( X u / 2S X, X u / 2 S X)计算。 该地男性红细胞数总体均数的95% 可信区间为: (4.66 -1.96 ×0.031 , 4.66 +1.96 ×0.031) ,即(4.60 , 4.72) 1012 /L。 该地女性红细胞数总体均数的95% 可信区间为: (4.18 -1.96 ×0.018 , 4.18 +1.96 ×0.018) ,即(4.14 , 4.22) 1012 /L。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H0: 1 2 ,即该地健康成年男、女血红蛋白含量均数无差别 H1: 1 2 ,即该地健康成年男、女血红蛋白含量均数有差别 0.05 2) 计算检验统计量

卫生统计学试题1

卫生统计学试题1 注:因原件较模糊,所以试题中可能有错字或答案错漏,有的请指出,仅供参考;复习主要看书本。 一、选择题(每题只有一个正确答案,共40分) 1、随机事件的概率p 等于( ) A p=0 B p=1 C p= D 040 B T<1或n<40 C T>5且n>40 D 以上都不是 10、( )表示某一事物内部各部分所占比重。 A 频率指标 B 构成比 C 相对比 D 定比 11、t 检验的前提条件是( ) A n 较大 B 小样本来自正态总体且总体方差具有齐性 C 总体标准差已知 D 以上都不是 12、同一资料相关回归分析中,求得r t 与b t 值,其关系( )

医学统计学分析计算题答案

第二单元计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指标性别例数均数标准差标准值* 红细胞数/1012·L-1男360 4.66 0.58 4.84 女255 4.18 0.29 4.33 血红蛋白/g·L-1男360 134.5 7.1 140.2 女255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV)比较二者的变异程度。 女性红细胞数的变异系数 女性血红蛋白含量的变异系数 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误(/L) 男性血红蛋白含量的标准误(g/L)

女性红细胞数的标准误(/L) 女性血红蛋白含量的标准误(g/L) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。未知,但足够大,故总体均数的区间估计按()计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)/L。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)/L。 (4) 两成组大样本均数的比较,用u检验。 1) 建立检验假设,确定检验水准 H0:,即该地健康成年男、女血红蛋白含量均数无差别 H1:,即该地健康成年男、女血红蛋白含量均数有差别 2) 计算检验统计量 3) 确定P值,作出统计推断 查t界值表(ν=∞时)得P<0.001,按水准,拒绝H0,接受H1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u检验。 1) 男性红细胞数与标准值的比较 ①建立检验假设,确定检验水准 H0:,即该地男性红细胞数的均数等于标准值

医学统计学校园网精品课程习题

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学校园网精品课程习题 绪论习题一、最佳选择题 1、抽样研究中的样本是: A、研究对象的全体 B、总体中特定的一部分 C、总体中随机抽取的一部分 D、随意搜集的一些观察对象 2、总体是由: A、个体组成 B、研究对象组成 C、同质个体组成 D、研究指标组成 3、检验结果分为阴性和阳性资料,属于: A、等级资料 B、计数资料 C、计量资料 D、等级或计量均可 4、概率等于 0 的事件称为: A、小概率事件 B、必然事件 C、不可能事件 D、偶然事件 5、实验设计的三个基本要素是: A、对照、重复、随机化 B、重复、随机化、设置对照 C、处理因素、试验单位、设置对照 D、均衡、重复、随机化二、简答题: 1、什么是变异 2、什么是随机化 3、简述对照组常用的干预方式 4、简述随机化的意义及主要作用 5、简述医学测量结果的分类(数据类型)三、是非题 1、实验设计的基本原则是重复、对照、随机化 2、等级资料较计量资料和计数资料精确 3、搜集资料时常采用的方法有实验 4、某医生欲研究加锌牛奶对儿童生长发育的影响,将某小学校 10 岁儿童随机分为两组,一组喝加锌牛 1 / 21

奶,另一组喝普通牛奶,此属于标准对照 5、概率为 1 的事件称为必然事件调查设计习题(一)单项选择题 1. 实验设计和调查设计的根本区别是()。 A. 实验设计以动物为对象 B. 调查设计以人为对象 C. 实验设计可随机分组 D. 实验设计可人为设置处理因素 2. A.整群B.系统C.分层 D.简单随机 3.所得到的样本量最小的为()。 A.简单随机抽样 B.系统抽样 C.整群抽样 D.分层随机抽样 4.调查用的问卷中,下面的四个问题中,()是较好的一个问题。 A.你和你的妈妈认为女孩几岁结婚比较好____。 B.如果只生 1 个孩子,你希望孩子的性别是: 1.女; 2.男; 3.随便 C.你 1 个月工资多少_____。 D.你一个月吃盐____克。 5. 在()中,研究者可以人为设置各种处理因素;而在()中则不能人为设置处理因素。 A. 调查研究 B. 社区干预试验 C. 临床试验 D. 实验研究(二)名词解释1.抽样调查2.简单随机抽样 3.系统抽样 4.分层抽样5.整群抽样 6.概率抽样 7.非概率抽样(三)是非题 1. 系统抽样的优点是操作简单,均数、率及相应的标准误计算简单。

医学统计学复习习题2018

医学统计学期末复习题 一、单项选择题 1 下面的变量中是分类变量的是 A.身高 B.体重 C.年龄 D.血型 2 下面的变量中是是数值变量的是 A.性别 B.年龄 C.血型 D.职业 3.随机事件的概率 P 为 =0 B. P=1 C. P= D. 0

卫生统计学题库(6版)

第一章绪论 第二章(一)A1型:1.下面的变量中,属于分类变量的是_____。 A.脉搏 B.血型 C.肺活量 D.红细胞计数 E.血压 2.下面的变量中,属于定量变量的是_____。A.性别 B.体重 C.血型 D.职业 E.民族 3.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料属于_____。 A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义变量资料 4.上述资料可以进一步转换为_____。 A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义变量资料 5.若要通过样本作统计推断,样本应是_____。 A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 6.统计量_____。A.是统计总体数据得到的量 B.反映总体统计特征的量 C.是根据总体中的全部数据计算出的统计指标 D.是用参数估计出来的 E.是由样本数据计算出的统计指标 7.因果关系_____。A.就是变量间数量上的联系 B.可以用统计方法证明 C.必定表现 为数量间的联系 D.可以通过单独考察两个变量间关系得出 E.可以通过变量间数量上的联系来证明 (二)A2型:1.教材中提及美国人1954年实施了旨在评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。有180万儿童参与,约有1/4参与者得到了随机化。这180万儿童是_____。 A.目标总体 B.研究总体 C.1份样本 D.1份随机样本 E.180万份样本 2.上述试验最终肯定了索尔克疫苗的效果。请问此结论是针对_____而言。 A.180万儿童 B.每个儿童 C.所有使用索尔克疫苗的儿童 D.所有儿童 E.180万儿童中随机化的1/4 二、是非题 1.定量变量、分类变量和有序变量可以相互转换。 2.假变量可以参与计算,所以假变量是定量变量。 3.离散变量在数值很大时,单位为“千”或“万”时可以取小数值,此时可近似地视为连续型变量。 4.同质的个体间不存在变异。 5.如果个体间有变异,则它们一定不是来自同一总体。 第二章定量资料的统计描述(一)A1型:1.用频率表计算平均数时,各组的组中值应为_______。 A.本组段变量值的平均数 B. 本组段变量值的中位数 C. 本组段的上限值 D. 本组段的下限值 E. (本组段上限值+本组段下限值)/2 2.离散型定量变量的频率分布图可以用_______表达。 A. 直方图 B. 直条图 C.百分条图 D.箱式图 E.复式条图 3. 变异系数越大说明_______。A.标准差越大 B.平均数越大 C.标准差、平均数都大

医学统计学课后习题与答案

医学统计学 第一章绪论 答案 名词解释: (1)同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。 (2)总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。 (3)参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4)抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。 (5)概率:是描述随机事件发生的可能性大小的数值,用p表示 (6)计量资料:由一群个体的变量值构成的资料称为计量资料。 (7)计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。。 (8)等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。 是非题: 1.× 2.× 3.× 4.× 5.√ 6.√ 7.× 单选题: 1.C 2.E 3.D 4.C 5.D 6.B 第二章计量资料统计描述及正态分布 答案 名词解释: 1. 平均数是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1.计量,计数,等级

2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99% 5. 47.5% 6.均数、标准差 7. 全距、方差、标准差、变异系数 8. σμ96.1± σμ58.2± 9. 全距 R 10. 检验水准、显著性水准、0.05、 0.01 (0.1) 11. 80% 90% 95% 99% 95% 12. 95% 99% 13. 集中趋势、离散趋势 14. 中位数 15. 同质基础,合理分组 16. 均数,均数,μ,σ,规律性 17. 标准差 18. 单位不同,均数相差较大 是非题: 1. × 2. √ 3. × 4. × 5. × 6. √ 7. √ 8. √ 9. √ 10. √ 11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √ 21. √ 单选题: 1. B 2. D 3. C 4. A 5. C 6. D 7. E 8. A 9. C 10. D 11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C 21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D 31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B 41. C 42. B 43. D 44. C 45. B 问答题: 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5.

《医学统计学》复习题

医学统计学复习题 一、名词解释 1.总体:根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 2.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 4.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 5.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。 6.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等。 7.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序资料。如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。 8.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。 9.频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 10. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 11.系统误差:是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 12.参数:指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统

医学统计学分析题

五、分析应用题(4题,共40分) 1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下: 某病西医治疗及中西医结合治疗疗效比较 疗法例数治愈数治愈率(%) 西医治疗 70 50 74.29 中西医治疗 60 22 36.67 X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。你认为如何?请说出理由(6分) 1、答:结论不可信(2分);因为在设计分组上不科学,两组间不具有可比性(4分)。 2、24名志愿者完全随机地分成两组,接受降胆固醇试验。甲组为特殊饮食组,乙组为药物处理组,受试者在试验前后各测量一次血清胆固醇(mmol/L),数据如下表, 甲组乙组 受试者试验前试验后受试者试验前试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.8 3 2 6.40 6.35 3 6.48 6.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7 9.17 8.42 7 9.10 9.05 8 7.33 7.00 8 7.31 6.83 9 6.94 6.58 9 6.96 6.91 10 7.67 7.22 10 6.81 6.73 11 8.15 6.57 11 8.16 7.65 12 6.60 6.17 12 6.98 6.52 (1)欲分析两种治疗方法是否有效,采用何种统计分析方法?(6分) (2)欲判断两种降血清胆固醇措施效果是否相当,又采用何种统计分析方法?(6分) 2、答:(1)欲分析两种治疗方法是否有效,可用治疗前后比较,属配对设计(2分),应用配对t检验(3分)。(2)如判断两种方法的效果有无差别,则属成组设计(2分),应用两样本均数比较的t检验(3分)。 3、检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。 样本号 1 2 3 4 5 6 7 乙法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 问:⑴若要判断能否用乙法推算甲法,又用何统计方法?(6分) ⑵欲比较甲乙两法检出血磷是否相同,用何统计方法?(6分) 3、答:(1)根据题意,应用回归分析(6分) (2)这是配对设计计量资料(2分),应用配对t检验(4分) 4、某单位对常住本市5年以上,从未接触过铅作业,也未服过含铅药物或其它重金属,饮用自来水,无肝、肾疾患及贫血,近日未使用利尿剂的健康成年,用乙酸乙酰法测24小时尿δ-ALA的结果如下,欲制定其95%正常值范围。请问:用何种估计方法?说出理由并给出计算公式。(10分) δ-ALA 0.5- 1.0- 1.5- 2.0- 2.5- 3.0- 3.5- 4.0 -4.5- 5.0-5.5 合计

相关文档
相关文档 最新文档