文档库 最新最全的文档下载
当前位置:文档库 › 研究生医学统计学复习题

研究生医学统计学复习题

研究生医学统计学复习题
研究生医学统计学复习题

医学统计学第一阶段复习题

一、单项选择题

1. 下列资料属于有序分类变量的是()。

A.白细胞计数B.患者治疗结果评定(治愈、好转、有效、无效)

C.患者年龄D.住院天数

2. 统计学中所说的总体是指()。

A.根据研究目的确定的研究对象的全体B.根据地区划分的研究对象的全体C.根据时间划分的研究对象的全体D.根据人群划分的研究对象的全体3. 比较身高和体重两组数据变异程度大小宜采用()。

A.变异系数B.方差C.标准差D.四分位数间距

4. 正态曲线下、横轴上,从-∞到均数的面积为()。

A .95%B.50% C.97.5%D.99%

5. 计算一群同质个体的体重的平均水平,选择()。

A.均数B.几何均数C.中位数D.四分位数

6. 描述样本均数离散程度的指标,宜选择( B )。

A.标准差B.标准误C.变异系数D.四分位数间距7. 横轴上,标准正态曲线下从0到1.96的面积为()。

A.95% B.45% C.47.5%D.49.5%

8. 计算一群同质个体的胸围的平均水平,选择()。

A.几何均数B.均数C.中位数D.四分位数9. 比较某地1~2岁和10~12岁儿童身高的变异程度,宜用()。

A.极差B.四分位数间距C.变异系数D.方差10. 横轴上,标准正态曲线从-2.58到0的面积为()。

A.95% B.45% C.49.5%D.47.5%

11. 计算一群同质个体的收缩压的平均水平,选择( C )。

A.中位数B.几何均数C.均数D.标准差12. 用均数和标准差可全面描述其特征的分布是()。

A.正偏态分布B.负偏态分布C.任意分布D.正态分布

13. 横轴上,正态曲线下从μ到μ+2.58σ的面积为()。

A.49.5% B.47.5% C.45% D.95%

14. t分布曲线和标准正态曲线比较,()。

A.中心位置左移B.中心位置右移

C.分布曲线平坦一些D.分布曲线陡峭一些

15. 由样本推断总体,样本应该是()。

A.总体中有价值的一部分B.总体中有代表性的一部分

C.总体中的任意一部分D.总体中典型部分

16. 当样本量增大时,以下说法正确的是()。

A.标准差会变大B.标准差会变小

C.均数标准误差会变大D.均数标准误差会变小

17. 计算一群同质个体的舒张压的平均水平,选择(B )。

A.四分位数B.均数C.中位数D.几何均数18. 横轴上,正态曲线下从μ到μ+1.96σ的面积为()。

A.95%B.45% C.47.5%D.49.5%

19. 当数值变量资料分布未端无确定数据时,描述变异程度宜选用()。

A.极差B.标准差C.方差D.四分位数间距

20. 两样本均数比较的t检验,要求()。

A.两总体方差一致B.两总体符合正态分布

C.两样本均属随机抽样D.三者都要求

21. 进行四个均数比较,若方差分析结果F>F0.05(ν1,ν2),则()。

A .μ1=μ2=μ3=μ4B.μ1≠μ2≠μ3≠μ4

C.可能至少有两个总体均数不等D.可能至少有两个样本均数不等

24. 抽样误差是指()。

A.个体值与总体参数值之差B.样本统计量值与总体参数值之差

C.个体值和样本统计量值之差D.个体值与个体值之差

27. 四个样本率作比较,χ2>χ20.01(3),可认为()。

A.各总体率不等或不全相等B.各总体率均不相等

C.各总体率均相等D.各样本率不等或不全相等

28. R行?C列的χ2检验的自由度为()。

A.R-1 B.C-1 C.R+C-2 D.(R-1)?(C-1)

31. 四格表χ2检验基本公式的应用条件为(C )。

A.总例数≥40 B.各理论数T≥5

C.总例数≥40和各理论数T≥5D.总例数≥40和各理论数T≥1

32. 行?列表的χ2检验应注意()。

A.任一格子理论数小于5,则要用校正公式

B.任一格子理论数小于5,则要考虑将相应组合理合并

C.若1/5以上格子理论数小于5,则要用校正公式

D.若1/5以上格子理论数小于5,则要考虑将相应组合理合并

34. 对于总合计数为400的四个样本率比较的资料作χ2检验,其自由度为()。

A.399 B.3C.6 D.1

二、填空题(每空 1 分,共10 分)

请在每小题的空格中填上正确答案。错填、不填均无分。

35. 如果资料分布不规则,一端或两端有不确定数据时,应选用_中位数_______描述其集中

趋势

36 对任何服从正态分布N(μ,σ2)的随机变量X作线性变换后变换成均数为0,方差为

1的正态分布,称为____标准正态分布___________________。

37.描述分类变量资料的主要统计指标是_______相对数_________________。

39.参数是指___________总体的统计指标______________________________。

40.四分位数间距是描述变量的变异程度的常用指标,它是___P75和P25___________之差。

41. 统计资料可按变量的取值之特性,可将变量分为数值变量和分类变量,后者又可分为__有序分类变量和无序分类变量_______________。

42. 在同一总体中作样本量相等的随机抽样,有99%的样本均数在__μ±2.58σ_______范围内。

44. 表示血清抗体滴度资料平均水平最常用的指标是___几何均数_____________。

46. 标准正态分布的均数和标准差分别为______0,1___________________。

48. 当抽样研究的样本含量增大时,均数的标准误会_____变小__________。

49. 当自由度趋向无穷大时,t分布就是_____标准正态分布________________。

50. Ⅰ型错误是指___拒绝___了实际成立的H0假设,理论上其概率大小用事先给定的α控制。

51. 描述一组偏态分布资料的变异程度,可用___四分位数间距____________。

53. 采用统一的标准对内部构成不同的各组频率进行调整和对比的方法称为____率的标准

化_________________。

55. 接受了实际上不成立的H0假设,这类“存伪”的错误,在统计学上称为___第二类错误_ _____。

56.S主要是用来描述_____样本均数________________变异程度的指标。

57. 随机化原则是指______保证总体中的每个个体有相同的机会被抽作样本。

58. 以一定概率估计总体参数在哪个范围内的估计方法称为___区间估计___________。

59. 两样本均数比较时,方差分析结果与t检验结果__一致__________。

61. 用来比较事物之间变化的相对速度常用_______比_______表示。

62. 多组均数的比较如果采用重复t检验,会造成__第一类错误_________的增大。

64.χ2分布是一种连续型随机变量的分布,其分布形状依赖于_自由度v大小_______。

65 .四格表资料χ2检验基本公式的应用条件为n≥40且所有格子理论数___T≥5______。67.两个样本均数的t检验结果,P<0.05,差别有显著性。P愈小,则_______越有理由认为两总体均数不同____________。

68. 使用四格表χ2检验校正公式的条件是__1≤T<5,n≥40__________________。

三、判断改错题(每小题2 分,共20 分)

69. 若t检验结果为拒绝H0,则P值越小,说明两总体均数差别越大。(×)

70. 方差分析中,如果处理因素无作用,则F值一定等于1。(×)

72. 统计分析包括统计描述和统计推断。(√).

73. 比较同一批儿童的身高和体重的变异程度宜用标准差。(×)

74. 某一时期一定人群中新发生的某病病例的频率称为患病率。(√)

76. 随机区组设计不宜于进行区组与处理组间交互作用的分析。(√)

77.正态分布中,正态峰越陡峭,代表标准差越小,变异程度越小。()

78.统计学中的样本是指从总体中随意抽取的部分观察单位的测量值的集合。(×)79.研究人员测量了120例患者外周血的红细胞计数,所得资料为分类变量资料。(×)80.样本量增大,极差会减小。(×)

81.计算麻疹疫苗接种后血清检查的阳转率,分母为麻疹患者数。(√)

83.对称分布在“均数±1.96倍标准差”的范围内,包括95%的观察值。( √) 84.标准误和标准差都是变异程度的指标。(√).

85.样本率的标准误越小,抽样误差越大。(×)

87. 样本率和总体率的假设检验可用四格表χ2检验。(×)

89.两样本均数比较的t检验的目的在于检验两样本均数差别是否等于0。(×)90.如果样本不是通过随机抽样获取,就没有必要作假设检验。(×)

91.当四格表周边合计不变时,如果某格子的实际频数有变化,则其理论频数也随之变化。(×)

92.四格表的自由度不一定等于1。(×)

93.完全随机设计是将几个条件相同或相似的受试者划分为一个区组或配伍组,然后再按随机化的原则,将同一配伍组的受试者随机分配到各实验组。(×)

94.各处理组内部观察值之间的差异,称为组间变异。(×)。

95.方差分析中,当P<0.05时,应进一步作两两比较的t检验。(×)。

96. 分类变量、有序分类变量和数值变量可根据分析需要相互转化。(√)

97. 极差是一种简单粗略地描述变异程度的指标,其特点是计算简单,稳定性较好。

( ×)

98. 对同一个资料,均数总是大于中位数。( ×)

99. 统计推断的内容包括参数估计和假设检验。( √)正确.

100. 事件发生的概率是一个常数,而事件发生的频率随样本的不同而不同。( √) 101. Bartlett法可用于多个方差的齐性检验,其检验统计量为t值。(×)

102. 随机区组设计的资料可用完全随机设计方差分析进行统计处理,但这样做有可能会降低检验效率。( ×)

103. χ2分布是一种离散型随机变量的概率分布,其形状依赖于自由度ν的大小。( ×) 104. 四格表资料应用精确概率法的条件为理论频数T<5或总例数<40。( ×)

105. 四分位数间距是描述偏态分布资料集中趋势常用的指标。( ×)

106. 某医生测定了100名患者外周血的白细胞计数,所得资料为数值变量资料。(√)

107. 样本率和总体率的比较不能用χ2检验。( √).

109. 数据变换的目的是使各组方差齐性和使偏态资料转换为正态分布的常用方法。

( √)

110. 方差分析中,MS组间一定大于MS组内。( ×)

四、名词解释(每小题 3 分,共15 分)

112. 实际频数和理论频数:实际频数:即实际观察值。理论频数:在假设多个率或构成比相等的前提下,由合计率(构成比)推算出来的频数。

113. 等级资料:将观察单位按某种属性的不同程度分成等级后分组计数,变量值具有半定量性质。

114.总体:根据研究目的确定全部同质个体,这些个体的某项变量值。

115.抽样误差:在排除了系统误差,控制了随机测量误差后,由于抽样过程造成的样本指标与总体指标之间的差异。

116.CV:将样本标准差除以样本平均数,得出的百分比就是变异系数。

117.参数:总体的统计指标,如总体均数、标准差。固定的常数

统计量:样本的统计指标,如样本均数、标准差,参数附近波动的随机变量。

118. 小概率事件:P≤ 0.05。表示在一次实验或观察中该事件发生的可能性很小。

119. 构成比:构成比又称构成指标,它说明某一事物内部各组成部分所占的比重或频率。120. 标准正态分布:若μ=0,σ=1。则该正态分布称为标准正态分布。

121. 参数估计:由样本信息估计总体参数称为参数估计。

122. 假设检验:通过分辨两个样本是否分别属于两个不同总体,从而对总体作出适当的结论。

123. 置信区间:是指由样本统计量所构造的总体参数的估计区间。

124. 第一类错误:假设检验中,若拒绝了真实的H0,把本来没有差别的两个总体说成有差别,就犯了“假阳性”的错误,称作“一类错误”。

125. 概率:是描述随机事件(可能发生也可能不发生的事件)发生可能大小的量。用大写的P表示;取值[0,1]。

126.方差:方差是将离均差平方和再取平均。

五、简答题(每小题5 分,共25 分)

128. 简述极差、四分位数间距、标准差和变异系数的适用范围?

极差:任何计量资料,一般是参考变异指标,只能在研究样本的波动时使用。

四分位数间距:偏态分布资料,分布不明的资料。

标准差:适用于描述对称分布资料的离散程度,特别是正态分布资料。

变异系数:单位不同的资料间比较;均数相差悬殊的资料间比较。

129.简述应用相对数时应注意哪些问题?

1、计算相对数的分母不宜过小

2、分析时不能以构成比代替率

3、对观察单位数不等的几个率,不能直接相加求其平均率(或称总率)

4、对比时应注意资料的可比性

5、对样本率(或构成比)的比较应遵循随机抽样原则,要做假设检验

130.简述方差分析的基本思想是什么?

方差分析的基本思想就是将测量数据的总变异按照变异原因不同分解为处理效应和实验误差,并作出其数量估计。

131.简述t分布和u分布相比有什么特点?

t分布与标准正态分布相比,二者均为单峰分布,以0为中心,左右两侧对称。

t分布的峰部较矮而尾部翘得较高;t分布的形状与自由度ν(=n-1)有关,自由度越小,上述现象越明显;ν逐渐增大时,t分布逐渐逼近标准正态分布,当ν=∞时t分布就完全成为标准正态分布了。

132.简述频数表的用途有哪些?

1、发现极大或极小的可疑值,以及时复查纠正。

2、揭示资料的分布特点,故可作为描述资料的工具

133.简述样本均数的抽样分布有哪些特点?

①各样本均数间存在差异,但各样本均数在总体均数周围波动。

②样本均数的分布曲线为中间高,两边低,左右对称,近似服从正态分布。

③样本均数的标准差明显变小

134.简述为什么假设检验的结论不能绝对化?

假设检验时,当P≤α时拒绝Ho,接受H1,此时并非Ho完全不成立只是现有样本信息不支持Ho;当O>α时,不拒绝Ho,但不是说Ho完全成立。总之,无论拒绝Ho,还是不拒绝,都会犯错误,因而,统计学的结论是概率性的,不能绝对化。

135.简述χ2检验有何用途?

主要有三种用途:样本方差的同质性检验、适合性检验和独立性检验

136. 简述两样本均数的t检验的适用条件?

独立性:各观察个体间是相互独立的,不能相互影响

正态性:要求两组均数服从正态分布;配对设计时,要求差值服从正态分布

方差齐性:两样本所对应的正态总体之方差相等

137. 简述假设检验中的检验水准α和P值有什么不同?

α即是拒绝还是不拒绝H0的界线,也即拒绝H0时允许犯(假阳性)错误的概率。

P 值表明以多大误差拒绝H 0 或者说作出“拒绝H 0而接受H 1”的结论时冒了P 风险。 一个样本按某一检验方法只能得出一个P 值,但供研究者用来界定此P 值的α水准却可以有多个。

141 简述描述数值变量资料集中趋势的指标及各指标的适用条件?

均数:适用于对称分布资料,尤其是正态分布资料或近似正态分布资料。 几何均数:对数正态分布资料、等比资料。

中位数:偏态分布资料;开口资料; 有极大值或极小值; 分布不明或不规则。 百分位数:用于描述样本或总体观察值序列在某百分位置的水平。

142. 简述正态分布有哪些性质?

1正态曲线为单峰分布曲线,其高峰位置在横轴上方均数处。

2正态分布以均数为中心,左右对称。理论上,曲线两侧永远不与横轴相交。 3两个参数:均数μ(位置参数);标准差σ(形状/变异度参数) 4 .正态曲线下面积分布有一定规律

5.有些指标不服从正态分布,但通过适当变换后服从正态分布

六、计算题(每小题 10 分,共20 分)(列出假设检验的步骤,用SPSS 统计软件计算,并记

录结果和结论)

143 某研究者为探讨甲、乙两种药物对某病的疗效,将210例某病患者随机分成两组,治疗结果如下表所示:

表1 甲、乙药治疗某病疗效比较

药物 治愈人数

未愈人数

合计 甲药 31 79 110 乙药

11 89 100 合计

42

79

210

问两药物治疗某病的疗效有无统计学差异?(χ2

(0.05,1)=3.84,χ2

(0.01,1)=6.63)

144. 根据以往资料,健康成年男性的红细胞数服从正态分布,现抽样调查了某地360名健康成年男性的红细胞数,计算得(

)()

,1058.0,10

66.41212

S L X ==问该地健康成年男性

红细胞数与标准值4.84(1012

/L )有无差别?

145. 为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表2第(1)~(2)栏。问两法测定结果是否不同?(t 0.05/2,10=2.228, t 0.01/2,10=3.169, t 0.05/2,9=2.262, t 0.01/2,9=3.250)

表2 两种方法对乳酸饮料中脂肪含量的测定结果(%)

编号 (1) 哥特里-罗紫法

(2) 脂肪酸水解法

(3) 1 0.840 0.580 2 0.591 0.509 3

0.674

0.500

4 0.632 0.316

5 0.687 0.337

6 0.978 0.51

7 7 0.750 0.454

8 0.730 0.512

9 1.200 0.997 10

0.870

0.506

146.某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表3。问两种方法的检测结果有无差别?(63.6,84.32

1,01.02

1,05.0==χχ)

表3 两种方法的检测结果

免疫荧光法

乳胶凝集法

合计 + - + 11(a ) 12(b ) 23 - 2(c ) 33(d ) 35 合计

13

45

58

147 某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者

随机分为两组,结果见表4,问两种药物治疗脑血管疾病的有效率是否相等?(χ2

0.05,1=3.84, χ20.01,1=6.63)

表4 两种药物治疗脑血管疾病有效率的比较

组别 有效 无效 合计 胞磷胆碱组 46 6 52 神经节苷酯组

18 8 26 合计

64

14

78

148. 某医生为了比较四种降血脂药的临床疗效,按统一纳入标准选择40名高血脂患者,采用完全随机设计方法将患者等分为4组,进行双盲试验。6周后测得低密度脂蛋白作为试验结果,见表5。问4种药物的疗效有无差别? (F 0.05,3,36=2.86, F 0.01,3,36=4.38)

152. 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?(t0.05,36=2.028,t0.01,36=2.719;t0.05,35=2.030,t0.01,36=2.724)

第二阶段复习题

一、单项选择题(每小题1 分,共10 分)

1. 实验设计中的基本原则是()。

A.随机化、盲法、对照

B.重复、随机化、配对

C.随机化、对照、重复

D.随机化、重复、盲法

2. 以下检验方法中,不属于非参数检验法的是()。

A.Wilcoxon秩和检验

B.Kruskal-Wallis检验

C.Wilcoxon符号秩检验

D.Student’s t检验

3. 样本相关系数r=0时,说明()。

A.两变量(x,y)不存在任何关系

B.两变量的关系不能确定

C.两变量间不存在线性关系,但不排除存在某种曲线关系

D.两变量间必然存在某种曲线关系

4. 在y和x的回归分析中,若t b

A.两变量不存在任何关系

B.两变量存在线性关系

C.样本回归系数和总体回归系数(β=0)相等的可能性P>95%

D.两变量无线性相关

5. 等级资料的比较宜采用()。

A.t检验

B.F检验

C.秩和检验

D.四格表 2检验

6. 在y对x的直线回归分析中,b值越大,则()。

A.各散点越靠近回归直线

B.各散点越离开回归直线

C.回归直线对X轴越倾斜

D.回归直线对X轴越平坦

7. 在进行成组设计两样本秩和检验时,以下的检验假设中正确的是()。

A.H0:两样本对应的总体分布位置相同

B.H0:两样本的中位数相同

C.H0:两样本均数相同

D.H0:两样本对应的总体均数相同

8. 在双正态变量的相关和回归分析中,r和b有如下关系()。

A.r和b的符号相同

B.r和b的符号无关

C.r值增大,则b值也增大

D.r减小,则b值也减小

9. 动物实验中,将同种属、同窝别、同性别的实验动物组成对子,再用随机化的方法将每对动物分配到处理组和对照组的设计方法称为()。

A.完全随机化设计

B.配对设计

C.随机区组设计

D.对照设计

10. 两个小样本数值变量资料比较的假设检验,应首先考虑()。

A.资料符合哪种检验的条件

B.秩和检验

C.t检验

D.任选一种检验方法

二、填空题(每空 1 分,共10 分)

11. 一般情况下,非参数统计犯第二型错误的概率_____大于______参数统计。

12. 秩和检验和t检验相比,其优点是___________不受分布的限制________________。

13. 直线相关,又称为简单相关,用于双变量_____正态分布__________资料。

14. 用最小二乘法确定直线回归方程的原则是各实测点_____距直线的纵向距离的平方和最

小_____。

15.符合t检验条件的数值变量资料如果采用秩和检验,则____Ⅱ型错误增大_____。16.采用系列诊断试验,除了可提高试验的特异度外,尚可提高___阳性预测值______。17.Wilcoxon配对法主要用于________配对数值变量资料___________的检验。

18.直线相关系数的假设检验,其自由度为____________ n-2_____________。

19. 比较两组某疗法的疗效(治愈、显效、好转、无效)资料宜用___秩和检验______。

20. 外加于受试对象,在实验中需要观察并阐明其处理效应的因素称为__处理因素___。

三、判断改错题(每小题2 分,共20 分)

21. H检验属于参数统计方法。(错误).应改为:非参数统计.

22. 两样本回归系数的差别无显著性(P>0.05),可以认为两样本回归线平行。(错误)

.应改为:两总体回归线平行.

23.多个样本数值变量资料比较,数据的分布类型未知时,应选择秩和检验。(正确)

24. 回归系数越大,两变量关系越密切。( 错误).应改为:相关系数

25. H检验是多个样本比较的秩和检验方法,主要适用于无序分类资料和不宜用参数检验的数值变量资料。(错误). 应改为:有序分类资料

26. 非参数检验方法可用于各种分布类型或总体分布未知的资料的统计分析,具有广泛的适

应性和较好的稳定性,因此非参数检验方法检验效能较高。(错误)较低

四、名词解释(每小题 3 分,共15 分)

27.直线回归:是指建立一个描述应变量依自变量变化而变化的直线回归方程(2分),并要求各实测点与该回归直线的纵向距离的平方和为最小.(1分)

28.非参数统计:不依赖于总体分布类型,(1分)也不对总体参数进行统计推断的一类统计分析方法.(2分)

29. 剩余平方和:剩余平方和即

()2?Y

Y-

∑,(1分)它反映X对Y的影响之外的一切因素对Y

变异的作用, (1分)也就是在总平方和中无法用X解释的部分. (1分)

30. 随机化区组设计:随机化区组设计是将受试对象按自然属性(如实验动物的窝别、体重,

或患者的性别、病情等)相同或相近者组成区组(或配伍组),(2分)然后把各个组中的受试对象随机分配给不同处理组的设计方法.(1分)

五、简答题(每小题 5 分,共 25 分) 31.简述非参数统计方法的应用条件?

非参数统计适用于资料不符合参数统计的应用条件或总体分布类型不明的资料分析;(2分) 非参数统计适用等级资料的分析;(1分)适用于一端或两端不确定数值资料的分析;(1分)在资料满足参数统计的要求时,应首选参数统计法,以免降低检验效能.(1分)

32.简述直线相关分析时应注意哪些事项?

进行相关分析之前应绘制散点图以判断散点分布是否有线性趋势,(1分)相关分析要求两

变量为服从双变量正态分布的随机变量,(1分)样本的相关系数为0时并不意味着两变量间一定无相关性,也有可能存在非线性相关,(1分)相关关系不一定是因果关系,也可以是伴随关系,也不能证明事物间确有内在联系,(1分)分层资料不能盲目合并,否则易出假象.(1分)

33. 简述进行简单线性回归分析时应注意的事项?

作线性回归分析时要有实际意义,不能把毫无关系的两种现象作回归分析;(1分)在进行

回归分析之前,应先绘制散点图;(1分)直线回归方程的取值范围一般以自变量的取值范围为限;(1分)双变量正态分布资料的线性相关和线性回归的假设检验结果等价;(1分)有线性回归关系不一定是因果关系,不能证明事物间确有内在联系.(1分) 34.简述等级相关的适用条件?

等级相关适用于不服从双变量正态分布而不宜作一般积差相关分析的资料,(1分)总体分布类型未知的资料,(1分)用等级表示的资料,(1分)分布未端有无确定数值的资料,(1分)用相对数表示的资料.(1分)

35. 简述直线相关和直线回归的区别? 两者的区别在于:

两者的应用的目的不同,说明两变量间的相关关系用相关分析,说明两变量间线性依存变化的数量关系用回归分析;(1分) 两者资料要求不同,回归分析应变量Y 服从正分布,自变量可以是精确测量和严格控制

的变量或正态随机变量,相关分析要求X 、Y 服从双变量正态分布;(1分) 两个系数的意义不同:回归系数表示自变量每改变一个单位应变量的平均变化量,相关

系数则表示两变量间相关的方向和密切程度;(1分)

两个系数的计算公式不同和单位不同:

XX

XY

l l b =

,

YY

XX XY

l l l r =,回归系数b 有单

位,相关系数r 没有单位;(1分)

两个系数的取值范围不同:-∞

六、计算题(每小题 10 分,共20 分)(写明分析步骤,请用SPSS 统计软件处理,并记录结果和写出结论)

53. 某人测得某地10名健康儿童发硒和血硒的资料,如下表所示:

表 10名健康儿童发硒与血硒量(1000ppm )

儿童编号 1 2 3 4 5 6 7 8 9 10 发硒X (1000ppm ) 74

66

88

69

91

73

66

96

58

73

血硒Y (1000ppm )

13

10

13

11

16

9

7

14

5

10

问该地儿童血硒和发硒之间是否存在线性相关?(t 0.05,8=2.306;t 0.01,8=3.355) 本题10分

872

.0==

YY

XX XY l l l r

,

()

()

026

.5122

=--=

r n r

t r

54. 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h )如表1,估计尿肌酐含量(Y )对其年龄(X )的回归方程。(t 0.05/2,6=2.447, t 0.01/2,6=3.707)

表1 8名正常儿童的年龄X (岁)与尿肌酐含量Y (mmol/24h )

编 号 1 2 3 4 5 6 7 8

年 龄 X 13 11 9 6 8 10 12 7

尿肌酐含量 Y 3.54 3.01 3.09 2.48 2.56 3.36 3.18 2.65

14

.0==

XX

XY

l l b 38.122.914.067.2=?-=-=X b Y a X Y 14.038.1?+=

67.403.014.0===

b b S b t

研究生医学统计学试题

试卷编号:卷课程名称:医学统计学适用专业:科学学位专业:班级 姓名:学号:学院 (系 ):考试日期:题号一二三四五六七八九十总分统分题分30152530100签名得分 考生注意事项: 1、本试卷共6 页,请查看试卷中是否有缺页或破损。如有立即举手报告以 便更换。 2、考试结束后,考生不得将试卷、答题纸和草稿纸带出考场。 一、最佳选择题(每题 2 分,共 30 分) 得评阅 把每题的答案填入下表中: 123456789101112131415 A B C D B B A C C C B B C D B 1、描述一组正态分布资料的集中趋势,以指标为好。 A. 算术平均数; B. 几何平均数; C. 中位数; D. 变异系数 2、比较成人身高和儿童身高的离散趋势,宜用。 A. 标准差; B. 变异系数; C. 方差; D. 离均差平方和 3、对于正态分布资料,X +1.96S,所对应的面积占总面积的。 A. 95% ; B. 99% ; C. 47.5%; D. 49.5% 4、下列说法哪个是错误的?中位数适用于描述资料。 A. 最小组段无下限; B. 最大组段无上限; C. 偏态分布; D. 正态分布 5、大,表示用该样本均数估计总体均数的可靠性小。 A. S X; B. S; C.CV; D. Q U—Q L 6、某地 1992年随机抽取 100名健康女性,算得其血清总蛋白含量的均数为74g/L ,标准差为 4g/L ,则其 95%的可信区间为。

7、两样本均数比较的t 检验,分别取以下检验水准,以所取第二类错误最大。 A. α =0.01; B. α=0.05; C. α =0.10; D.α=0.20 8、两样本均数比较的t 检验结果, P<0.05 ,可认为。 A. 两样本均数不等; B. 两样本均数相等; C. 两总体均数不等; D. 两总体均数相等 9、完全随机设计的方差分析结果,P≤ 0.05,可认为。 A. 各样本均数不等或不全等; B. 各样本均数都不相等; C. 各总体均数不等或不全等; D. 各总体均数都不相等 10、某地某年肝炎发病人数占总人数的5%,这是该地该年肝炎的。 A. 年发病率; B. 年患病率; C. 患病构成比; D. 患者平均数 11、已知甲县人口较乙县年青,今欲比较两县死亡率的高低,适当的比较方法是。 A.将两县的总死亡率直接比较; B.对年龄进行标准化后,再比较两县总死亡率; C.将两县的总死亡率进行 t 检验后再比较; D.将两县的总死亡率进行χ2检验后再比较 12、下面哪一点不是Poisson 分布的性质。 A. λ =σ2; B. 当λ≥ 20 时,近似正态分布; C. 可加性; D. 相互影响性 13、χ2检验中理论数T 的计算式为。 A. n r (1 n c ) ; B. (1 n r ) n c; C. n r n c; D. n r n c N N N N 14、已知两组计量资料方差不齐,可用检验。 A. t 检验; B. U 检验; C. F 检验; D. 秩和检验 15、对一组既做相关分析又做回归分析的资料,有。 A. b=r ; B. t b=t r; C. b=a; D. r=1

医学统计学复习题65915

预防医学复习题(统计部分) 复习重点(及简答题) 1. 医学统计学的基本概念 如:总体与样本的联系区别 2. 资料的分类 如:请列举资料的类型并举例说明 3. 定量资料统计描述的指标(集中与离散趋势) 如:定量统计描述指标有哪些? 如:正态分布与偏态分布资料统计描述方法有何区别 4. 定性资料统计描述的指标 5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律 如:正态分布、标准正态分布与t分布的区别联系 6. 小概率事件在医学统计学的应用(P值的含义) 如:P值的含义是什么,对统计结论有何意义 7. 假设检验的基本原理与步骤 8. 四种主要统计假设检验方法及其应用场合 9. 统计表的绘制 选择题 1.样本是总体中: A、任意一部分 B、典型部分 C、有意义的部分 D、有代表性的部分 E、有价值的部分 2、参数是指: A、参与个体数 B、研究个体数 C、总体的统计指标 D、样本的总和 E、样本的统计指标 3、抽样的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 4、脉搏数(次/分)是: A、观察单位 B、数值变量 C、名义变量 D.等级变量 E.研究个体 5、疗效是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 6、统计学常将P≤0.05或P≤0.01的事件称 A、必然事件 B、不可能事件 C、随机事件 D、小概率事件 E、偶然事件7.统计中所说的总体是指:

A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体 8.概率P=0,则表示 A某事件必然发生B某事件必然不发生C某事件发生的可能性很小 D某事件发生的可能性很大E以上均不对 9.总体应该由 A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成 10. 在统计学中,参数的含义是 A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量 11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料 B.计量资料 C.总体 D.个体 E.样本 12.统计学中的小概率事件,下面说法正确的是: A.反复多次观察,绝对不发生的事件 B.在一次观察中,可以认为不会发生的事件 C.发生概率小于0.1的事件 D.发生概率小于0.001的事件 E.发生概率小于0.1的事件 13、统计上所说的样本是指: A、按照研究者要求抽取总体中有意义的部分 B、随意抽取总体中任意部分 C、有意识的抽取总体中有典型部分 D、按照随机原则抽取总体中有代表性部分 E、总体中的每一个个体 14、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。 A、计算 B、计数 C、计量 D、等级 E、都对 15、红细胞数是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 16、某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为: A.所有成年男子 B.该市所有成年男子 C.该市所有健康成年男子 D.120名该市成年男子 E.120名该市健康成年男子 17、某地区抽样调查1000名成年人的血压值,此资料属于: A、集中型资料 B、数值变量资料 C、无序分类资料 D、有序分类资料 E、离散型资料 18、抽样调查的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 19、测量身高、体重等指标的原始资料叫: A计数资料 B计量资料 C等级资料 D分类资料E有序分类资料 20、某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗数8 23 6 3 1

研究生医学统计学上机试题

医学科研中的统计学方法上机试题 时间:2014-12-15 共4题,共100分 1.某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记录见下表,问左、右肾重量有无不同? 表1:20例男性尸解时左、右肾的称重记录 编号左肾(克)右肾(克) 1 170 150 2 155 145 3 140 105 4 11 5 100 5 235 222 6 125 115 7 130 120 8 145 105 9 105 125 10 145 135 11 155 150 12 110 125 13 140 150 14 145 140 15 120 90 16 130 120 17 105 100 18 95 100 19 100 90 20 105 125 2. 在评价某药物耐受性及安全性的I期临床试验中,对符合纳入标准的40名健康自愿者随机分为4组,每组10名,各组注射剂量分别为0.5U、1U、2U、3U,观察48小时后部分凝血活酶时间(s)。试比较任意两两剂量间的部分凝血活酶时间有无差别?

表2 各剂量组48小时部分凝血活酶时间(s) 0.5 U 1 U 2 U 3 U 36.8 40.0 32.9 33.0 34.4 35.5 37.9 30.7 34.3 36.7 30.5 35.3 35.7 39.3 31.1 32.3 33.2 40.1 34.7 37.4 31.1 36.8 37.6 39.1 34.3 33.4 40.2 33.5 29.8 38.3 38.1 36.6 35.4 38.4 32.4 32.0 31.2 39.8 35.6 33.8 3. 某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义? 4. 某省卫生防疫站对八个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘进行监测,结果如下,试检验两者有无相关? 表4 八个城市的肺癌标化死亡率和大气中苯并(a)芘浓度城市编号肺癌标化死亡率(1/10万)苯并(a)芘(μg/100m3) 1 5.600.05 2 18.50 1.17 3 16.23 1.05 4 11.400.10 5 13.800.75 6 8.130.50 7 18.000.65 8 12.10 1.20

医学统计学试题与答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

医学统计学复习题

医学统计学复习题 一、名词解释 1、总体 2、样本 3、随机抽样 4、变异 5、概率 6、随机误差(偶然误差) 7、参数 8、统计量 9、算术均数 10、中位数 11、百分位数 12、频数分布表 13、几何均数 14、四分位数间距 15、方差 16、标准差 17、变异系数 18、标准正态分布 19、医学参考值范围 20、可信区间 21、统计推断 22、参数估计 23、标准误及 24、检验水准 25、检验效能 26、率 27、直线相关 28、直线回归 29、实验研究 30、回归系数 二、单项选择 1.观察单位为研究中的()。 A.样本 B.全部对象 C.影响因素 D.个体 E.观察指标 2.总体是由( )组成。 A.部分个体 B.全部对象 C.全部个体 D.同质个体的所有观察值 E.相同的观察指标 3.抽样的目的是()。 A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例 D.研究总体统计量 E.研究特殊个体的特征 4.参数是指( ) 。 A.参与个体数 B.总体中研究对象的总和 C.样本的统计指标 D.样本的总和 E.总体的统计指标 5.关于随机抽样,下列哪一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随机抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.选择符合研究者意愿的样本 6.反映计量资料平均的指标是()。 A.频数 B.参数 C.百分位数 D.平均数 E.统计量 7.表示总体均数的符号是( ) 。 A.σ B.μ C.X D. S E. M

医学统计学研究生题库汇编

医学统计学复习练习题库 研究生教材使用 一、最佳选择题 1.卫生统计工作的步骤为 A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距

E.方差 7.用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为 A.μ+1.96σ B.μ-1.96σ C.μ+2.58σ D.μ+1.64σ E.μ-2.58σ 12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标 (如血糖水平)的正常值范围一般指 A.该指标在所有人中的波动范围 B.该指标在所有正常人中的波动范围 C.该指标在绝大部分正常人中的波动范围 D.该指标在少部分正常人中的波动范围 E.该指标在一个人不同时间的波动范围 14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. x s x μ- 2.统计分析的主要内容有

医学统计学复习习题2018

医学统计学期末复习题 一、单项选择题 1 下面的变量中是分类变量的是 A.身高 B.体重 C.年龄 D.血型 2 下面的变量中是是数值变量的是 A.性别 B.年龄 C.血型 D.职业 3.随机事件的概率 P 为 =0 B. P=1 C. P= D. 0

研究生医学统计学试题

《医学统计学》试题 注:满分300分。最终成绩=总得分/3;

说明 1、试题意在考察研究生对《医学统计学》理论知识和SPSS统计软件的学习掌握情况。 2、研究生在答题过程中严禁抄袭、复印。如发现答案雷同者,该科目成绩将判为“不及格”,后果由学生自负。 3、答题时,不写具体的操作过程(如“选择Analyze→General linear Models→Univariate…,弹出Univariate对话框”)。 4、答题时,首先应明确交代某题所用的具体统计方法。 5、答题时,只将答题有关的SPSS输出结果粘贴到答案中,并且对结果要做出必要的解释;对答题无关的输出结果不要粘贴到答案中。如果对结果不做任何解释,或将跟答题无关的输出结果粘贴到答案中,将对成绩有严重影响。 6、试题(卷)的答案要求A4纸双面打印。

1、(20分)从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果如下表1,①求其均数,中位数,标准差,标准误,最大值,最小值,极差、第2.5、25、75、97.5百分位数(10分);②编制(改进)频数分布表、绘制直方图(各5分)。 表1 某年某单位101名正常成年的血清总胆固醇(mmol/L) 2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26 2、(10分)为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表2第(1)~(3)栏。问两法测定结果是否不同?(写出统计方法并粘贴结果5分;写出统计量、p及对结果进行合理解释5分)。 表2 两种方法对乳酸饮料中脂肪含量的测定结果(%) 编号(1) 哥特里-罗紫法 (2) 脂肪酸水解法 (3) 1 0.840 0.580 2 0.591 0.509 3 0.67 4 0.500 4 0.632 0.316 5 0.687 0.337 6 0.978 0.517 7 0.750 0.454 8 0.730 0.512 9 1.200 0.997 10 0.870 0.506 3、(10分)大量研究显示汉族足月正常产男性新生儿临产前双顶径(BPD)均数为9.3cm。某医生记录了某山区12名汉族足月正常产男性新生儿临产前双顶径(BPD)资料如下:9.95、9.33、9.49、9.00、10.09、9.15、9.52、9.33、9.16、9.37、9.11、9.27。试问该地区男性新生儿临产前双顶径(BPD)是否大于一般新生儿(写出统计方法并粘贴结果5分;写出统计量、p及对结果进行合理解释5分)。 4、(15分)为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名II型糖尿病病人 进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹 胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值见表3。①请对两组数据做 正态性检验(5分);②能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果 不同(写出统计方法并粘贴结果5分、写出统计量、p及对结果进行合理解释5分)?

研究生医学统计试题

研究生《卫生统计学》课程理论考试卷(A卷) (试卷总分:55分,考试时间:45分钟,试题内容9页,空白纸3页)姓名:学号:电脑号:试题号: 一、单选题: 每题1分,55题,共计55分 1. 描述一组偏态分布资料的集中趋势时,最适宜选择的指标是 A.几何均数 B.算术均数 C.中位数 D.众数 E.标准误 2. 测量体重、转氨酶等指标所得的资料叫做:() A、计数资料 B、计量资料 C、等级资料 D、间断性资料 E、分类资料 3.统计中所说的总体是指:( ) A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 4.抽样的目的是:( ) A、研究样本统计量 B、研究总体参数 C、研究典型案例 D、研究误差 E、样本推断总体参数 5. 下面哪个不是样本的指标() A、?x B 、p C、r D、σ E、s 6. 均数与标准差适用于 A、正偏态分布资料 B、负偏态分布资料 C、正态分布资料 D、频数分布类型不明的资料 E.不对称分布的资料

7.两样本均数的t检验中,检验假设(H0)是 A μ1≠μ2 B μ1=μ2 C X1≠X2 D X1=X2 E X1=X2 8. 作单侧检验的前提是: A、已知新药优于旧药 B、已知新药差于旧药 C、不知新药好还是旧药好 D、已知新药不比旧药差 E、已知新旧药差不多好 9. 在假设检验时,本应是双侧检验的问题而误用了单侧检验水准,当拒绝H0时,则() A. 增大了第一类错误 B. 减小了第一类错误 C. 增大了第二类错误 D. 减小了第二类错误 E. 以上都不正确 10. 两样本均数比较的t检验,差别有统计学意义时,P越小,说明() A.两样本均数差别越大 B.两总体差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同 E.越有理由认为两总体均数相同 11.两个样本含量分别为20和30的样本作t检验, 自由度为: () A.50 B.49 C.25 D.24 E.48 12.某医院某日门诊病人数1000人,其中内科病人400人,求得40%,这40%是( ) A率B构成比C相对比D绝对数E标化率 13.卡方检验中自由度的计算公式是( ) A行数×列数 B n-1 C N-k D(行数-1)(列数-1)E行数×列数-1 14.反映某一事件发生强度的指标应选用( ) A 构成比 B 相对比 C 绝对数 D 率E变异系数 15.欲比较两地死亡率,计算标准化率可以()。 A.消除两地总人口数不同的影响 B.消除两地各年龄组死亡人数不同的影响 C.消除两地各年龄组人口数不同的影响 D.消除两地抽样误差不同的影响。

【孙振球第三版】医学统计学复习题

一、名词解释: 1、总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。 2、有限总体:是指空间、时间范围限制的总体。 3、无限总体:是指没有空间、时间限制的总体。 4、样本:从总体中随机抽取部分观察单位,其实测值的集合。 5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。 6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。 8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。 9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。 10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。 11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。检验水平,就是预先规定的允许犯I型错误概率的最大值。I型错误概率大小也用α表示,α可取单尾亦可取双尾。12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。 14、率:强度相对数,说明某现象发生的频率或强度。 15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。 16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。 17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。 18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。 19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。 20、相关系数:又称Pearson积差相关系数,以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位,其值为-1≤r≤1。相关系数的检验假设常用t检验。 21、回归系数:即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。 22、随机划原则:是指在实验分组时,每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。 23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 24、无序分类变量资料:计数资料,又称定性资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。 (2)多分类:各类间互不相容。 25、期望寿命:指同时出生的一代人活满x岁以后尚能生存的年数(即岁数)。 26、检验效能:表达式为1-β,以往称把握度。其意义为当两总体确有差异,按规定检验水准所能发现该差异的能力。 27、观察单位:亦称个体,是统计研究中的基本单位。它可以是一个人、一只动物,也可以是特指的一群人;可以是一个器官,甚至一个细胞。 28、样本含量:样本中包含观察单位数称为该样本的样本含量。 29、变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,成为变量。 30、变量值:对变量的观测值称为变量值或观察值。 31、误差:泛指实测值与真实值之差,按产生原因和性质可粗分为(1)随机误差;(2)非随机误差①系统误差②非系统误差。32、系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。 33、非系统误差:在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除,否则将影响研究结果的准确性。 34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。在重复多次后,出现结果的比例称之为频率。

医学统计学题库

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A . 调查、录入数据、分析资料、撰写论文 B . 实验、录入数据、分析资料、撰写论文 C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计必然考虑其统计分析方法,因而统计分析又寓于统计设计之中;统计分析是在统计设计的基础上,根据设计的不同特点,选择相应的统计分析方法对资料进行分析

医学统计学 练习题

1、某医院用中药治疗7例再生障碍性贫血患者,现将血红蛋白(g/L)变化的数据列在下面,假定资料满足各种参数检验所要求的前提条件,问:治疗前后之间的差别有无显著性意义?(15分) 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白65 75 50 76 65 72 68 治疗后血红蛋白82 112 125 85 80 105 128 2、活动型结核患者的平均心率一般为86次/分,标准差为6.5次/分。现有一医生测量了36名该院的活动型结核患者的心率,得心率均数为90次/分,标准差为7.8次/分,试问该院活动型结核患者与一般活动型结核患者的心率有无差别? 3、某医院将200名乙型肝炎患者随机分为甲、乙两组,各100人。甲组患者用常规治疗法,乙组患者用常规治疗加心理治疗,用一种权威评分法对两组患者的疗效进行评价,结果测得甲组均数为75.78分,标准差为3分,乙组患者均数为89.45分,标准差为4分,问心理治疗有无效果?

4、某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记录如下表,问左右肾重量有无不同? 20例男性尸解时的左、右肾的称重记录 编号 左肾 (克) 右肾 (克) 编号 左肾 (克) 右肾 (克) 1 170 150 11 155 150 2 155 145 12 110 125 3 140 105 13 140 150 4 11 5 100 14 145 140 5 235 222 15 120 90 6 125 115 16 130 120 7 130 120 17 105 100 8 145 105 18 95 100 9 105 125 19 100 90 10 145 135 20 105 125 5、为了研究冠心病与血总胆固醇有无关系,某医生随机收集得冠心病患者和健康人的血总胆固醇(mmol/L)数据如下表,请作分析。 冠心病患者和健康人的血总胆固醇(mmol/L) 组别例数均数标准差 冠心病患者45 5.68 0.87 健康人46 4.91 0.86 6、为研究黄芪对细胞中RNA代谢的影响,在人肌皮肤二倍体细胞培养上进

医学统计学总复习练习题(含答案)

一、最佳选择题 1.卫生统计工作的步骤为C A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有D A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括E A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指B A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指B

A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用D A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差 7.用均数与标准差可全面描述其资料分布特点的是C A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用A A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是C A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有B A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为D

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

医学统计学模拟试题汇编(doc 19页)

医学统计学模拟试题汇编(doc 19页) 部门: xxx 时间: xxx 整理范文,仅供参考,可下载自行编辑

医学统计学模拟试题(A) 一、单选题:在 A、B、C、D 和E 中选出一个最佳答案,将答案的字母填在相应下划线的空格里。 (每题 1 分) 1. 卫生统计工作的基本步骤包括 ___C__。 A 动物实验、临床试验、全面调查和抽样调查 B 资料整理、统计描述、参数估计和统计推断 C 实验设计、资料收集、资料整理和统计分析 D 资料收集、资料核对、资料整理和资料分析 E 统计设计、统计描述、统计估计和统计推断 2. 以下___D__不属于定量资料。 A. 体块指数(体重/身高 2) B. 白蛋白与球蛋白比值 C. 细胞突变率(%) D. 中性核细胞百分比(%) E. 中学生中吸烟人数 3. 关于频数表的制作, 以下__D___论述是正确的。 A. 频数表的组数越多越好 B. 频数表的下限应该大于最小值 C. 频数表的上限应该小于最大值 D. 一般频数表采用等距分组 E. 频数表的极差是最小值与最大值之和 4. 比较身高与坐高两组单位相同数据变异度的大小,宜采用__B___。 A. 变异系数(CV)B.标准差(s)C.方差(s2)D.极差(R)E.四分位间距 5. 从μ到μ+1.96s 范围外左右两则外正态曲线下的面积是_E____ 。 A.2.5% B.95% C.5.0% D.99% E.52.5% 6. 关于假设检验的以下论述中,错误的是__C___。 A. 在已知 A药降血压疗效只会比 B 药好或相等时, 可选单侧检验 B. 检验水准定得越小, 犯 I型错误的概率越小 C. 检验效能 1-定得越小, 犯 II型错误的概率越小 D. P 值越小, 越有理由拒绝 H0 E. 在其它条件相同时, 双侧检验的检验效能比单侧检验低 7. 两组数据中的每个变量值减同一常数后,做两个样本均数( X )差别的 t 检验,__A__。 A. t 值不变B. t 值变小C. t 值变大 D. t 值变小或变大E. 不能判断 8. 将 90 名高血压病人随机等分成三组后分别用 A、B 和 C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是__C__ 。

医学统计学复习题

中国医科大学网络教育学院 医学统计学复习题 一、最佳选择题 1. 下列资料何为定性资料? A 体重(kg) B 血型(A、B、O、AB) C 血红蛋白(g/L) D 坐高指数(%,坐高/身高) E 白细胞计数(个/L) 2. 下列资料属于等级资料的是_______ A 白细胞计数(个/L) B 血型(A、B、O、AB) C 体重(kg) D 病人的病情分级(轻、中、重) E 坐高指数(%,坐高/身高) 3.医学科学研究中的随机样本是指_______ A 总体中的一部分 B 研究对象的全体 C 总体中特殊的一部分 D 总体中有代表性的一部分 E 研究对象中一部分有特殊代表性的样本 4.统计工作的基本步骤是_______ A 设计、搜集资料、整理资料和分析资料 B 设计、统计分析、统计描述和统计推断 C 选择对象、计算统计指标、参数估计和假设检验 D 搜集资料、计算均数、标准差、标准误 E 搜集资料、整理资料和分析资料 5.统计学的小概率事件是指随机事件发生的概率_______ A 等于0.05 B 小于等于0.05 C 大于0.05 D 小于0.05 E 大于等于0.05 6.医学统计学的主要研究对象是_____。 A.随机事件B.必然事件C.不可能发生的事件D.发生可能性很小的事件E.发生可能性很大的事件 7.编制组段数为10的频数表,在确定组距时______ A 常取最大值的1/10取整作为组距 B 常取最小值的1/10取整作为组距 C 常取极差的1/10取整作为组距 D 组距等于极差 E 常取极差的一半取整作为组距 8.频数分布的两个重要特征是______ A 集中趋势和分布类型 B 集中趋势和离散趋势 C 标准差和离均差

相关文档