文档库 最新最全的文档下载
当前位置:文档库 › 医学统计各章节题目

医学统计各章节题目

医学统计各章节题目
医学统计各章节题目

练习题答案

第一章医学统计中的基本概念

练习题

一、单向选择题

1. 医学统计学研究的对象是E

A. 医学中的小概率事件

B. 各种类型的数据

C. 动物和人的本质

D. 疾病的预防与治疗

E.有变异的医学事件

2. 用样本推论总体,具有代表性的样本指的是E

A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体

C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体

E.依照随机原则抽取总体中的部分个体

3. 下列观测结果属于等级资料的是D

A.收缩压测量值B.脉搏数

C.住院天数D.病情程度

E.四种血型

4. 随机误差指的是E

A. 测量不准引起的误差

B. 由操作失误引起的误差

C. 选择样本不当引起的误差

D. 选择总体不当引起的误差

E. 由偶然因素引起的误差

5. 收集资料不可避免的误差是A

A. 随机误差

B. 系统误差

C. 过失误差

D. 记录误差

E.仪器故障误差

答案: E E D E A

二、简答题

常见的三类误差是什么?应采取什么措施和方法加以控制?

[参考答案]

常见的三类误差是:

(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。

(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。

(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。

抽样中要求每一个样本应该具有哪三性?

[参考答案]

从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。

(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。

(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。

(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。

什么是两个样本之间的可比性?

[参考答案]

可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。

(马斌荣)

第二章集中趋势的统计描述

练习题

一、单项选择题

1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A

A. 中位数

B. 几何均数

C. 均数

D. 百分位数

E. 频数分布

2. 算术均数与中位数相比,其特点是B

A.不易受极端值的影响B.能充分利用数据的信息

C.抽样误差较大D.更适用于偏态分布资料

E.更适用于分布不明确资料

3. 一组原始数据呈正偏态分布,其数据的特点是***正的反而小!D

A. 数值离散度较小

B. 数值离散度较大

C. 数值分布偏向较大一侧

D. 数值分布偏向较小一侧

E. 数值分布不均匀

4. 将一组计量资料整理成频数表的主要目的是E

A.化为计数资料 B. 便于计算

C. 形象描述数据的特点

D. 为了能够更精确地检验

E. 提供数据和描述数据的分布特征

5. 6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是B

A. 均数

B. 几何均数

C. 中位数

D. 百分位数

E. 倒数的均数

答案: A B D E B

二、计算与分析

1. 现测得10名乳腺癌患者化疗后血液尿素氮的含量(mmol/L)分别为

3.43,2.96,

4.43,3.03,4.53,

5.25,5.64,3.82,4.28,5.25,试计算其均数和中位数。

[参考答案]

2. 某地100例30-40岁健康男子血清总胆固醇值(mg/dl)测定结果如下:

202 165 199 234 200 213 155 168 189 170 188 168 184 147 219 174 130 183 178 174 228 156 171 199 185 195 230 232 191 210 195 165 178 172 124 150 211 177 184 149 159 149 160 142 210 142 185 146 223 176 241 164 197 174 172 189 174 173 205 224 221 184 177 161 192 181 175 178 172 136 222 113 161 131 170 138 248 153 165 182 234 161 169 221 147 209 207 164 147 210 182 183 206 209 201 149 174 253 252 156 (1)编制频数分布表并画出直方图;

(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适;

(3)计算百分位数、、和。

[参考答案]

(1)编制频数表:

某地100例30-40岁健康男子血清总胆固醇值的频数表

甘油三脂(mg/dL)

(1) 频数

(2) 累积频数

(3) 累积频率

(4)

110~ 2 2 2

125~ 4 6 6

140~11 17 17

155~16 33 33

170~27 60 60

185~12 72 72

200~13 85 85

215~7 92 92

230~ 5 97 97

245~ 3 100 100

合计100 ——

画直方图:

图某地100例30-40岁健康男子血清总胆固醇值的频数分布

(2)计算均数和中位数:

从上述直方图能够看出:此计量指标近似服从正态分布,选用均数较为合适。(3)计算百分位数:

3.测得10名肝癌病人与16名正常人的血清乙型肝炎表面抗原(HBsAg)滴度如下表,试分别计算它们的平均滴度。

肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度

滴度倒数正常人数肝癌病人数

8 7 1

16 5 2

32 1 3

64 3 2

128 0 1

256 0 1

[参考答案]

肝癌病人与正常人的血清乙肝表面抗原(HBsAg)滴度测定结果

滴度倒数(X) 正常人数()

肝癌病人数()

lgx lgx

lgx

8 7 1 0.90 6.30 0.90

16 5 2 1.20 6.00 2.40

32 1 3 1.50 1.50 4.50

64 3 2 1.81 5.43 3.62

128 0 1 2.11 0.00 2.11

256 0 1 2.41 0.00 2.41

合计16 10 - 19.23 15.94

正常人乙肝表面抗原(HBsAg)滴度为1: 15.92

肝癌病人乙肝表面抗原(HBsAg)滴度为1:39.26

(李康)

离散程度的统计描述

练习题

一、单项选择题

1. 变异系数主要用于A

A.比较不同计量指标的变异程度 B. 衡量正态分布的变异程度

C. 衡量测量的准确度

D. 衡量偏态分布的变异程度

E. 衡量样本抽样误差的大小

2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E

A. 变异系数

B. 离均差平方和

C. 极差

D. 四分位数间距

E. 标准差

3. 某项指标95%医学参考值范围表示的是D

A. 检测指标在此范围,判断“异常”正确的概率大于或等于95%

B. 检测指标在此范围,判断“正常”正确的概率大于或等于95%

C. 在“异常”总体中有95%的人在此范围之外

D. 在“正常”总体中有95%的人在此范围

E. 检测指标若超出此范围,则有95%的把握说明诊断对象为“异常”

4.应用百分位数法估计参考值范围的条件是B

A.数据服从正态分布B.数据服从偏态分布

C.有大样本数据D.数据服从对称分布

E.数据变异不能太大

5.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用E

A.全距B.标准差

C.变异系数D.方差

E.四分位数间距

答案:A E D B E

二、计算与分析

1. 下表为10例垂体催乳素微腺瘤的病人手术前后的血催乳素浓度,试说明用何种指标比较手术前后数据的变异情况较为合适。

表手术前后患者血催乳素浓度(ng/ml)

例号血催乳素浓度

术前术后

1 276 41

2 880 110

3 1600 280

4 324 61

5 398 105

6 266 43

7 500 25

8 1760 300

9 500 215

10 220 92

[参考答案]

血催乳素浓度术前均值=672.4 ng/ml,术后均值=127.2 ng/ml。手术前后两组均值相差较大,故选择变异系数作为比较手术前后数据变异情况比较合适。

术前:,

术后:,

可以看出:以标准差作为比较两组变异情况的指标,易夸大手术前血催乳素浓度的变异。2. 某地144例30~45岁正常成年男子的血清总胆固醇测量值近似服从均数为4.95mmol/L,标准差为0.85mmol/L的正态分布。①试估计该地30~45岁成年男子血清总胆固醇的95%参考值范围;②血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的百分之多少?[参考答案]

①正常成年男子的血清总胆固醇测量值近似服从正态分布,故可按正态分布法处理。又因血

清总胆固醇测量值过高或过低均属异常,所以应计算双侧参考值范围。

下限:(mol/L)

上限:(mmol/L)

即该地区成年男子血清总胆固醇测量值的95%参考值范围为3.28 mmol/L~6.62 mmol/L。

②该地正常成年男子的血清总胆固醇测量值近似服从均数为 4.95mmol/L,标准差为

0.85mmol/L的正态分布,计算5.72mmol/L对应的标准正态分布值:

问题转化为求值大于0.91的概率。由于标准正态分布具有对称性,所以值大于0.91的概率与值小于-0.91的概率相同。查附表1得,,所以说血清总胆固醇大于5.72mmol/L的正常成年男子约占其总体的18.14%。

3. 某地200例正常成人血铅含量的频数分布如下表。

(1)简述该资料的分布特征。

(2)若资料近似呈对数正态分布,试分别用百分位数法和正态分布法估计该地正常成人血铅值的95%参考值范围。

表某地200例正常成人血铅含量(μmol/L)的频数分布

血铅含量频数累积频数

0.00~7 7

0.24~49 56

0.48~45 101

0.72~32 133

0.96~28 161

1.20~13 174

1.44~14 188

1.68~ 4 192

1.92~ 4 196

2.16~ 1 197

2.40~ 2 199

2.64~ 1 200

[参考答案]

(1)从表可以看出,血铅含量较低组段的频数明显高于较高组段,分布不对称。同正态分布相比,其分布高峰向血铅含量较低方向偏移,长尾向血铅含量较高组段延伸,数据为正偏态分布。

某地200例正常成人血铅含量(μmol/L)的频数分布

血铅含量组中值频数累积频数累积频率

0.00~0.12 7 7 3.5

0.24~0.36 49 56 28.0

0.48~0.60 45 101 50.5

0.72~0.84 32 133 66.5

0.96~ 1.08 28 161 80.5

1.20~ 1.32 13 174 87.0

1.44~ 1.56 14 188 94.0

1.68~ 1.80 4 192 96.0

1.92~

2.04 4 196 98.0

2.16~ 2.28 1 197 98.5

2.40~ 2.52 2 199 99.5

2.64~ 2.76 1 200 100

(2)因为正常人血铅含量越低越好,所以应计算单侧95%参考值范围。

百分位数法:第95%百分位数位于1.68~组段,组距为0.24,频数为4,该组段以前的累积频数为188,故

即该地正常成人血铅值的95%参考值范围为小于1.80 。

正态分布法:将组中值进行log变换,根据题中表格,得到均值和标准差计算表。

某地200例正常成人血铅含量( )均值和标准差计算表

血铅含量组中值( )

频数( )

0.00~0.12 -0.92 7 -6.44 5.9248

0.24~0.36 -0.44 49 -21.56 9.4864

0.48~0.60 -0.22 45 -9.9 2.178

0.72~0.84 -0.08 32 -2.56 0.2048

0.96~ 1.08 0.03 28 0.84 0.0252

1.20~ 1.32 0.12 13 1.56 0.1872

1.44~ 1.56 0.19 14

2.66 0.5054

1.68~ 1.80 0.26 4 1.04 0.2704

1.92~

2.04 0.31 4 1.24 0.3844

2.16~ 2.28 0.36 1 0.36 0.1296

2.40~ 2.52 0.40 2 0.80 0.3200

2.64~ 2.76 0.44 1 0.44 0.1936

合计——200 -31.52 19.8098

计算均值和标准差:

单侧95%参考值范围:

即该地正常成人血铅值的95%参考值范围为小于1.96 ,与百分位数法相比两者相差不大。

(李康)

第四章抽样误差与假设检验

练习题

一、单项选择题

1. 样本均数的标准误越小说明E

A. 观察个体的变异越小

B. 观察个体的变异越大

C. 抽样误差越大

D. 由样本均数估计总体均数的可靠性越小

E. 由样本均数估计总体均数的可靠性越大

2. 抽样误差产生的原因是D

A. 样本不是随机抽取

B. 测量不准确

C. 资料不是正态分布

D. 个体差异

E. 统计指标选择不当

3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为C

A. 正偏态分布

B. 负偏态分布

C. 正态分布

D. t分布

E. 标准正态分布

4. 假设检验的目的是D

A. 检验参数估计的准确度

B. 检验样本统计量是否不同

C. 检验样本统计量与总体参数是否不同

D. 检验总体参数是否不同

E. 检验样本的P值是否为小概率

5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是E

A. 估计总体中有95%的观察值在此范围内

B. 总体均数在该区间的概率为95%

C. 样本中有95%的观察值在此范围内

D. 该区间包含样本均数的可能性为95%

E. 该区间包含总体均数的可能性为95%

答案:E D C D E

二、计算与分析

为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。

[参考答案]

样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。

,,,

95%可信区间为

下限:(g/L)

上限:(g/L)

即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。

研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl,标准差为30mg/dl。问题:

①如何衡量这100名儿童总胆固醇样本平均数的抽样误差?

②估计100名儿童的胆固醇平均水平的95%可信区间;

③根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。

[参考答案]

均数的标准误可以用来衡量样本均数的抽样误差大小,即

mg/dl,

样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。,,,,则95%可信区间为

下限:(mg/dl)

上限:(mg/dl)

故该地100名儿童的胆固醇平均水平的95%可信区间为201.62mg/dl~213.38mg/dl。

③因为100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平的95%可信区间的下限高于正常儿童的总胆固醇平均水平175mg/dl,提示患心脏病且胆固醇高的父辈,其子代胆固醇水平较高,即高胆固醇具有一定的家庭聚集性。

(李康)

第五章t检验

练习题

一、单项选择题

1. 两样本均数比较,检验结果说明D

A. 两总体均数的差别较小

B. 两总体均数的差别较大

C. 支持两总体无差别的结论

D. 不支持两总体有差别的结论

E. 可以确认两总体无差别

2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指E

A. 两样本均数的差别具有实际意义

B. 两总体均数的差别具有实际意义

C. 两样本和两总体均数的差别都具有实际意义

D. 有理由认为两样本均数有差别

E. 有理由认为两总体均数有差别

3. 两样本均数比较,差别具有统计学意义时,P值越小说明D

A. 两样本均数差别越大

B. 两总体均数差别越大

C. 越有理由认为两样本均数不同

D. 越有理由认为两总体均数不同

E. 越有理由认为两样本均数相同

4. 减少假设检验的Ⅱ类误差,应该使用的方法是E

A. 减少Ⅰ类错误

B. 减少测量的系统误差

C. 减少测量的随机误差

D. 提高检验界值

E. 增加样本含量

5.两样本均数比较的t检验和u检验的主要差别是B

A. t检验只能用于小样本资料

B. u检验要求大样本资料

C. t检验要求数据方差相同

D. t检验的检验效能更高

E. u检验能用于两大样本均数比较

答案:D E D E B

二、计算与分析

1. 已知正常成年男子血红蛋白均值为140g/L,今随机调查某厂成年男子60人,测其血红蛋白均值为125g/L,标准差15g/L。问该厂成年男子血红蛋白均值与一般成年男子是否不同?[参考答案]

因样本含量n>50(n=60),故采用样本均数与总体均数比较的u检验。

(1)建立检验假设, 确定检验水平

,该厂成年男子血红蛋白均值与一般成年男子相同

,该厂成年男子血红蛋白均值与一般成年男子不同

??0.05

(2)计算检验统计量

= =7.75

(3)确定P值,做出推断结论

7.75>1.96,故P<0.05,按α=0.05水准,拒绝,接受,可以认为该厂成年男子血红蛋白均值与一般成年男子不同,该厂成年男子血红蛋白均值低于一般成年男子。

2. 某研究者为比较耳垂血和手指血的白细胞数,调查12名成年人,同时采取耳垂血和手指血见下表,试比较两者的白细胞数有无不同。

表成人耳垂血和手指血白细胞数(10g/L)

编号耳垂血手指血

1 9.7 6.7

2 6.2 5.4

3 7.0 5.7

4 5.3 5.0

5 8.1 7.5

6 9.9 8.3

7 4.7 4.6

8 5.8 4.2

9 7.8 7.5

10 8.6 7.0

11 6.1 5.3

12 9.9 10.3

[参考答案]

本题为配对设计资料,采用配对检验进行分析

(1)建立检验假设, 确定检验水平

H0:?d=0,成人耳垂血和手指血白细胞数差异为零

H1:?d?0,成人耳垂血和手指血白细胞数差异不为零

??0.05

(2)计算检验统计量

20.36

=

=3.672> ,P < 0.05,拒绝H0,接受H1,差别有统计学意义,可以认为两者的白细胞数不同。

3. 分别测得15名健康人和13名Ⅲ度肺气肿病人痰中抗胰蛋白酶含量(g/L)如下表,问健康人与Ⅲ度肺气肿病人抗胰蛋白酶含量是否不同?

表健康人与Ⅲ度肺气肿患者α1抗胰蛋白酶含量(g/L)

健康人Ⅲ度肺气肿患者

2.7

3.6

2.2

3.4

4.1 3.7

4.3

5.4

2.6

3.6

1.9 6.8

1.7 4.7

0.6 2.9

1.9 4.8

1.3 5.6

1.5 4.1

1.7 3.3

1.3 4.3

1.3

1.9

[参考答案]

由题意得,

本题是两个小样本均数比较,可用成组设计t检验,首先检验两总体方差是否相等。

H0:?12=?22,即两总体方差相等

H1:?12≠?22,即两总体方差不等

?=0.05

F = = =1.19

=2.53>1.19,F< ,故P>0.05,按α=0.05水准,不拒绝H0,差别无统计学意义。故认为健康人与Ⅲ度肺气肿病人α1抗胰蛋白酶含量总体方差相等,可直接用两独立样本均数比较的t检验。

(1)建立检验假设, 确定检验水平

,健康人与Ⅲ度肺气肿病人抗胰蛋白酶含量相同

,健康人与Ⅲ度肺气肿病人抗胰蛋白酶含量不同

??0.05

(2)计算检验统计量

=1.12

=5.63

(3)确定P值,做出推断结论

t=5.63> ,P < 0.001,拒绝H0,接受H1,差别有统计学意义,可认为健康人与Ⅲ度肺气肿病人α1抗胰蛋白酶含量不同。

4.某地对241例正常成年男性面部上颌间隙进行了测定,得其结果如下表,问不同身高正常男性其上颌间隙是否不同?

表某地241名正常男性上颌间隙(cm)

身高(cm) 例数均数标准差

161~116 0.2189 0.2351

172~125 0.2280 0.2561

[参考答案]

本题属于大样本均数比较,采用两独立样本均数比较的u检验。

由上表可知,

=116 ,=0.2189 , =0.2351

=125 ,=0.2280 , =0.2561

(1)建立检验假设, 确定检验水平

,不同身高正常男性其上颌间隙均值相同

,不同身高正常男性其上颌间隙均值不同

??0.05

(2)计算检验统计量

=0.91

(3)确定P值,做出推断结论

u=0.91<1.96,故P>0.05,按α=0.05水准,不拒绝H0, 差别无统计学意义,尚不能认为不同身高正常男性其上颌间隙不同。

5.将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如下表,问两组的平均效价有无差别?

表钩端螺旋体病患者凝溶试验的稀释倍数

标准株100 200 400 400 400 400 800 1600 1600 1600 3200 3200 3200

水生株100 100 100 200 200 200 200 400 400 800 1600

[参考答案]

本题采用两独立样本几何均数比较的t检验。

t=2.689>t0.05/2,22,P<0.05,拒绝H0,接受H1,差别有统计学意义,可认为两组的平均效价有差别。

6.为比较男、女大学生的血清谷胱甘肽过氧化物酶(GSH-Px)的活力是否相同,某医生对某大学18~22岁大学生随机抽查男生48名,女生46名,测定其血清谷胱甘肽过氧化酶含量(活力单位),男、女性的均数分别为96.53和93.73,男、女性标准差分别为

7.66和14.97。问男女性的GSH-Px是否相同?

[参考答案]

由题意得=48,96.53,=7.66

=46,=93.73,=14.97

本题是两个小样本均数比较,可用成组设计t检验或t’检验,首先检验两总体方差是否相等。

H0:?12=?22,即两总体方差相等

H1:?12≠?22,即两总体方差不等

?=0.05

F = = =3.82

F =3.82> ,故P<0.05,差别有统计学意义,按?=0.05水准,拒绝H0,接受H1,故认为男、女大学生的血清谷胱甘肽过氧化物酶的活力总体方差不等,不能直接用两独立样本均数比较的t检验,而应用两独立样本均数比较的t’检验。

=1.53,t’0.05/2=2.009,t’0.05,按α=0.05水准,不拒绝H0, 差别无统计学意义,尚不能认为男性与女性的GSH-Px有差别。

(沈其君, 施榕)

第六章方差分析

练习题

一、单项选择题

1. 方差分析的基本思想和要点是E

A.组间均方大于组内均方B.组内均方大于组间均方

C.不同来源的方差必须相等D.两方差之比服从F分布

E.总变异及其自由度可按不同来源分解

2. 方差分析的应用条件之一是方差齐性,它是指B

A. 各比较组相应的样本方差相等

B. 各比较组相应的总体方差相等

C. 组内方差=组间方差

D. 总方差=各组方差之和

E. 总方差=组内方差+ 组间方差

3. 完全随机设计方差分析中的组间均方反映的是C

A. 随机测量误差大小

B. 某因素效应大小

C. 处理因素效应与随机误差综合结果

D. 全部数据的离散度

E. 各组方差的平均水平

4. 对于两组资料的比较,方差分析与t检验的关系是E

A. t检验结果更准确

B. 方差分析结果更准确

C. t检验对数据的要求更为严格

D. 近似等价

E. 完全等价

5.多组均数比较的方差分析,如果,则应该进一步做的是D

A.两均数的t检验B.区组方差分析

C.方差齐性检验D.检验

E.确定单独效应

答案:E B C E D

二、计算与分析

1.在评价某药物耐受性及安全性的I期临床试验中,对符合纳入标准的40名健康自愿者随机分为4组,每组10名,各组注射剂量分别为0.5U、1U、2U、3U,观察48小时后部分凝血活酶时间(s)。试比较任意两两剂量间的部分凝血活酶时间有无差别?

各剂量组48小时部分凝血活酶时间(s)

0.5 U 1 U 2 U 3 U

36.8 40.0 32.9 33.0

34.4 35.5 37.9 30.7

34.3 36.7 30.5 35.3

35.7 39.3 31.1 32.3

33.2 40.1 34.7 37.4

31.1 36.8 37.6 39.1

34.3 33.4 40.2 33.5

29.8 38.3 38.1 36.6

35.4 38.4 32.4 32.0

31.2 39.8 35.6 33.8

[参考答案]

如方差齐同,则采用完全随机设计的方差分析。

经Bartlett 方差齐性检验,=1.8991 ,=3。由于=7.81,,故>0.05,可认为四组48小时部分凝血活酶时间的总体方差齐同,于是采用完全随机设计的方差分析对四个剂量组部分凝血活酶时间进行比较。

(1)提出检验假设,确定检验水准

: ,即四个剂量组部分凝血活酶时间的总体均数相同

: 、、、不全相同,即四个剂量组部分凝血活酶时间的总体均数不全相同

=0.05

(2)计算检验统计量,列于方差分析表中

方差分析表

变异来源平方和

自由度

均方

处理组间101.0860 3 33.6953 4.80

组内(误差)252.4780 36 7.0133

总变异353.5640 39

(3)确定值,做出推断结论

分子自由度,分母自由度,查界表(方差分析用), =2.87。由于=4.80,,故<0.05,按照= 0.05的显著性水准,拒绝,接受,差别有统计学意义,可认为四个剂量组部分凝血活酶时间的总体均数不全相同,进而需进行均数间多重比较。

本题采用SNK法进行多重比较。

(1)提出检验假设,确定检验水准

:,即任意两组部分凝血活酶时间的总体均数相同

:,即任意两组部分凝血活酶时间的总体均数不相同

=0.05

(2)计算检验统计量,用标记字母法标记

多重比较结果(=0.05)

组别均数例数SNK标记

1 U 37.830 10 A

2 U 35.100 10 B

3 U 34.370 10 B

0.5 U 33.620 10 B

(3)做出推断结论

1U与0.5U,1U与2U ,1U与3U间差别有统计学意义(标记字母不同),可认为1U与0.5U,1U与2U ,1U与3U间部分凝血活酶时间的总体均数不同。

0.5 U、2U、3U组彼此间差别无统计学意义(均含有字母B),可认为这三组部分凝血活酶时间的总体均数相同。

2.为探讨小剂量地塞米松对急性肺损伤动物模型肺脏的保护作用,将36只二级SD大鼠按性别、体重配成12个配伍组,每一配伍组的3只大鼠被随机分配到对照组、损伤组与激素组,实验24小时后测量支气管肺泡灌洗液总蛋白水平(g/L),结果如下表。问3组大鼠的总蛋白水平是否相同?

3组大鼠总蛋白水平(g/L)

配伍组对照组损伤组激素组

1 0.36 1.48 0.30

2 0.28 1.42 0.32

3 0.26 1.33 0.29

4 0.2

5 1.48 0.16

5 0.3

6 1.26 0.35

6 0.31 1.53 0.43

7 0.33 1.40 0.31

8 0.28 1.30 0.13

9 0.35 1.58 0.33

10 0.41 1.24 0.32

11 0.49 1.47 0.26

12 0.27 1.32 0.26

[参考答案]

本题采用随机区组设计的方差分析。

(1)提出检验假设,确定检验水准

:,即三组大鼠总蛋白水平的总体均值相同

:、、不全相同,即三组大鼠总蛋白水平的总体均值不全相同

:,即不同配伍组大鼠总蛋白水平的总体均值相同

:、、…、不全相同,即不同配伍组大鼠总蛋白水平的总体均值不全相同

=0.05

(2)计算检验统计量,列于方差分析表中

方差分析表

变异来源平方和

自由度

均方

处理组间9.5512 2 4.7756 719.80

区组间0.1138 11 0.0103 1.56

误差0.1460 22 0.0066

总变异9.8109 35

(3)确定值,做出推断结论。

对于处理因素,分子自由度=2,分母自由度=22,查界值表(方差分析用),=3.44。由于=719.80,,故<0.05,按照= 0.05的显著性水准,拒绝,差别有统计学意义,可认为三组大鼠总蛋白水平的总体均值不全相同。

对于区组因素,分子自由度=11,分母自由度=22,查界值表(方差分析用),=2.26。由于=1.56,,故>0.05,照= 0.05的显著性水准,不拒绝,差别无统计学意义,尚不能认为区组因素对大鼠总蛋白水平有影响。

3.为研究喹啉酸对大鼠急性和亚急性炎症的影响,将40只体重为200 20(g)的雄性Wistar 大鼠建立急性和亚急性炎症动物模型,然后随机分为4组,每组10只,给予不同的处理,观察其WBC值。4种处理分别为:腹腔注射生理盐水后3小时处死、腹腔注射生理盐水后6小时处死、腹腔注射喹啉酸(0.35mg/g)后3小时处死,腹腔注射喹啉酸(0.35mg/g)后6小时处死。实验结果如下表。问喹啉酸与给药距处死的时间间隔(简称时间)对WBC值是否有影响?

不同药物与不同时间大鼠WBC值(103)

时间药物

生理盐水喹啉酸

3h 21.3 18.8 15.8 11.0

21.9 13.5 8.7 12.8

11.1 22.6 9.4 12.5

16.3 17.1 5.3 9.3

17.9 14.6 8.3 11.0

6h 19.0 23.0 13.9 19.0

25.2 22.8 15.8 15.3

22.9 17.8 18.3 19.2

19.8 24.6 13.0 18.2

22.7 25.3 14.0 17.3

[参考答案]

本题采用2 2析因设计方差分析。

(1)提出检验假设,确定检验水准

:,即A因素两个水平组WBC值总体均数相等

:,即A因素两个水平组WBC值总体均数不相等

:,即B因素两个水平组WBC值总体均数相等

:,即B因素两个水平组WBC值总体均数不相等

:A与B无交互效应

:A与B存在交互效应

=0.05

2.计算检验统计量,列于方差分析表中。

方差分析表

变异来源平方和

自由度

均方

A因素423.1502 1 423.1502 48.68

B因素291.0603 1 291.0603 33.48

A B

3.5403 1 3.5403 0.41

误差312.9470 36 8.6930

总变异1030.6978 39

3.确定值,做出推断结论。

对于A因素,=1,=36,查界值表(方差分析用),=4.11。由于

=48.68,,故< 0.05,按照= 0.05的显著性水准,拒绝,接受,认为A因素(药物)两个水平组WBC值总体均数不相等。

对于B因素,=1,=36,查界值表(方差分析用),=4.11。由于=33.48,,故< 0.05,按照= 0.05的显著性水准,拒绝,认为B因素(时间)两个水平组WBC值总体均数不相等。

对于AB交互作用,=1,=36,查界值表(方差分析用),=4.11。由于=0.41,,故>0.05,按照= 0.05的显著性水准,不拒绝,认为A(药物)与B(时间)间无交互效应。

(钟晓妮)

第七章相对数及其应用

练习题

一、单项选择题

1. 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是A

A. 该病患病率增加

B. 该病患病率减少

C. 该病的发病率增加

D. 该病的发病率减少

E. 该疾病的死因构成比增加

2. 计算乙肝疫苗接种后血清学检查的阳转率,分母为C

A. 乙肝易感人数

B. 平均人口数

C. 乙肝疫苗接种人数

D. 乙肝患者人数

E. 乙肝疫苗接种后的阳转人数

3. 计算标准化死亡率的目的是D

A. 减少死亡率估计的偏倚

B. 减少死亡率估计的抽样误差

C. 便于进行不同地区死亡率的比较

D. 消除各地区内部构成不同的影响

E. 便于进行不同时间死亡率的比较

4. 影响总体率估计的抽样误差大小的因素是E

A. 总体率估计的容许误差

B. 样本率估计的容许误差

C. 检验水准和样本含量

D. 检验的把握度和样本含量

E. 总体率和样本含量

5. 研究某种新药的降压效果,对100人进行试验,其显效率的95%可信区间为0.862~0.926,表示E

样本显效率在0.862~0.926之间的概率是95%

B. 有95%的把握说总体显效率在此范围内波动

C. 有95%的患者显效率在此范围

D. 样本率估计的抽样误差有95%的可能在此范围

E. 该区间包括总体显效率的可能性为95%

答案:A C D E E

二、计算与分析

1. 某工厂在“职工健康状况报告中”写到:“在946名工人中,患慢性病的有274人,其中女性219人,占80%,男性55人,占20%。所以女性易患慢性病”,你认为是否正确?为什么?

[参考答案]

不正确,因为此百分比是构成比,不是率,要知道男女谁更易患病需知道946名工人中的男女比例,然后计算男女患病率。

2. 在“锑剂短程疗法治疗血吸虫病病例的临床分析”一文中,根据下表资料认为“其中10~岁组死亡率最高,其次为20~岁组”,问这种说法是否正确?

锑剂治疗血吸虫不同性别死亡者年龄分布

?年龄组男女合计

0~ 3 3 6

10~11 7 18

20~ 4 6 10

30~ 5 3 8

40~ 1 2 3

50~ 5 1 6

合计29 22 51

[参考答案]

不正确,此为构成比替代率来下结论,正确的计算是用各年龄段的死亡人数除各年龄段的调查人数得到死亡率。

3. 某研究根据以下资料说明沙眼20岁患病率最高,年龄大的反而患病率下降,你同意吗?说明理由。

某研究资料沙眼病人的年龄分布

?年龄组沙眼人数构成比(%)

0~47 4.6

10~198 19.3

20~330 32.1

30~198 19.3

40~128 12.4

50~80 7.8

60~38 3.7

70~8 0.8

合计? 1027 100.0

[参考答案]

不正确,此为构成比替代率来下结论,正确的计算是用各年龄段的沙眼人数除各年龄段的调查人数得到患病率。

4. 今有两个煤矿的工人尘肺患病率(%)如下表,试比较两个煤矿的工人尘肺总的患病率。

两个煤矿的工人尘肺患病率情况(%)

工龄

(年) ?? 甲矿乙矿

检查人数尘肺人数患病率检查人数尘肺人数患病率

<6 14026 120 0.86 992 2 0.20

6~? 4285 168 3.92 1905 8 0.42

10~? 2542 316 12.43 1014 117 11.54

合计20853 604 2.90 3911 127 3.25

[参考答案]

两个煤矿的工人尘肺标准化患病率(%)

工龄

(年) 标准构成甲矿乙矿

原患病率预期患病人数原患病率预期患病人数

<6 15018 0.86 129 0.20 30

6~6190 3.92 243 0.42 26

10~3556 12.43 442 11.54 410

合计24764 814 466

甲矿尘肺患病率=

乙矿尘肺患病率

甲矿尘肺患病率高于乙矿尘肺患病率。

5. 抽样调查了某校10岁儿童200名的牙齿,患龋130人,试求该校儿童患龋率的95%的区间估计。

[参考答案]

( ,)=

(刘启贵)

第八章检验

练习题

一、单项选择题

1. 利用检验公式不适合解决的实际问题是C

A. 比较两种药物的有效率

B. 检验某种疾病与基因多态性的关系

C. 两组有序试验结果的药物疗效

D. 药物三种不同剂量显效率有无差别

E. 两组病情“轻、中、重”的构成比例

2.欲比较两组阳性反应率, 在样本量非常小的情况下(如), 应采用C

A. 四格表检验

B. 校正四格表检验

C. Fisher确切概率法

D. 配对检验

E. 校正配对检验

3.进行四组样本率比较的检验,如,可认为E

A. 四组样本率均不相同

B. 四组总体率均不相同

C. 四组样本率相差较大

D. 至少有两组样本率不相同

至少有两组总体率不相同

4. 从甲、乙两文中,查到同类研究的两个率比较的检验,甲文,乙文,可认为C

A. 两文结果有矛盾

B. 两文结果完全相同

C.甲文结果更为可信 D. 乙文结果更为可信

E. 甲文说明总体的差异较大

5. 两组有效率比较检验功效的相关因素是B

A. 检验水准和样本率

B. 总体率差别和样本含量

C. 样本含量和样本率

D. 总体率差别和理论频数

E. 容许误差和检验水准

答案:C C E C B

二、计算与分析

1.某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义?

[参考答案]

本题是两组频数分布的比较,资料课整理成下表的形式。

两组疗法病人的死亡率的比较

组别死亡存活合计

西医疗法13 89 102

西医疗法加中医疗法9 180 189

合计22 269 291

(1)建立检验假设并确定检验水准

:,即两组病人的死亡率相等

:,即两组病人的死亡率不等

(2)用四个表的专用公式,计算检验统计量值

= =6.041

(3)确定P 值,作出推断结论

以=1查附表7的界值表,得。按水准,拒绝,接受,可以认为两组病人的死亡率不等。

2.某医院研究中药治疗急性心肌梗死的疗效,临床观察结果见下表。问接受两种不同疗法的患者病死率是否不同?

两种药治疗急性心肌梗死的疗效

组别存活死亡合计病死率(%)

中药组65 3 68 4.41

非中药组12 2 14 14.29

合计77 5 82 6.10

[参考答案]

本题= ,宜用四格表的确切概率法

(1)建立检验假设并确定检验水准

:,即两种不同疗法的患者病死率相同

:,即两种不同疗法的患者病死率不同

(2)计算确切概率

=0.2001

(3)作出推断结论

按水准,不拒绝,无统计学意义,还不可以认为两种不同疗法的患者病死率不同。

3.某医师观察三种降血脂药A,B,C的临床疗效,观察3个月后,按照患者的血脂下降程度分为有效与无效,结果如下表,问三种药物的降血脂效果是否不同?

三种药物降血脂的疗效

药物有效无效合计

A 120 25 145

B 60 27 87

C 40 22 62

[参考答案]

本题为3个样本构成比的比较,是3×2表资料。

医学统计学名词解释及问答题

1、总体(population):是根据研究目的确定的同质研究对象的全体。 2、样本(sample):从总体中抽取的一部分有代表性的个体。 3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。 4、变异(variation):指同质个体的某项指标之间的差异。 5、参数(parameter):反映总体特征的指标称为参数。 6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。 7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。 8、概率(probability):某事件发生的可能性大小。 9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。 10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。 11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。 12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。 13、方差(variance):是各个数据与平均数之差的平方的平均数。 14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。 16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。 17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。 18、统计推断(statistical inference):是根据已知的样本信息来推断未知的总体,是统计分析的目的,包括参数估计和假设检验。 19、Ⅰ型错误(type Ⅰ error):拒绝了实际上成立的H0,这类弃真错误,发生的概率为α,为已知。 20、Ⅱ型错误(type Ⅱ error):不拒绝实际上不成立的H0,这类存伪错误,发生的概率为β,未知。 21、检验效能(power of test):又称把握度,为1-β,其意义是两总体确有差别,按α水准能发现它们有差别的能力。 22、可信区间(confidence interval):指总体参数可能所在的范围。 23、率(rate):说明某现象发生的频率或强度。 24、构成比(constituent ratio):表示某事物内部各组成部分所占的比重或分布,常以百分数表示。 25、相对比(relative ratio):表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。 26、标准化率(standardized rate):亦称调整率,是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。 27、参数检验(parametric test):一类依赖于总体分布的具体形式的统计推断方法。 28、非参数检验(non parametric test):一类不依赖总体分布类型的检验,在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的统计方法。

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

医学统计学 名词解释+问答题-1

医学统计学 1、应用相对数时应注意的事项 ①计算相对数时分母不能太小; ②分析时不能以构成比代替率; ③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均; ④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近; ⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。 2、正态分布的特点及其应用 性质:①两头低中间高,略呈钟形; ②只有一个高峰,在X=μ,总体中位数亦为μ; ③以均数为中心,左右对称; ④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动; σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高; ⑤对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u 服从于均数为0,方差为1的正态分布,即标准正态分布。 应用:①概括估计变量值的频数分布; ②制定参考值范围; ③质量控制; ④是许多统计方法的理论基础。 3、确定参考值范围的一般原则和步骤、方法 一般原则和步骤:①抽取足够例数的正常人样本作为观察对象; ②对选定的正常人进行准确而统一的测定,以控制系统误差; ③判断是否需要分组测定; ④决定取单侧范围值还是双侧范围值; ⑤选定适当的百分范围; ⑥选用适当的计算方法来确定或估计界值。 方法:①正态分布法:②百分位数法(偏态分布) 4、总体均数的可信区间与参考值范围的区别 概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。 参考值范围是绝大多数正常人的某指标范围。所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。 计算公式:可信区间① ② ③ 参考值范围①正态分布 ②偏态分布 用途:可信区间用于总体均数的区间估计 参考值范围用于表示绝大多数观察对象某项指标的分布范围

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

医学统计学简答题

医学统计学简答题 1.简述标准差、标准误的区别与联系? 区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。 (2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。 (3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。 联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。 2.简述假设检验的基本步骤。 1.建立假设,确定检验水准。 2.选择适当的假设检验方法,计算相应的检验统计量。 3.确定P值,下结论 3.正态分布的特点和应用:? 特点:?1、集中性:正态曲线的高峰位于正中央,即均数所在的位置;? 2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交; 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;?

4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平; ?5、u变换:为了便于描述和应用,常将正态变量作数据转换;?? 应用:?1.估计医学参考值范围?2.质量控制?3.正态分布是许多统计方法的理论基础 4.简述参考值范围与均数的可信区间的区别和联系 可信区间与参考值范围的意义、计算公式和用途均不同。 ?1.从意义来看?95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指?95%可信度估计的总体均数的所在范围? 2.从计算公式看?若指标服从正态分布,95%参考值范围的公式是:±1.96s。?总体均数95%可信区间的公式是:??前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。 5.频数表的用途和基本步骤。 用途:(1)揭示资料的分布特征和分布类型;(2)便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。 基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。 6.非参数统计检验的适用条件。 (1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能 7.线性回归的主要用途。

医学统计学试题

医学统计学试题 一.选择题(每题 2分,共 20分) 1、有两个独立随机的样本,样本含量分别为n i和n2,在进行成组设计资料的检验时, 自由度是() A n i+n2 B 、n i+n2-i C 、n i+n2+i D 、n i+n2-2 标准误反映() A、抽样误差的大小 B、总体参数的波动大小 C、重复实验准确度的高低 D、数据的离散程度 3、最小二乘法是指各实测点到回归直线的() A、垂直距离的平方和最小 B、垂直距离最小 C、纵向距离的平方和最小 D、纵向距离最小 4、用样本推论总体,具有代表性的样本指的是() A、总体中最容易获得的部分个体 B、在总体中随意抽取任意个体 C、依照随机原则抽取总体中的部分个体 D、用配对方法抽取的部分个体 5、随机误差指的是() A、测量不准引起的误差 B、由操作失误引起的误差 C、选择样本不当引起的误差 D、由偶然因素引起的误差 6、某项指标 95%医学参考值范围表示的是() A、检测指标在此范围,判断“异常”正确的概率大于或等于 95% B、检测指标在此范围,判断“正常”正确的概率大于或等于 95% C、在“异常”总体中有 95%的人在此范围之外 D、在“正常”总体中有 95%的人在此范围 7、从甲、乙两文中,查到同类研究的两个率比较的X检验,甲文x> X o.oi,i, 文X> X o.05,1,可认为() A、两文结果完全相同 B、甲文结果更为可信 C、乙文结果更为可信 D、甲文说明总体的差异较大

8、两样本均数比较的 t 检验和 u 检验的主要差别是() A、t 检验只能用于小样本资料 B、u 检验要求大样本资料 C、t 检验要求数据方差相同 D、u 检验能用于两大样本均数比较 9、对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是() A、适用范围广 B、检验效能高 C、检验结果更准确 D、不易出现假阴性错误 10、两数值变量相关关系越强,表示() A、相关关系越大 B、相关系数越大 C、回归系数越大 D、相关系数检验统计量 t 值越大 [参考答案 ] 1-5:DACCD 6-10 :DBBAB 二.名词解释(每题 4分,共 20 分) 1、偏回归系数 2>n型错误: 3、非参数检验: 4、残差平方和 /剩余平方和: 5、率的标准误: [参考答案 ] 1. 表示其他自变量保持不变时,X j增加或减少一个单位引起的丫的变化量。 2. 指接受了实际上不成立的H0,即“存伪”的错误。U型错误的概率用B表示。 3. 不依赖于总体分布类型、不针对总体参数的检验方法,如假设两总体分布相同检 验统计量基于变量的秩等,这类检验方法称为非参数检验。 4. 指除 x 对 y 的线性影响外,其它所有因素对 y 变异的影响,即在总平方和中无 法用 x 与 y 的线性关系所能解释的部分变异,用以表示考虑回归关系后, y 的随机误差。 5. 指用以衡量由于抽样引起的样本率与总体率之间的误差的统计量。 三.简答题(每题 10分,共 30分) 1、什么是两个样本之间的可比性? [参考答案 ] 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 2、抽样中要求每一个样本应该具有哪三性? [参考答案 ]

医学统计学课后答案.

第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance ,CV )亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio ),又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百 分之几,它是对比的最简单形式。其计算公式为 比=A /B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: ) 比例基数(单位总数 可能发生某现象的观察单位数 实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或

医学统计学试题及其答案

l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2

最新医学统计学问答题(含答案)

简答题 0. 算术均数、几何均数和中位数各有什么适用条件? 答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。 (2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。 (3)中位数:适用各种类型的资料,尤其以下情况: A 资料分布呈明显偏态; B 资料一端或两端存在不确定数值(开口资料或无界资料); C 资料分布不明。 1.对于一组近似正态分布的资料,除样本含量n 外,还可计算 S X ,和S X 96.1±,问各说明什么? (1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势 (2)S 为标准差,说明正态分布或近似正态分布的离散趋势 (3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。 2.试述正态分布、标准正态分布的联系和区别。 正态分布 标准正态分布 原始值X 无需转换 作u=(X-μ)/σ转换 分布类型 对称 对称 集中趋势 μ μ=0 均数与中位数的关系 μ=M μ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为μ,标准差为σ(μ为任意数,而σ为大于0的任意数)。标准正态分布的曲线只有一条,而正态分布曲线是一簇。任何正态分布都可以通过标准正态变换转换成标准正态分布。标准正态分布是正态分布的特例。 3.说明频数分布表的用途。 1)描述频数分布的类型 2)描述频数分布的特征 3)便于发现一些特大或特小的可疑值 4)便于进一步做统计分析和处理 4.变异系数的用途是什么? 多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。 5.试述正态分布的面积分布规律。 (1)X 轴与正态曲线所夹的面积恒等于1或100%; (2)区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 6.试举例说明均数的标准差与标准误的区别与联系。 7.标准正态分布(u 分布)与t 分布有何不同?

医学统计学第三版第四章课后习题答案

2. ANOVA 实验结果 Sum of Squares df Mean Square F Sig. Between Groups 43.194 3 14.398 13.697 .000 Within Groups 37.842 36 1.051 Total 81.036 39 Multiple Comparisons Dependent Variable: 实验结果 Dunnett t (2-sided)a (I) 分组(J) 分组Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound 0.5 对照组-2.15000*.45851 .000 -3.2743 -1.0257 1.0 对照组- 2.27000*.45851 .000 - 3.3943 -1.1457 1.5 对照组-2.66000*.45851 .000 -3.7843 -1.5357 F=13.697 P=0.000004 P A=0.000113 P B=0.000051 P C=0.000004均小于0.001 根据完全随机资料的方差分析,按α=0.05水准,拒绝H0,接受H1,认为四组治疗组小白鼠的肿瘤重量总体均数不全相等,即不同剂量药物注射液的抑癌作用有差别。 3. Tests of Between-Subjects Effects Dependent Variable: 重量 Source Type III Sum of Squares df Mean Square F Sig. Hypothesis 99736.333 1 99736.333 58.489 .005 Error 5115.667 3 1705.222a 治疗 Hypothesis 6503.167 2 3251.583 44.867 .000 Error 434.833 6 72.472b 分组 Hypothesis 5115.667 3 1705.222 23.529 .001 Error 434.833 6 72.472b F:44.867 23.529 P:0.000246 0.001020<0.01 根据随机区组资料的方差分析,按α=0.05水准,拒绝H0,接受H1,三组注射不同剂量雌激素的大白鼠子宫重量总体均数不全相等,即注射不同剂量的雌激素对大白鼠子宫重量有影响 5.

医学统计学 练习题

1、某医院用中药治疗7例再生障碍性贫血患者,现将血红蛋白(g/L)变化的数据列在下面,假定资料满足各种参数检验所要求的前提条件,问:治疗前后之间的差别有无显著性意义(15分) 患者编号1234567 治疗前血红蛋白65755076657268 治疗后血红蛋白821121258580105128 2、活动型结核患者的平均心率一般为86次/分,标准差为次/分。现有一医生测量了36名该院的活动型结核患者的心率,得心率均数为90次/分,标准差为次/分,试问该院活动型结核患者与一般活动型结核患者的心率有无差别 3、某医院将200名乙型肝炎患者随机分为甲、乙两组,各100人。甲组患者用常规治疗法,乙组患者用常规治疗加心理治疗,用一种权威评分法对两组患者的疗效进行评价,结果测得甲组均数为分,标准差为3分,乙组患者均数为分,标准差为4分,问心理治疗有无效果 4、某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记

录如下表,问左右肾重量有无不同 20例男性尸解时的左、右肾的称重记录 编号 左肾 (克) 右肾 (克) 编号 左肾 (克) 右肾 (克) 117015011155150 215514512110125 314010513140150 411510014145140 52352221512090 612511516130120 713012017105100 81451051895100 91051251910090 1014513520105125 5、为了研究冠心病与血总胆固醇有无关系,某医生随机收集得冠心病患者和健康人的血总胆固醇(mmol/L)数据如下表,请作分析。 冠心病患者和健康人的血总胆固醇(mmol/L) 组别例数均数标准差 冠心病患者45 健康人46

(完整版)医学统计学试题及答案[1]

医学统计学试题及答案 医学试题精选2009-12-20 12:28:11 阅读6171 评论0 字号:大中小订阅 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2

医学统计学名词解释及问答题

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。 总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。 抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。 标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数 区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。 参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常 置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法(标准误)、二项分布法。置信区间估计总体参数所在范围 参数统计(parametric statistics) 非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。 变异(variation):对于同质的各观察单位,其某变量值之间的差异 同质(homogeneity):研究对象具有的相同的状况或属性等共性。 回归系数有单位,而相关系数无单位 β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。 线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。 参数(parameter):描述总体特征的统计指标。 统计量(statistic):描述样本特征的统计指标。 实验设计的基本原则 对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组 重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象(样

医学统计学试题和答案.doc

医学统计学试题和答案

(一)单项选择题 3.抽样的目的是( b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 D. 研究总体统计量 C.研究典型案例研究误差 4.参数是指( b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的(a)。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A. 均数不变,标准差改变 B. 均数改变,标准差不变 C. 两者均不变 D. 两者均改变 7. 比较身高和体重两组数据变异度大小宜采用(a )。 A. 变异系数 B. 差 C. 极差 D.标准差 8. 以下指标中(d)可用来描述计量资料的离散程度。 A. 算术均数 B. 几何均数 C. 中位数 D.标准差 9. 偏态分布宜用(c)描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 10. 各观察值同乘以一个不等于 0 的常数后,(b)不变。 A.算术均数 B. 标准差 C. 几何均数 D.中位数 11.( a)分布的资料,均数等于中位数。 A. 对称 B. 左偏态 C. 右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A. 正态 B. 近似正态 C. 左偏态 D.右偏态 13. 最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D.四分位数间距 14.( c)小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B. 标准差 C. 标准误 D. 极差 15. 血清学滴度资料最常用来表示其平均水平的指标是(c )。 A. 算术平均数 B. 中位数 C. 几何均数 D. 平均数

研究生医学统计学试题

南昌大学医学院硕士生试卷 试卷编号: 卷 课程名称:医学统计学 适用专业: 科学学位 专业: 班级 姓名: 学号: 学院 系: 考试日期: 考生注意事项: 1、本试卷共 6 页,请查看试卷中是否有缺页或破损。如有立即举手报告 以便更换。 2、考试结束后,考生不得将试卷、答题纸和草稿纸带出考场。 一、最佳选择题 (每题 2 分,共 30 分) 把每题的答案填入下表中: 1、描述一组正态分布资料的集中趋势,以 指标为好。 A. 算术平均数; B. 几何平均数; C. 中位数; D. 变异系数 2、比较成人身高和儿童身高的离散趋势,宜用 。 A. 标准差; B. 变异系数; C. 方差; D. 离均差平方和 3、对于正态分布资料, X +1.96S ,所对应的面积占总面积的 。 A. 95%; B. 99%; C. 47.5%; D. 49.5% 4、下列说法哪个是错误的?中位数适用于描述 资料。 A. 最小组段无下限; B. 最大组段无上限; C. 偏态分布; D. 正态分布 5、 大,表示用该样本均数估计总体均数的可靠性小。 A. S X ; B. S ; C. CV ; D. Q U —Q L 6、某地 1992 年随机抽取 100 名健康女性,算得其血清总蛋白含量的均数为 74g/L ,标 准 差为 4g/L ,则其 95%的可信区间为 。 A. 74±1.96×4; B. 74 ±1.96× 4/10; C. 74±2.58×4; D. 74± 2.58× 4/10 第1 页共6 页

7、 A. 8、 A. C . 9、 A . C . 两样本均数比较的 t 检验,分别取以下检验水准,以 α =0.01; B. α=0.05; 两样本均数比较的 t 检验结果, 两样本均数不等; 两总体均数不等; 完全随机设计的方差分析结果, 各样本均数不等或不全等; 各总体均数不等或不全等; C. α =0.10; P<0.05,可认为 B. 两样本均数相等; D. 两总体均数相等 P ≤ 0.05,可认为 B . D. 10、某地某年肝炎发病人数占总人数 的 5%, A. 年发病率; B. 年患病率; 所取第二类错误最 大。 D. α =0.20 各样本均数都不相等; 各总体均数都不相等 这是该地该年肝炎的 C. 患病构成比; D. 患者平均 数 11、已知甲县人口较乙县年青,今欲比较两县死亡率的高低,适当的比较方法是 A . 将两县的总死亡率直接比较; B . 对年龄进行标准化后,再比较两县总死亡率; C . 将两县的总死亡率进行 t 检验后再比较; D . 将两县的总死亡率进行 χ2 检验后再比较 12、 面哪一点不是 Poisson 分布的性质 A. λ =σ ; B. 当λ ≥20 时,近似正态分布; C. 可加性; D. 相互影响性 13、 χ2 检验中理论 数 T 的计算式为 A. n r (1 n c ) ; A. N ; B. (1 n r ) n c ; C. n r n c N D. n r n c D. N 14、已知两组计量资料方差不齐,可用 检验。 A. t 检验; B. U 检验; C. F 检验; D. 秩和检 验 15、对一组既做相关分析又做回归分析的资料,有 A. b=r ; B. t b =t r ; C. b=a ; D. r=1

医学统计学第六版1-11章

1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料 2、★统计分析包括:统计描述、统计推断,统计推断包括参数估计和假设检验。 ★常见的统计资料的类型有:定量数据(计量资料);定性数据(计数资料);有序数据(等级资料) 3、频数分布的两个重要特征:集中趋势和离散趋势 4、正态分布的两个参数:均数;标准差。 μ=0、δ =1的正态分布即为标准正态分布。 5、当 μ和 δ 未知时,可以利用样本均数x 拔 和标准差S 计算z 6、对服从 的任意随机变量X ,都可经z 变换转化成标准正态分布, 7、正态性判定的方法有两类:一是图示法,二是计算法。 7、★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析 8、描述定性资料的数据特征,通常需要计算相对数。根据不同的研究目的,常用率、构成比、相对比(例数之比;相对危险度RR;比数比OR )等指标来进行统计描述。 9、比较两个不同人群的患病率、发病率、死亡率等资料时,为消除其内部构成(如年龄、性别、工龄、病程长短、病情轻重等)对率的影响,可以使用标准化率。 10、从外形上看,统计表可由标题、标目(包括横标目、纵标目)、线条、数字和备注5部分构成。 11、统计图通常由标题、图域、标目、图例和刻度5个部分组成。 12、统计表的编制原则和结构:重点突出,简单明了;主谓分明,层次清楚;数据表达规范、文字和线条尽量从简。 13、描述定量数据的统计图有直方图、线图、箱式图、误差条图和散点图。 14、描述定性数据的统计图有直条图和构成图(圆图和百分条图)。 15、样本均数标准误的估计值,计算公式为: 16、样本率的标准差也称为率的标准误,用来描述样本率抽样误差的大小。率的标准误越小,则率的抽样误差越小。 17、参数估计包括点估计和区间估计。 18、可信区间估计的效果由可信度1-α和区间的宽度来反映,有可信度计算出来的总体均数μ的概率越接近1越好,区间越窄估计越精确。 19、总体均数的区间估计: (1)δ已知:变量X 服从标准正态分布,95%的z 值在-1.96和1.96之间,则得到95%的可信区间是: (2)δ未知:这时可以用其估计量S 代替,但z 值已不再服从标准正态分布,而是服从著名的t 分布。 计算:小样本情况下,只要原始变量服从正态分布即可用: 大样本(n>=50),无论变量是否服从正态分布 将上式的t..改为z α/2 20、假设检验中,包括原假设H 0 和备择假设H 1 两种假设。 21、假设检验的基本步骤:建立假设和确定检验水准、选择检验方法和计算检验统计量和根据P 值做出统计推断。 22、两样本方差齐性检验:在正态分布情况下,检验统计量F 值按下列公式计算 ν1=n 1-1, ν2= n 2-1 若F > =F α/2(ν1,ν2)则P<=α,拒绝H0,接受H1,可认为两总体方差不齐。 23、采用t ’检验,主要有Satterthwaite 法近似t 检验、Welch 法近似t 检验和Cochran & Cox 法近似t 检验。其中Cochran & Cox 法是对临界值校正 ;而Satterthwaite 法和Welch 法是对自由度进行校正。 24、I 类错误(假阳性错误,α)是指当H 0为真时,假设检验结论拒绝H 0,接受H 1; II 类错误(假阴性错误,β)是指当H 0不成立的时候,假设检验不拒绝H 0. 25、U 检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。 26、多个样本率间多重比较有X 2分割法、可信区间法和Bonferroni 方法,应用这些方法能够保证假设检验中I 型错误的概率α不变。 27、非参数检验方法有多种,如配对比较的Wilcoxon 符号秩和检验、两组比较的Wilcoxon 秩和检验 、多组比较的Kruskal-Wallis 秩和检验等,其中最常用的是Wilcoxon 秩和检验。 28、两个变量之间存在的线性相关关系称为线性相关或简单相关,用于分析双变量正态分布资料。计算公式为 X X z S -=),(2σμN ()z X μσ=-) 96.1 ,96.1(X X X X σσ+-) . .()(2/)(2/X X S t X S t X νανα+,-2122 ()()S F S =较大较小22 XY XX YY l (X X )(Y Y )r l l (X X )(Y Y )∑∑∑--==--

相关文档