当前位置：文档库 › 医学统计学分析计算题_与解析

医学统计学分析计算题_与解析

第二单元计量资料的统计推断

分析计算题

2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表4：

表4 某年某地健康成年人的红细胞数和血红蛋白含量

指标性别例数均数标准差标准值* 红细胞数/1012

·L -1

男 360 4.66 0.58 4.84

女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2

女

255

117.6

10.2

124.7

请就上表资料：

(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？ (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别？

(5) 该地男、女两项血液指标是否均低于上表的标准值（若测定方法相同）？ 2.1解：

(1) 红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV )比较二者的变异程度。

女性红细胞数的变异系数0.29

100%100% 6.94%4.18

S CV X =

?=?= 女性血红蛋白含量的变异系数10.2

100%100%8.67%117.6

S CV X =?=?=

由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示，由表4计算各项指标的标准误。

男性红细胞数的标准误0.031

X S =

==(1210/L ) 男性血红蛋白含量的标准误0.374

X S =

==(g/L )

女性红细胞数的标准误0.018X S =

==(1210/L )

女性血红蛋白含量的标准误0.639X S =

==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100，可视为大样本。σ未知，但n 足够大，故总体均数的区间估计按

(/2/2X X X u S X u S αα-+

, )计算。该地男性红细胞数总体均数的95%可信区间为：

(4.66－1.96×0.031 , 4.66＋1.96×0.031)，即(4.60 , 4.72)1210/L 。该地女性红细胞数总体均数的95%可信区间为：

(4.18－1.96×0.018 , 4.18＋1.96×0.018)，即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较，用u 检验。 1) 建立检验假设，确定检验水准

H 0：12μμ=，即该地健康成年男、女血红蛋白含量均数无差别 H 1：12μμ≠，即该地健康成年男、女血红蛋白含量均数有差别

0.05α=

2) 计算检验统计量

22.829X X u ===

3) 确定P 值，作出统计推断

查t 界值表(ν＝∞时)得P <0.001，按0.05α=水准，拒绝H 0，接受H 1，差别有统计学意义，可以认为该地健康成年男、女的血红蛋白含量均数不同，男性高于女性。

(5) 样本均数与已知总体均数的比较，因样本含量较大，均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设，确定检验水准

H 0：0μμ=，即该地男性红细胞数的均数等于标准值

H 1：0μμ<，即该地男性红细胞数的均数低于标准值单侧0.05α= ② 计算检验统计量

0 4.66 4.84

5.8060.031

X X t S μ--=

==- ③ 确定P 值，作出统计推断

查t 界值表(ν＝∞时)得P <0.0005，按0.05α=水准，拒绝H 0，接受H 1，差别有统计学意义，可以认为该地男性红细胞数的均数低于标准值。

2) 男性血红蛋白含量与标准值的比较 ① 建立检验假设，确定检验水准

H 0：0μμ=，即该地男性血红蛋白含量的均数等于标准值 H 1：0μμ<，即该地男性血红蛋白含量的均数低于标准值单侧0.05α= ② 计算检验统计量

0134.5140.2

15.2410.374

X X t S μ--=

==- ③ 确定P 值，作出统计推断

查t 界值表(ν＝∞时)得P <0.0005，按0.05α=水准，拒绝H 0，接受H 1，差别有统计学意义，可以认为该地男性血红蛋白含量的均数低于标准值。

3) 女性红细胞数与标准值的比较 ① 建立检验假设，确定检验水准

H 0：0μμ=，即该地女性红细胞数的均数等于标准值 H 1：0μμ<，即该地女性红细胞数的均数低于标准值单侧0.05α= ② 计算检验统计量

0 4.18 4.33

8.3330.018

X X t S μ--=

==-

③ 确定P 值，作出统计推断

查t 界值表(ν＝∞时)得P <0.0005，按0.05α=水准，拒绝H 0，接受H 1，差别有统计学意义，可以认为该地女性红细胞数的均数低于标准值。

4) 女性血红蛋白含量与标准值的比较 ① 建立检验假设，确定检验水准

H 0：0μμ=，即该地女性血红蛋白含量的均数等于标准值 H 1：0μμ<，即该地女性血红蛋白含量的均数低于标准值单侧0.05α= ② 计算检验统计量

0117.6124.7

11.1110.639

X X t S μ--=

==- ③ 确定P 值，作出统计推断

查t 界值表(ν＝∞时)得P <0.0005，按0.05α=水准，拒绝H 0，接受H 1，差别有统计学意义，可以认为该地女性血红蛋白含量的均数低于标准值。

2.2 为了解某高寒地区小学生血红蛋白含量的平均水平，某人于1993年6月随机抽取了该地小学生708名，算得其血红蛋白均数为10

3.5g/L ，标准差为1.59g/L 。试求该地小学生血红蛋白均数的95%可信区间。

2.2解：

σ未知，n 足够大时，总体均数的区间估计可用(/2/2X X X u S X u S αα-+ , )。该地小学生血红蛋白含量均数的95％可信区间为：

(103.5 1.96103.5 1.96-+, )，即(103.38 , 103.62)g/L 。

2.3 一药厂为了解其生产的某药物（同一批次）之有效成分含量是否符合国家规定的标准，随机抽取了该药10片，得其样本均数为10

3.0mg ，标准差为

2.22mg 。试估计该批药剂有效成分的平均含量。

2.3解：该批药剂有效成分的平均含量的点值估计为10

3.0 mg 。

σ未知且n 很小时，总体均数的区间估计可用()/2,/2,X X X t S X t S αναν-+ , 估

计。查t 界值表得t 0.05/2,9=2.262，该批药剂有效成分的平均含量的95％可信区间为：(103.0 2.262103.0 2.262

-+, ，即(101.41 , 104.59)mg 。

2.4 152例麻疹患儿病后血清抗体滴度倒数的分布如表5，试作总体几何均数的点值估计和95%区间估计。

表5 152例麻疹患儿病后血清抗体滴度倒数的分布

滴度倒数 1 2 4 8 16 32 64 128 256 512 1024 合计人数

152

2.4解：将原始数据取常用对数后记为X ，则

152 1.85970.44250.0359X n X S S ====，，，，用(/2/2X X X u S X u S αα-+，)

估计，则滴度倒数对数值的总体均数的95％可信区间为：

(1.8597 1.960.0359 1.8597 1.960.0359-?+? , )，即(1.7893 , 1.9301)。

所以滴度倒数的总体几何均数的点估计值为： 1.8597101072.39X ==，滴度倒

数的总体几何均数的95%区间估计为( 1.7893 1.93011010

, )，即(61.56 , 85.13)。 SPSS 操作数据录入：

打开SPSS Data Editor 窗口，点击Variable View 标签，定义要输入的变量x 和f ；再点击Data View 标签，录入数据（见图2.4.1，图2.4.2）。

图2..4.1 Variable View窗口内定义要输入的变量x和f

图2.4.2 Data View窗口内录入数据

分析：

Transform Compute…

Target Variable：键入 logx

Numeric Expression： LG10(x) 将原始数据取对数值OK

Data Weight Cases…

Weight cases by Frequency Variable： f 权重为f

Analyze Descriptive Statistics Explore… 探索性分析Dependent list：logx 分析变量logx Display： Statistics

S tatistics…：Descriptives 统计描述

注：最后得到结果是原始数据对数值的均数及其95%可信区间。

2.5 某口腔医生欲比较“个别取模器龈下取模技术”与“传统硅橡胶取模方法”两种取模技术精度的差异，在12名病人口中分别用两种方法制取印模，在体视显微镜下测量标志点到龈沟底的距离，结果如表6，问两种取模方法结果有无差异？

表6 12个病人口腔某测量标志点到龈沟底的距离/cm

病例号个别取模器龈下取模技术传统硅橡胶取模方法

1 0.626 0.614

2 0.627 0.626

3 0.670 0.654

4 0.548 0.549

5 0.590 0.574

6 0.603 0.587

7 0.605 0.602

8 0.347 0.338

9 0.768 0.759

10 0.576 0.572

11 0.330 0.318

12 0.233 0.219

2.5解：本题为配对设计的两样本均数的比较，采用配对t检验。

表2.5.1 12个病人口腔某测量标志点到龈沟底的距离/cm

(1) 建立检验假设，确定检验水准

H 0：0d μ=，即两种取模方法结果无差异 H 1：0d μ≠，即两种取模方法结果有差异

0.05α=

(2) 计算检验统计量

两种取模方法结果的差值d 的计算见表2.5.1。

120.00930.00610.0018d d n d S S ====，，， 00.0093

5.1670.0018

d d t S -=

== 112111n ν=-=-=

(3) 确定P 值，作出统计推断

查t 界值表得P <0.001，按0.05α=水准，拒绝H 0，接受H 1，差别有统计学意义，可以认为两种取模方法结果有差异，个别取模器龈下取模法标志点到龈沟底

的距离略高于传统硅胶取模法。

病例号个别取模器龈下取模1d 传统硅橡胶取模法2d

12d d d =-

1 0.626 0.614 0.01

2 2 0.627 0.626 0.001

3 0.670 0.65

4 0.016 4 0.548 0.549 -0.001

5 0.590 0.574 0.01

6 6 0.603 0.58

7 0.016 7 0.605 0.602 0.003

8 0.347 0.338 0.00

9 9 0.768 0.759 0.009 10 0.576 0.572 0.004 11 0.330 0.318 0.012 12

0.233

0.219

0.014

SPSS操作

数据录入：

打开SPSS Data Editor窗口，点击Variable View标签，定义要输入的变量x1和x2；再点击Data View标签，录入数据（见图2.5.1，图2.5.2）。

图2.5.1 Variable View窗口内定义要输入的变量x1和x2

图2.5.2 Data View窗口内录入12对数据

分析：

Analyze Compare Means Paired-samples T Test…配对设计均数比较t检验

Paired Variables： x1 x2 配对变量为x1和x2 OK

2.6 将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验，测得稀释倍数如表7，问两组的平均效价有无差别？

表7 钩端螺旋体病患者血清作凝溶试验测得的稀释倍数

标准株(11人) 100 200 400 400 400 400 800 1600 1600 1600 3200 水生株(9人) 100

100

200

400

2.6解：本题为成组设计的两小样本几何均数的比较，采用成组t 检验。

将原始数据取常用对数值后分别记为1X 、2X ，

则11122211 2.79360.45209 2.26760.2353n X S n X S ======，，；

，， (1) 建立检验假设，确定检验水准

H 0：两种株别稀释倍数的总体几何均数的对数值相等 H 1：两种株别稀释倍数的总体几何均数的对数值不等

0.05α=

(2) 计算检验统计量

3.149

X X t =

122119218n n ν=+-=+-=

(3) 确定P 值，作出统计推断

查t 界值表得0.005

SPSS 操作数据录入：

打开SPSS Data Editor窗口，点击Variable View标签，定义要输入的变量g 和x；再点击Data View标签，录入数据（见图2.6.1，图2.6.2）。

图2.6.1 Variable View窗口内定义要输入的变量g和x

图2.6.2 Data View窗口内录入数据

分析：

Transform Compute…

Target Variable：键入 logx

Numeric Expression： LG10(x) 将原始数据取对数值OK

Analyze Compare Means Independent-Samples T Test… 成组设计t检验Test Variable[s]： logx 分析变量logx Grouping Variable：g 分组变量g

Define Groups…

Use Specified Values Group1：键入1 定义比较的两组 Group2：键入2

Continue

2.7 某医生为了评价某安眠药的疗效，随机选取20名失眠患者，将其随机分成两组，每组10人。分别给予安眠药和安慰剂，观察睡眠时间长度结果如表8，请评价该药的催眠作用是否与安慰剂不同。

表8 患者服药前后的睡眠时间/h

安眠药组

安慰剂组受试者治疗前治疗后受试者治疗前治疗后 1 3.5 4.7 1 4.0 5.4 2 3.3 4.4 2 3.5 4.7 3 3.2 4.0 3 3.2 5.2 4 4.5 5.2 4 3.2 4.8 5 4.3 5.0 5 3.3 4.6 6 3.2 4.3 6 3.4 4.9 7 4.2 5.1 7 2.7 3.8 8 5.0 6.5 8 4.8 6.1 9 4.3 4.0 9 4.5 5.9 10

3.6

4.7

3.8

4.9

2.7解：本题采用成组t 检验比较两小样本差值的均数，以治疗后与治疗前的睡眠时间的差值为变量进行统计分析。

安眠药组：111100.880.4826d n d S ===，，安慰剂组：22210 1.390.2685d n d S ===，，

两样本标准差相差不大，可认为两总体方差齐，略去方差齐性检验。 (1) 建立检验假设，确定检验水准

H 0：1

d d μμ=，即安眠药的催眠作用与安慰剂相同

H 1：1

d d μμ≠，即安眠药的催眠作用与安慰剂不同

α＝0.05 (2) 计算检验统计量

(

)()12

2212121222

11112 2.9203

0.4826(101)0.2685(101)11101021010d d d d t S n S n n n n n -=

-+-??+ ?

+-??

=-?-+?-??

+ ?

+-??

1221010218n n ν=+-=+-=

(3) 确定P 值，作出统计推断

查t 界值表得0.005< P < 0.01，按0.05α=水准，拒绝H 0，接受H 1，差别有统计学意义，可以认为安眠药的催眠作用与安慰剂不同，安慰剂的催眠效果好于安眠药。

SPSS 操作数据录入：

打开SPSS Data Editor 窗口，点击Variable View 标签，定义要输入的变量g 、x1和x2；再点击Data View 标签，录入数据（见图2.7.1，图2.7.2）。

图2.7.1 Variable View 窗口内定义要输入的变量g 、x1和x2

图2.7.2 Data View窗口内录入数据

分析：

Transform Compute…

Target Variable：键入 d

Numeric Expression：键入 x2-x1 计算x2与x1的差值OK

Analyze Compare Means Independent-Samples T Test…成组设计t检验

Test Variable[s]： d 分析变量d Grouping Variable： g 分组变量g

Define Groups…

Use Specified Values Group1：键入1 定义比较的两组

Group2：键入2

Continue

2.8 某医师用依降钙素治疗绝经后妇女骨质疏松症，收集30例绝经后骨质疏松症妇女，随机分成两组，一组服用依降钙素+乳酸钙，另一组只服用乳酸钙，24周后观察两组患者腰椎L

骨密度的改善率，结果如表9，请问依降钙素治疗

2－4

绝经后妇女骨质疏松是否有效？

表9 各组患者L2－4骨密度的改善率/%

依降钙素+乳酸钙

乳酸钙 -0.20 -0.83 0.21 0.26 1.86 0.47 1.97 1.07 9.20 1.18 3.56 1.26 2.80 1.69 3.29 1.75 3.30 2.31 3.47 2.65 3.60 2.78 4.30 6.02 4.39 3.36 8.42 2.10 6.02

3.14

2.8解：本题采用成组t 检验比较两小样本均数。

依降钙素+乳酸钙组： 11115 3.7460 2.5871n X S ===，，乳酸钙组： 22215 1.9473 1.6041n X S ===，，

两样本标准差相差不大，可认为两总体方差齐，略去方差齐性检验。 (1) 建立检验假设，确定检验水准

H 0：12μμ=，即依降钙素治疗绝经后妇女骨质疏松无效 H 1：12μμ>，即依降钙素治疗绝经后妇女骨质疏松有效单侧α＝0.05 (2) 计算检验统计量

()

()()()12

22112212122

11112 2.2885

2.5871151 1.604115111151521515X X t S n S n n n n n =

-+-??

+ ?

+-??

==-+-??

+ ?

+-??

1221515228n n ν=+-=+-=

(3) 确定P 值，作出统计推断

查t 界值表得0.01< P <0.025，按0.05α=水准，拒绝H 0，接受H 1，差别有统计学意义，可以认为依降钙素治疗绝经后妇女骨质疏松有效。

SPSS 操作数据录入：

打开SPSS Data Editor 窗口，点击Variable View 标签，定义要输入的变量g 和x ；再点击Data View 标签，录入数据（见图2.8.1，图2.8.2）。

图2.8.1 Variable View 窗口内定义要输入的变量g 和x

图2.8.2 Data View窗口内录入数据

分析：

Analyze Compare Means Independent-Samples T Tes t…

Test Variable[s]： x

Grouping Variable： g

Define Groups…

Use Specified Values Group1：键入1

Group2：键入2

Continue

2.9 为比较大学生中男女血清谷胱甘肽过氧化物酶(GSH-PX)的活力是否不同，某人于1996年在某大学中随机抽取了18～22岁男生48名，女生46名，测得其血清谷胱甘肽过氧化物酶含量（活力单位）如表10。问男女性的GSH-PX的活力是否不同？

X±)

表10 男女大学生的血清谷胱甘肽过氧化物酶(S

性别n S

X±

男48 96.53±7.66

女46 93.73±14.97

2.9解：本题为成组设计的两小样本均数比较

(1) 方差齐性检验

1) 建立检验假设，确定检验水准

H 0：2212σσ=，即男、女性GSH-PX 活力的总体方差齐 H 1：2212σσ≠，即男、女性GSH-PX 活力的总体方差不齐 α＝0.10 2) 计算检验统计量

22/14.97/7.66 3.819F S S =小大==

11146145n ν=-=-= ， 22148147n ν=-=-=

3) 确定P 值，作出统计推断

查方差齐性检验用F 界值表得P <0.10，按0.10α=水准，拒绝H 0，接受H 1，差别有统计学意义，可以认为两总体方差不齐。故应用't 检验。

(2) 成组设计两小样本均数的't 检验 1) 建立检验假设，确定检验水准

H 0：12μμ=，即男、女性GSH-PX 活力相同 H 1：12μμ≠，即男、女性GSH-PX 活力不同 α＝0.05 2) 计算检验统计量

' 1.134X X t =

()

1212

2212222124422222222121212127.6614.97484666.41667.6614.9711484648146111

X X X X S S S S n n S S S S n n n n n n ν????++ ? ?+????====≈????????+ ? ? ? ?--????????

++---- 3) 确定P 值，作出统计推断

查t 界值表得0.20< P <0.40，按0.05α=水准，不拒绝H 0，差别无统计学

意义，尚不能认为男、女性GSH-PX 活力不同。

2.10 某研究者欲比较甲、乙两药治疗高血压的效果，进行了随机双盲对照试验，结果如表11，请问能否认为两种降压药物等效？

表11 两药降血压/kPa 的效果比较 n

甲药 50 2.67 0.27 乙药

3.20

0.33

2.10解：本题采用两样本均数的等效检验（等效界值0.67?= kPa ）

。 (1) 建立检验假设，确定检验水准

H 0： |21μμ-| ≥ 0.67 kPa ，即两种降压药不等效 H 1： |21μμ-| < 0.67 kPa ，即两种降压药等效单侧α＝0.05 (2) 计算检验统计量

12||

2.322

X X X X X X t S ?---=

1225050298n n ν=+-=+-=

(3) 确定P 值，作出统计推断

查t 界值表得0.01< P <0.025，按0.05α=水准，拒绝H 0，接受H 1，差别有统计学意义，可以认为甲乙两种药物的降压效果等效。

2.11 在探讨硫酸氧钒降糖作用的实验中，测得3组动物每日进食量如表12，

请问3组动物每日进食量是否不同？

表12 3组动物每日进食量/(mg·g-1·d-1)

正常加钒组糖尿病加钒组糖尿病组

24.84 26.46 46.89

27.60 24.19 47.21

30.97 28.70 42.42

24.61 23.70 47.70

24.82 24.48 40.74

24.64 24.19 41.03

29.72 28.01 44.98

27.42 23.70 43.46

23.64 26.10 44.34

30.06 24.62 44.32 2.11解：本题采用完全随机设计的方差分析。

表2.11.1 3组动物每日进食量/(mg·g-1·d-1)

正常加钒组糖尿病加钒组糖尿病组合计

24.84 26.46 46.89

27.60 24.19 47.21

30.97 28.70 42.42

24.61 23.70 47.70

24.82 24.48 40.74

24.64 24.19 41.03

29.72 28.01 44.98

27.42 23.70 43.46

23.64 26.10 44.34

30.06 24.62 44.32

n10 10 10 30

X26.832 25.415 44.309 32.185 i

医学统计学简答题

医学统计学简答题 1.简述标准差、标准误的区别与联系？区别：（1）含义不同：标准差S表示观察值的变异程度,描述个体变量值（x）之间的变异度大小,S越大,变量值（x）越分散；反之变量值越集中,均数的代表性越强。标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大；反之,样本均数越接近总体均数,抽样误差越小。（2）与n的关系不同： n增大时,S趋于σ（恒定）,标准误减少并趋于0（不存在抽样误差）。（3）用途不同：标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。联系：二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。 2.简述假设检验的基本步骤。 1.建立假设,确定检验水准。 2.选择适当的假设检验方法,计算相应的检验统计量。 3.确定P值,下结论 3.正态分布的特点和应用：? 特点：?1、集中性：正态曲线的高峰位于正中央,即均数所在的位置；? 2、对称性：正态分布曲线位于直角坐标系上方，以x=u为中心,左右对称,曲线两端永远不与横轴相交； 3、均匀变动性：正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降；?

4、正态分布有两个参数,即均数μ和标准差σ,可记作N（μ,σ）：均数μ决定正态曲线的中心位置；标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭；σ越大,曲线越扁平； ?5、u变换：为了便于描述和应用,常将正态变量作数据转换；?? 应用：?1.估计医学参考值范围?2.质量控制?3.正态分布是许多统计方法的理论基础 4.简述参考值范围与均数的可信区间的区别和联系可信区间与参考值范围的意义、计算公式和用途均不同。 ?1.从意义来看?95％参考值范围是指同质总体内包括95％个体值的估计范围,而总体均数95％可信区间是指?95％可信度估计的总体均数的所在范围? 2.从计算公式看?若指标服从正态分布,95％参考值范围的公式是：±1.96s。?总体均数95％可信区间的公式是：??前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。 5.频数表的用途和基本步骤。用途：（1）揭示资料的分布特征和分布类型；（2）便于进一步计算指标和分析处理；（3）便于发现某些特大或特小可疑值。基本步骤：（1）求出极差；（2）确定组段，一般设8~15个组段；（3）确定组距；组距=R/组段数，但一般取一方便计算的数字；（4）列出各个组段并确定每一组段频数。 6.非参数统计检验的适用条件。（1）资料不符合参数统计法的应用条件（总体为正态分布、且方差相等）或总体分布类型未知；（2）等级资料；（3）分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件；（4）在资料满足参数检验的要求时，应首选参数法，以免降低检验效能 7.线性回归的主要用途。

医学统计学案例分析 (1)

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学案例分析(1) 案例分析四格表确切概率法【例 1-5】为比较中西药治疗急性心肌梗塞的疗效，某医师将 27 例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表 1-4。经检验，得连续性校正 2 =3.134，P＞0.05，差异无统计学意义，故认为中西药治疗急性心肌梗塞的疗效基本相同。表 1-4 两种药物治疗急性心肌梗塞的疗效比较药物中药西药合计有效 12（9.33） 6（8.67）无效 2（4.67） 7（4.33）合计 14 13 27 有效率（％） 85.7 46.2 66.7 18 9 【问题 1-5】（1）这是什么资料？（2）该资料属于何种设计方案？（3）该医师统计方法是否正确？为什么？【分析】 (1) 该资料是按中西药的治疗结果（有效、无效）分类的计数资料。 (2) 27 例患者随机分配到中药组和西药组，属于完全随机设计方案。 (3) 患者总例数 n=27＜40，该医师用 2 检验是不正确的。当 n＜40 或 T＜1时，不宜计算 2 值，需采用四格表确切概率法（exact probabilities in 22 table）直接计算概率案例分析－卡方检验（一）【例 1-1】某医师为比较中药和西药治疗胃炎的疗效，随机抽取 140 例胃炎患者分成中药组和西药组，结果中药组治疗 80 例，有效 64 例，西药组治疗 60例，有效 35 例。 1 / 5

医学统计学分析计算题_与解析

第二单元计量资料的统计推断分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表4：表4 某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值* 红细胞数/1012 ·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料： (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？ (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别？ (5) 该地男、女两项血液指标是否均低于上表的标准值（若测定方法相同）？ 2.1解： (1) 红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV )比较二者的变异程度。女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示，由表4计算各项指标的标准误。男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100，可视为大样本。σ未知，但n 足够大，故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。该地男性红细胞数总体均数的95%可信区间为： (4.66－1.96×0.031 , 4.66＋1.96×0.031)，即(4.60 , 4.72)1210/L 。该地女性红细胞数总体均数的95%可信区间为： (4.18－1.96×0.018 , 4.18＋1.96×0.018)，即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较，用u 检验。 1) 建立检验假设，确定检验水准 H 0：12μμ=，即该地健康成年男、女血红蛋白含量均数无差别 H 1：12μμ≠，即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值，作出统计推断查t 界值表(ν＝∞时)得P <0.001，按0.05α=水准，拒绝H 0，接受H 1，差别有统计学意义，可以认为该地健康成年男、女的血红蛋白含量均数不同，男性高于女性。 (5) 样本均数与已知总体均数的比较，因样本含量较大，均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设，确定检验水准 H 0：0μμ=，即该地男性红细胞数的均数等于标准值

医学统计学考试重点整理

一、基本概念 1.总体与样本总体：所有同质观察单位某种观察值（即变量值）的全体样本：是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查普查：就是全面调查，即调查目标总体中全部观察对象抽样调查：是一种非全面调查，即从总体中抽取一定数量的观察单位组成样本，对样本进行调查 3.参数与统计量参数：总体的某些数值特征统计量：根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误（ɑ错误）: H0为真时却被拒绝，弃真错误 Ⅱ型错误（β错误）: H0为假时却被接受，取伪错误 5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组，使每个研究对象都有同等机会被分配到各组中去，以平衡两组中已知和未知的混杂因素，从而提高两组的可比性，避免造成偏倚。（意义:①是提高组间均衡性的重要设计方法；②避免有意扩大或缩小组间差别导致的偏倚；③各种统计学方法均建立在随机化基础上）安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物，是一种无药理作用的制剂，不含试验药物的有效成分，但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样，不能被受试对象和研究者所识别。（安慰剂对照主要用于临床试验，其目的在于控制研究者和受试对象的心理因素导致的偏倚，并提高依从性。安慰剂对照还可以控制疾病自然进程的影响，显示试验药物的效应） 6.误差与标准误（区分率与均数）㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。标准误：是指样本均数的标准差，反映抽样误差大小的定量指标，其公式表示为S x =S/√n ㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π（1-π）/n

医学统计学试题与答案

医学统计学试题及答案习题《医学统计学》第二版（五年制临床医学等本科生用）（一）单项选择题 1．观察单位为研究中的( d )。 A．样本 B. 全部对象 C．影响因素 D. 个体 2．总体是由（ c ）。 A．个体组成 B. 研究对象组成 C．同质个体组成 D. 研究指标组成 3．抽样的目的是（b ）。 A．研究样本统计量 B. 由样本统计量推断总体参数 C．研究典型案例研究误差 D. 研究总体统计量 4．参数是指（b ）。 A．参与个体数 B. 总体的统计指标 C．样本的统计指标 D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（ a ）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A.均数不变，标准差改变 B.均数改变，标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用（ a ）。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中（d）可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用（c）描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后，（b）不变。 A．算术均数 B.标准差 C.几何均数 D.中位数 11.（ a ）分布的资料，均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种（ c ）分布。

医学统计学分析计算题-答案

第二单元计量资料的统计推断分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表4：表4 某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料： (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？ (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别？ (5) 该地男、女两项血液指标是否均低于上表的标准值（若测定方法相同）？ 2.1解： (1) 红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV )比较二者的变异程度。女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示，由表4计算各项指标的标准误。男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

医学统计学案例分析(1)

案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞的疗效，某医师将27例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表1-4。经检验，得连续性校正χ2=3.134，P＞0.05，差异无统计学意义，故认为中西药治疗急性心肌梗塞的疗效基本相同。表1-4 两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率（％）中药12（9.33）2（4.67）1485.7 西药 6（8.67）7（4.33）1346.2 合计1892766.7【问题1-5】（1）这是什么资料？（2）该资料属于何种设计方案？（3）该医师统计方法是否正确？为什么？【分析】 (1) 该资料是按中西药的治疗结果（有效、无效）分类的计数资料。 (2) 27例患者随机分配到中药组和西药组，属于完全随机设计方案。 (3) 患者总例数n=27＜40，该医师用χ2检验是不正确的。当n＜40或T＜1时，不宜计算χ2值，需采用四格表确切概率法（exact probabilities in 2×2 table）直接计算概率案例分析－卡方检验（一）【例1-1】某医师为比较中药和西药治疗胃炎的疗效，随机抽取140例胃炎患者分成中药组和西药组，结果中药组治疗80例，有效64例，西药组治疗60例，有效35例。该医师采用成组t检验（有效=1，无效=0）进行假设检验，结果t＝2.848，P＝0.005，差异有统计学意义检验（有效=1，无效=0）进行进行假设检验，结果t＝2.848，P＝0.005，差异有统计学意义，故认为中西药治疗胃炎的疗效有差别，中药疗效高于西药。

【问题1-1】（1）这是什么资料？（2）该资料属于何种设计方案？（3）该医师统计方法是否正确？为什么？（4）该资料应该用何种统计方法？【分析】(1) 该资料是按中西药疗效（有效、无效）分类的二分类资料，即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组，属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别，适用于正态或近似正态分布的计量资料，不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别，应用四格表资料的 X2检验（chi-square test）。【例1-2】 2003年某医院用中药和西药治疗非典病人40人，结果见表1-1。表1-1 中药和西药治疗非典病人有效率的比较药物有效无效合计有效率（％）中药西药14（11.2） 2 （4.8） 14（16.8） 10 （7.2） 28 12 50.0 16.7 步骤如下： 1．建立检验假设，确定检验水准 H 0：两药的有效率相等，即π 1 ＝π 2 H 1：两药的有效率不等，即π 1 ≠π 2 2．计算检验统计量值 (1) 计算理论频数根据公式计算理论频数，填入表7-2的括号内。 (2) 计算χ2值具体计算略。

医学统计学分析计算题_答案与解析

WORD 文档下载可编辑第二单元计量资料的统计推断分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表4：表4 某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值* 红细胞数/1012·L -1男360 4.66 0.58 4.84 女255 4.18 0.29 4.33 血红蛋白/g·L -1男360 134.5 7.1 140.2 女255 117.6 10.2 124.7 请就上表资料： (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？ (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别？ (5) 该地男、女两项血液指标是否均低于上表的标准值（若测定方法相同）？ 2.1 解： (1) 红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV )比较二者的变异程度。女性红细胞数的变异系数CV S 100% X S 0.29 4.18 100% 6.94% 10.2 女性血红蛋白含量的变异系数CV 100% 100% 8.67% X 117.6

由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误S X 来表示，由表 4 计算各项指标的标准误。男性红细胞数的标准误S X S 0.58 0.031 ( 1012 /L ) n 360 S 男性血红蛋白含量的标准误S X n 7.1 360 0.374 (g/L ) 女性红细胞数的标准误S X S 0.29 0.018 ( 1012 /L) n 255 女性血红蛋白含量的标准误S X S 10.2 0.639 (g/L ) n 255 (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100 ，可视为大样本。未知，但n 足够大，故总体均数的区间估计按( X u / 2S X, X u / 2 S X)计算。该地男性红细胞数总体均数的95% 可信区间为： (4.66 －1.96 ×0.031 , 4.66 ＋1.96 ×0.031) ，即(4.60 , 4.72) 1012 /L。该地女性红细胞数总体均数的95% 可信区间为： (4.18 －1.96 ×0.018 , 4.18 ＋1.96 ×0.018) ，即(4.14 , 4.22) 1012 /L。 (4) 两成组大样本均数的比较，用u 检验。 1) 建立检验假设，确定检验水准 H0： 1 2 ，即该地健康成年男、女血红蛋白含量均数无差别 H1： 1 2 ，即该地健康成年男、女血红蛋白含量均数有差别 0.05 2) 计算检验统计量

医学统计学分析题

五、分析应用题（4题，共40分） 1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下: 某病西医治疗及中西医结合治疗疗效比较疗法例数治愈数治愈率(%) 西医治疗 70 50 74.29 中西医治疗 60 22 36.67 X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。你认为如何？请说出理由（6分） 1、答：结论不可信（2分）；因为在设计分组上不科学，两组间不具有可比性（4分）。 2、24名志愿者完全随机地分成两组，接受降胆固醇试验。甲组为特殊饮食组，乙组为药物处理组，受试者在试验前后各测量一次血清胆固醇（mmol/L），数据如下表，甲组乙组受试者试验前试验后受试者试验前试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.8 3 2 6.40 6.35 3 6.48 6.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7 9.17 8.42 7 9.10 9.05 8 7.33 7.00 8 7.31 6.83 9 6.94 6.58 9 6.96 6.91 10 7.67 7.22 10 6.81 6.73 11 8.15 6.57 11 8.16 7.65 12 6.60 6.17 12 6.98 6.52 （1）欲分析两种治疗方法是否有效，采用何种统计分析方法？（6分）（2）欲判断两种降血清胆固醇措施效果是否相当，又采用何种统计分析方法？（6分） 2、答：（1）欲分析两种治疗方法是否有效，可用治疗前后比较，属配对设计（2分），应用配对t检验（3分）。（2）如判断两种方法的效果有无差别，则属成组设计（2分），应用两样本均数比较的t检验（3分）。 3、检验血磷含量有甲、乙两种方法，其中，乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品，所得结果如下表。样本号 1 2 3 4 5 6 7 乙法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 问：⑴若要判断能否用乙法推算甲法，又用何统计方法？（6分） ⑵欲比较甲乙两法检出血磷是否相同，用何统计方法？（6分） 3、答：（1）根据题意，应用回归分析（6分）（2）这是配对设计计量资料（2分），应用配对t检验（4分） 4、某单位对常住本市5年以上，从未接触过铅作业，也未服过含铅药物或其它重金属，饮用自来水，无肝、肾疾患及贫血，近日未使用利尿剂的健康成年，用乙酸乙酰法测24小时尿δ-ALA的结果如下，欲制定其95％正常值范围。请问：用何种估计方法？说出理由并给出计算公式。（10分） δ-ALA 0.5- 1.0- 1.5- 2.0- 2.5- 3.0- 3.5- 4.0 -4.5- 5.0-5.5 合计

医学统计学案例分析

案例分析—四格表确切概率法【例１-5】为比较中西药治疗急性心肌梗塞的疗效，某医师将2７例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表1-4。经检验,得连续性校正χ２＝3.134，P＞0．05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。表1－4 两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率（%)中药1２（9.3３)2(4.67）1485.7 西药６（８．6７）7(4．3３）13４6．2 合计1892７6６．７【问题1-5】 (1）这是什么资料？（2）该资料属于何种设计方案？ (3) 该医师统计方法是否正确？为什么？【分析】 (1) 该资料是按中西药的治疗结果(有效、无效）分类的计数资料。 (2) ２7例患者随机分配到中药组和西药组，属于完全随机设计方案。(３) 患者总例数n=27<40,该医师用χ２检验是不正确的。当n＜40或Ｔ＜１时，不宜计算χ2值，需采用四格表确切概率法(exａct pｒoｂaｂｉｌiｔies in 2×2 taｂlｅ)直接计算概率案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取1４0例胃炎患者分成中药组和西药组，结果中药组治疗8０例,有效64例,西药组治疗60例，有效3５例。该医师采用成组t检验(有效=１，无效=0）进行假设检验，结果t=2．8４8,P=0.0０5,差异有统计学意义检验(有效=１，无效=０)进行进行假设检验，结果t＝２.8４８,P＝０.005，差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1）这是什么资料？(2）该资料属于何种设计方案？ (３)该医师统计方法是否正确？为什么？(4）该资料应该用何种统计方法? 【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料，即计数资料。（2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。（３) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料，不能用于计数资料的比较。（4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的检验(ｃｈｉ-sｑuare test）。【例1-２】 20０３年某医院用中药和西药治疗非典病人４0人，结果见表1-1。表1－1 中药和西药治疗非典病人有效率的比较药物有效无效合计有效率（%）中药西药14(11.2） 2 (4.８) １４(1６.8） 1０(7.2） 28 １2 ５0．0 １６.7 步骤如下: 1.建立检验假设,确定检验水准 H 0：两药的有效率相等，即π 1 ＝π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2．计算检验统计量值（1) 计算理论频数根据公式计算理论频数，填入表7-2的括号内。 (2) 计算χ2值

医学统计学分析计算题答案

第二单元计量资料的统计推断分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表4：表4 某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值* 红细胞数/1012·L-1男360 4.66 0.58 4.84 女255 4.18 0.29 4.33 血红蛋白/g·L-1男360 134.5 7.1 140.2 女255 117.6 10.2 124.7 请就上表资料： (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？ (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别？ (5) 该地男、女两项血液指标是否均低于上表的标准值（若测定方法相同）？ 2.1解： (1) 红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV)比较二者的变异程度。女性红细胞数的变异系数女性血红蛋白含量的变异系数由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误来表示，由表4计算各项指标的标准误。男性红细胞数的标准误(/L) 男性血红蛋白含量的标准误(g/L)

女性红细胞数的标准误(/L) 女性血红蛋白含量的标准误(g/L) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100，可视为大样本。未知，但足够大，故总体均数的区间估计按()计算。该地男性红细胞数总体均数的95%可信区间为： (4.66－1.96×0.031 , 4.66＋1.96×0.031)，即(4.60 , 4.72)/L。该地女性红细胞数总体均数的95%可信区间为： (4.18－1.96×0.018 , 4.18＋1.96×0.018)，即(4.14 , 4.22)/L。 (4) 两成组大样本均数的比较，用u检验。 1) 建立检验假设，确定检验水准 H0：，即该地健康成年男、女血红蛋白含量均数无差别 H1：，即该地健康成年男、女血红蛋白含量均数有差别 2) 计算检验统计量 3) 确定P值，作出统计推断查t界值表(ν＝∞时)得P<0.001，按水准，拒绝H0，接受H1，差别有统计学意义，可以认为该地健康成年男、女的血红蛋白含量均数不同，男性高于女性。 (5) 样本均数与已知总体均数的比较，因样本含量较大，均作近似u检验。 1) 男性红细胞数与标准值的比较 ①建立检验假设，确定检验水准 H0：，即该地男性红细胞数的均数等于标准值

医学统计学案例分析报告.doc

医学统计学案例分析评述医学期刊论著：《口岸出入境人员预防接种统计分析》【题目】口岸出入境人员预防接种统计分析【研究目标】对口岸出入境人员的预防接种情况进行统计分析，为各种跨国传染性疾病的预防提供参考数据。【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位，其基本资料如下：男3678 人，女3021 人；年龄在3-79 岁之间，平均年龄45.6 岁。经免疫前检查和询问，研究对象均无严重的疾病，且无接种疫苗过敏史及禁忌症。【资料类型】本资料是计数资料。（1）原文：研究对象：选择我处2010 年1 月-2011 年4 月，2011 年5 月-2012 年5月两个时间段6870 位出入境人员，将其按公务人员、船员、劳务人员、留学人员、旅游探亲及商务等进行分组。（2）问题：①文献中未明确“我处”的具体含义，没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的，即是普查，还是抽样调查？如果是抽样调查，未明确抽样的方法，是如何应用随机抽样的方法选择这6870 位研究对象的？【统计方法】（1）本论著未明确使用了何种统计学方法，我们组认为：首先应对资料进行正态性检验和方差齐性检验，若满足正态、方差齐，选择χ2检验，否则应选用秩和检验。一篇论文结论的正确与否，需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理，就无法知道检验结果是否出错，也就无法对结论进行准确判断。（2）文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”，注明所采用的统计软件，但方法中未注明统计推断方法，没有明确

医学统计学分析基本思路指南

医学统计学分析基本思路指南医学统计学的学习一定要以理解为主。对于初学者，不必强记一大堆的公式，也不要死钻牛角尖，非要弄明白为什么这种方法叫“t检验”、“F检验”，为什么这个残差叫做“学生化残差”等等。这些都是历史遗留问题，感兴趣的读者可以查阅统计学史。对于只想应用的人来讲，你只要了解在什么情况下应该用什么方法，什么指标应该用于什么情形。尽管多数统计教材都说了数据分析应该先做假设检验，然后选定统计量，然后怎么怎么。但实际中我们拿到一堆数据的时候，不会坐在桌上先列出零假设和备择假设，也不会满座子地计算统计量。更实际的分析思路是: （1）先确定研究目的，根据研究目的选择方法。不同研究目的采用的统计方法不同，常见的研究目的主要有三类：一是差异性研究，即比较组间均数、率等的差异，可用的方法有t 检验、方差分析、χ2检验、非参数检验等。二是相关性分析，即分析两个或多个变量之间的关系，可用的方法有相关分析。三是影响性分析，即分析某一结局发生的影响因素，可用的方法有线性回归、logistic回归、Cox回归等。（2）明确数据类型，根据数据类型进一步确定方法。不同数据类型采用的统计方法也不同。定量资料可用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。分类资料可用的方法有χ2检验、对数线性模型、logistic回归等。图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。（3）选定统计方法后，需要利用统计软件具体实现统计分析过程。SAS中，不同的统计方法对应不同的命令，只要方法选定，便可通过对应的命令辅之以相应的选项实现统计结果的输出。（4）统计结果的输出并非数据分析的完成。一般统计软件都会输出很多结果，需要从中选择自己需要的部分，并做出统计学结论。但统计学结论不同于专业结论，最终还需要结合实际做出合理专业结论。下面是本人简单总结的常用方法的选择，可供读者参考。如有引用本图者，请注明引自《医学案例统计分析与SAS应用》一书，谢谢。

医学统计学案例分析

医学统计学案例分析案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞de疗效，某医师将27例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表1-4。经检2验，得连续性校正χP,0.05，差异无统计学意义，故认为中西药治=3.134，疗急性心肌梗塞de疗效基本相同。表1-4 两种药物治疗急性心肌梗塞de疗效比较药物有效无效合计有效率(,) 中药 12(9.33) 2(4.67) 14 85.7 西药 6(8.67) 7(4.33) 13 46.2 合计 18 9 27 66.7 【问题1-5】 (1) 这是什么资料, (2) 该资料属于何种设计方案, (3) 该医师统计方法是否正确,为什么, 【分析】 (1) 该资料是按中西药de治疗结果(有效、无效)分类de计数资料。 (2) 27例患者随机分配到中药组和西药组，属于完全随机设计方案。 2(3) 患者总例数n=27,40，该医师用χ检验是不正确de。当n,40或T,1时， 2不宜计算χ值，需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率案例分析,卡方检验(一)

【例1-1】某医师为比较中药和西药治疗胃炎de疗效，随机抽取140例胃炎患者分成中药组和西药组，结果中药组治疗80例，有效64例，西药组治疗60例，有效35例。该医师采用成组t检验(有效=1，无效=0)进行假设检验，结检验(有效=1，无效=0)进行进行果t,2.848，P,0.005，差异有统计学意义假设检验，结果t,2.848，P,0.005，差异有统计学意义，故认为中西药治疗胃炎de疗效有差别，中药疗效高于西药。【问题1-1】 (1)这是什么资料,(2)该资料属于何种设计方案, (3)该医师统计方法是否正确,为什么,(4)该资料应该用何种统计方法, 【分析】 (1) 该资料是按中西药疗效(有效、无效)分类de二分类资料，即计数资料。 (2) 随机抽取140例胃炎患者分成西药组和中药组，属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别，适用于正态或近似正态分布de计量资料，不能用于计数资料de比较。 (4) 该资料de目de是通过比较两样本率来推断它们分别代表de两个总体率有无差别，应用四格表资料de 检验(chi-square test)。【例1-2】 2003年某医院用中药和西药治疗非典病人40人，结果见表1-1。表1-1 中药和西药治疗非典病人有效率de比较药物有效无效合计有效率(,) 中药 (11.2) (16.8) 28 50.0 1414 西药 2 (4.8) 10 (7.2) 12 16.7 合计 16 24 40 40.0 某医师认为这是完全随机设计de2组二分类资料，可用四格表de检验。其步骤如下: 1(建立检验假设，确定检验水准

医学统计学案例分析

医学统计学案例分析评述医学期刊论着：《口岸出入境人员预防接种统计分析》【题目】口岸出入境人员预防接种统计分析【研究目标】对口岸出入境人员的预防接种情况进行统计分析，为各种跨国传染性疾病的预防提供参考数据。【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位，其基本资料如下：男3678 人，女3021 人；年龄在3-79 岁之间，平均年龄岁。经免疫前检查和询问，研究对象均无严重的疾病，且无接种疫苗过敏史及禁忌症。【资料类型】本资料是计数资料。（1）原文：研究对象：选择我处2010 年1 月-2011 年4 月，2011 年5 月-2012 年5月两个时间段6870 位出入境人员，将其按公务人员、船员、劳务人员、留学人员、旅游探亲及商务等进行分组。（2）问题：①文献中未明确“我处”的具体含义，没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的，即是普查，还是抽样调查如果是抽样调查，未明确抽样的方法，是如何应用随机抽样的方法选择这6870 位研究对象的【统计方法】（1）本论着未明确使用了何种统计学方法，我们组认为：首先应对资料进行正态性检验和方差齐性检验，若满足正态、方差齐，选择χ2检验，否则应选用秩和检验。一篇论文结论的正确与否，需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理，就无法知道检验结果是否出错，也就无法对结论进行准确判断。

（2）文献尽管在“统计学处理”中提及了“使用软件进行统计学分析”，注明所采用的统计软件，但方法中未注明统计推断方法，没有明确采用了那种统计方法，即是卡方检验还是秩和检验等。（3）在没有提及统计方法的前提下，全文也没有表示统计结果，即具体的计算值和相对应的P值，只有P<，表述不完整。正确的统计分析方法、具体的统计量值和Ｐ值是最终准确推断结论的重要依据，三者缺一不可。所以，具体的Ｐ值和统计量应在论文表格或文字描述中说明。（4）统计符号书写不规范：检验水准表述有误，原文“检验水平取P=”，应改为“检验水准ɑ=”。【结果表达】（1）在“不同时间段接种人数比较”中： ①原文：研究将研究对象按照2010 年1 月-2011 年4 月，2011 年5月-2012 年 5 月分为两个时间段进行研究，第一个时间段接种人数为460 6 人，第二时间段接种人数为2264 人。第二时间段较第一时间段接种人数明显减少，且具有显着差异性（P＜）。 ②错误：结果表述有误：“第二时间段较第一时间段接种人数明显减少，且具有显着差异性”。2个时间段研究对象数量不同，通过统计分析不能得出 “人数明显较少”的结论，应表述为：按ɑ=水准，差别有统计学意义，可以认为2个时间段接种人数不同。（2）在“结果和”的结论中： ①错误：均未明确具体的统计值及相对应的P值，“具有显着性差异”应改为“差别有统计学意义”。（3）统计表表示不正确: ①统计表为三线表，在有“合计”一项时，应加一条分隔线。

医学统计学公式总结

一资料的描述性统计（一）算术均数(mean) （1）简单算术平均值定义公式为（直接法）：（2）利用频数表计算均数（加权法）：（二）方差（即标准差的平方）（三）变异系数二参数估计与参考值范围（一）均数的标准误（二）样本率的标准误（p 为样本率）（三）T 分布（u 为总体均数）（四）总体均数的区间估计（一般要求计算95%或99%的可信区间）（五)总体率的区间估计（六)参考值范围估计双侧1-a 参考值范围： s u x a 2/± 单侧1-a 参考值范围： s u x a ->或s u x a +< （可信区间计算是用标准误，参考值范围计算用标准差，百分位数法大家自己看书）三 T 检验与方差分析（一）T 检验（1）单样本T 检验 n x n x x x x x n ∑= ++++= 321∑∑= ++++++++=f fx f f f f x f x f x f x f x k k k 3213322111 )(2 2--= ∑n x x s 22 2()/1 x x n s n -= -∑∑%100?= x s CV n s s x = n p p s p ) 1(-=n s x t μ-=x x s t x s t x ναναμ,2/,2/+<<-p p s u p s u p 2/2/ααπ+<<-

检验假设：（假设样本来自均数为0 u 的正态总体）统计量t 值的计算：（2）配对T 检验检验假设：统计量t 值的计算：（d 为两组数据的差值，Sd 为差值的标准差）（3）两样本T 检验检验假设：统计量t 值的计算：其中两样本方差齐性检验（即为两样本方差的比值）（二）单因素方差分析 SS MS F SS MS νν= = B B B W W W （1）完全随机设计资料的方差分析这里（T 即为该组数据之和）（2）随机单位组设计资料的方差分析 SS 总=SS 处理+SS 区组+SS 误差 V 总=V 处理+V 区组+V 误差 μμ=：H 1 ,/0 0-=-=-= n n s x s x t x νμμ0210==-μ μμ：H d d t s μ-== 1 -=n ν210μμ=：H 2 1)()(2121x x s x x t ----=μμ2 21-+=n n ν ? ??? ??+=-2121121n n s s C x x 2)()(112222112-+∑-∑+-=n n x x x x s C 2221s s F =111-=n ν1 2 2-=n ν组内组间总SS SS SS +=组内组间总ννν+=2()/C x N =∑ij j T x = ∑

医学统计学案例分析

医学统计学案例分析集团文件发布号：（9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

②文献中未提及“6870 位出入境人员”是如何产生的，即是普查，还是抽样调查？如果是抽样调查，未明确抽样的方法，是如何应用随机抽样的方法选择这6870 位研究对象的？【统计方法】（1）本论着未明确使用了何种统计学方法，我们组认为：首先应对资料进行正态性检验和方差齐性检验，若满足正态、方差齐，选择χ2检验，否则应选用秩和检验。一篇论文结论的正确与否，需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理，就无法知道检验结果是否出错，也就无法对结论进行准确判断。（2）文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”，注明所采用的统计软件，但方法中未注明统计推断方法，没有明确采用了那种统计方法，即是卡方检验还是秩和检验等。