文档库 最新最全的文档下载
当前位置:文档库 › 医学统计学-高级统计学课后部分习题答案第四版孙振球主编.docx

医学统计学-高级统计学课后部分习题答案第四版孙振球主编.docx

医学统计学-高级统计学课后部分习题答案第四版孙振球主编.docx
医学统计学-高级统计学课后部分习题答案第四版孙振球主编.docx

文档来源为 :从网络收集整理.word 版本可编辑 .欢迎下载支持.

11-多因素实验资料的方差分析

11-3

(1)本题为 4 个处理组的 2×2析因涉及,因分成 3 天进行,若将每

天的实验结果设为一个区组,先进行随机区组的方差分析 :

方差分析表 1

变异来源df SS MS F Sig.

总变异11818.369

区组间2 3.762 1.881.230.801

处理组间3765.529255.17631.196.000

误差649.0788.180

从上表可以看出,各区组间差异无统计学意义,即各天的实验结果间无差异。

(3)依据完全随机设计析因试验方法进行方差分

析方差齐性检验表

F df1df2Sig.

1.429380.304

P 值大于 0.05,尚不能认为方差不齐。

方差分析表 2

变异来源df SS MS F Sig.

总变异11818.37

试样处理方式( A)1716.11716.11108.420.000试样重量( B)136.4036.40 5.510.047

文档来源为 :从网络收集整理.word 版本可编辑 .欢迎下载支持.

AB113.0213.02 1.970.198

误差852.84 6.605

结局:可以认为高锰酸盐处理及试样重量均会对甘蓝叶核黄素浓度测

定产生影响,尚不能认为高猛酸盐及试样重量的交互作用会对甘蓝叶

核黄素浓度测量有影响。

11-4

假定不存在高阶交互作用,仅对A、B、C、D、E5 个因素的主效应

进行分析,采用正交设计的方差分析法:

正交设计的方差分析

变异来源df SS MS F Sig.

总变异153495.366

A1540.911540.91121.714.001 B11743.6891743.68969.998.000 C1787.223787.22331.602.000 D182.03882.038 3.293.100 E192.40092.400 3.709.083误差10249.10424.910

从上表可以看出, A、B、C 三个因素的主效应有统计学意义(P<0.05),即 A、B、C 三个参数对高频呼吸机的通气量有影响。

11-5

随机区组的裂区设计,一级实验单位的变异来自于 A 因素主效应、区组变异及个体间误差,二级实验单位的变异来自于 B 因素的主效

文档来源为 :从网络收集整理.word 版本可编辑 .欢迎下载支持.

应、 AB 的交互效应以及个体内的误差,见下表。

随机区组裂区设计的方差分析

变异来源df SS MS F Sig.

二级单位总计19146.1375

家兔间(一级单位总计)981.013

注射药物( A )163.01363.01347.557.002

区组412.700 3.175 2.396.209个体间误差4 5.300 1.325

部位间(一级单位总计)1065.125

毒素浓度( B)163.01363.013252.050.000

A * B1.113.113.450.521

个体内误差8 2.0000.25

从上表结果可以看出:无论是低浓度毒素还是高浓度毒素所致的皮肤

损伤,抗毒素注射后的皮肤受损直接均小于对照组,全身注射抗毒素对皮肤损伤有保护作用。

12-重复测量设计资料的方差分析

12-2

数据为重复测量资料,方差分析表如下:

方差分析表

变异来源SS df MS F Sig.

时间主效应4500.00014500.000238.095.000

时间×处理28.800128.800 1.524.252

个体内误差151.200818.900

处理主效应45.000145.000 1.837.212

个体间误差196.000824.500

从上表可以看出 :

文档来源为 :从网络收集整理.word 版本可编辑 .欢迎下载支持.

(1)两种方法治疗前后中度甲亢患者心率测量结果有差别(P<0.05)

(2)不考虑时间,两种方法心率的主效应未见差别(P>0.05)

(3)测量前后与处理不存在交互作用(P>0.05),即两种方法治疗前后

心率的变化幅度相同。

12-5

(1)进行球型检验

within Epsilon b

subjects Mauchly

effcet' W approx.chi-square df Sig.Greenhouse-Geisser Huynh-Feldt lower-bound

t.11927.0285.000.675.847.333 P<0.05,不满足球形检验,需进行校正

(2)重复测量资料方差分析结果

测量时间及其与药物剂型交互作用的方差分析表

source SS df MS F Sig.

t sphericity assumed

38853.34974.972.000

26560.05

Greenhouse-Geisser

2.02613107.07074.972.000

26560.05

Huynh-Feldt

2.5411045

3.5197

4.972.000

26560.05

lower-bound

126560.04674.972.000

26560.05

t * G sphericity assumed

35538.17746.898.000

16614.53

Greenhouse-Geisser

2.0268199.07646.898.000

16614.53

Huynh-Feldt

2.5416539.15846.898.000

16614.53

lower-bound

16614.53116614.53246.898.000

error (t)sphericity assumed

42118.089

4959.76

Greenhouse-Geisser

28.369174.827

4959.76

Huynh-Feldt

35.571139.433

4959.76

lower-bound

14354.268

4959.76

新旧剂型患者血药浓度比较的方差分析表

source SS df MS F Sig.

intercept493771.91493771.870729.972.000 G59.9159.9160.089.770 error9470.014676.425

结论:使用不同剂型患者血药浓度没有差别;使用前后患者血药浓度存在明显差别;不同剂型使用前后血药浓度的变化幅度不同。

15-多元线性回归分析

(1)以低密度脂蛋白中的胆固醇( Y1)为应变量:

方差分析表 1

变异来源平方和df均方F P 回归18530.40844632.6028.0900.00025残差14316.25825572.650

总计32846.66729

回归参数估计及其检验结果 1

变量B Sb b't Sig.

(常量 )-0.82947.773-0.0170.986载脂蛋白 A10.2330.1970.165 1.1810.249

载脂蛋白 B 1.3250.2820.714 4.6990.0001载脂蛋白 E-0.124 2.783-0.008-0.0450.965载脂蛋白 C-2.3850.765-0.494-3.1190.005决定系数: R2=0.564调整的决定系数: R2=0.494

按α =0.05检验水平,回归方程中 X2 和 X4 有统计学意义,即低密度

脂蛋白中的胆固醇与载脂蛋白 B 及 C 之间存在线性关系。以高密度脂

蛋白中的胆固醇( Y2)为应变量:

方差分析表 2

变异来源平方和df均方F P 回归4392.58141098.14522.487<0.0001残差1220.8862548.835

总计5613.46729

回归参数估计及其检验结果2变量B Sb b't Sig.

(常量 )-2.132313.9511-0.15280.87975

载脂蛋白 A10.483310.057640.825478.385460.00000

载脂蛋白 B-0.05270.08235-0.0687-0.64010.52794

载脂蛋白 E-0.29440.81278-0.0457-0.36220.72027

载脂蛋白 C-0.4150.22331-0.2078-1.85830.07494决定系数: R2=0.783 调整的决定系数: R2=0.748

按α =0.05检验水平,回归方程中 X1 有统计学意义,即高密度脂蛋

白中的胆固醇与载脂蛋白 A1 之间存在线性关系。

文档来源为 :从网络收集整理.word 版本可编辑 .欢迎下载支持.

(2)自变量筛选

设定进入、剔除标准分别为α入 =0.05 和α出 =0.10

以低密度脂蛋白中的胆固醇(Y1)为应变量,向前法纳入变量为 X2、X4,向后法纳入变量为 X2、X4,逐步回归法纳入变量为 X2、X4,三者结果无差异;

以高密度脂蛋白中的胆固醇(Y2)为应变量,向前法纳入变量为 X2、X4,向后法纳入变量为 X1、X4,逐步回归法纳入变量为 X1、X4,三者结果无差异;

(3)以 X1-X4 为自变量, Y2/Y1 为应变量,使用逐步回归法分析,

设定进入、剔除标准分别为α入 =0.05 和α出 =0.10,结果如下:

方差分析表 3

变异来源平方和df均方F P 回归0.283352730.0944546.84650.0000

残差0.0524207260.00202

总计0.335773429

回归参数估计及其检验结果3

变量B Sb b't Sig.

(常量 )0.355430.08847 4.017750.0004

载脂蛋白 A10.002640.000360.582887.357160.0000

载脂蛋白 B-0.00360.00048-0.6116-7.50740.0000

载脂蛋白 C0.003330.001230.21586 2.700020.012

决定系数: R2=0.844 调整的决定系数: R2=0.826

文档来源为 :从网络收集整理.word 版本可编辑 .欢迎下载支持.

与前面的分析结果相比,用 Y2/Y1 作为应变量,与单独使用 Y1 或者 Y2 的回归方程决定系数及调整的决定系数更高,说明高、低密度脂蛋白中

的胆固醇含量的比值,较单纯的低密度脂蛋白中胆固醇的含量或者单纯

高密度脂蛋白中胆固醇的含量,对诊断动脉硬化 lemme个更有意义。

(4)残差分析

由标准化残差分析图可以看出,散点分布不是十分均匀,存在先下后

上的趋势,并不满足回归分析的条件,且有一个点超过了 2,属于离群

值。

(5)分析结果

血清低密度脂蛋白中的胆固醇含量与载脂蛋白 B 和 C 有关,与载脂

蛋白 B 成正相关,载脂蛋白 C 成负相关;

高密度脂蛋白与载脂蛋白A1 成正相关,载脂蛋白C 成负相关;与

高、低密度脂蛋白中的胆固醇含量的比值作为综合指标衡量动脉硬

化,得到的结果与载脂蛋白 A1、B 及 C 有关。

16-Logistics回归

二、

(1)各因素赋值说明

因素变量名赋值

性别X1男=0,女 =1

年龄组X27~=1 ,10~=2 ,13~=3,16~=4

胆固醇X3<5.18=0, 5.18=1

文档来源为 :从网络收集整理.word 版本可编辑 .欢迎下载支持.甘油三酯X4<0.50=0, 0.50=1

肥胖症Y有=1,无 =0

将年龄组转化成哑变量

水平X2-1X3-1X4-1

1000

2100

3010

4001

(2)单因素分析

参数估计及假设检验1

变量B S.E,Wals df Sig.Exp (B)性别 X1-.465.182 6.5371.011.628

常量-1.933.113290.5021.000.145年龄组 X2(1) 1.087.28514.5401.000 2.965年龄组 X2(2).585.310 3.5591.059 1.794年龄组 X2(3)-.260.302.7391.390.771常量-2.494.245103.4321.000.083胆固醇 X3.711.21910.5501.001 2.035常量-2.256.100511.1381.000.105甘油三酯 X4.793.18119.1731.000 2.210常量-2.406.116430.0011.000.090从上表可以看出,四个因素对于肥胖的发生都有影响。其中,男性肥

胖发生率低于女性; 第二个年龄段肥胖发生率最高, 而后随着年龄增

加风险降低,说明性别和年龄可能对胆固醇及甘油三酯的作用产生混

杂。

(3)多因素分析

1)模型 1:认为肥胖的发生只与性别和年龄组相关 logit P

=β+βX1+β X2-1+β X3-1+β X4-1

1 2-1 3-1 4-1

参数估计及假设检验

2

变量 B S.E, Wals df Sig. Exp (B) 性别 X1 -0.455 0.185 6.069 1 0.014 0.635 年龄组 X2(1) 1.075 0.286 14.155 1 0.000 2.930 年龄组 X2(2) 0.576 0.311 3.444 1 0.063 1.780 年龄组 X2(3)

-0.269 0.303 0.787 1 0.375 0.764 常量

-2.289

0.257

79.433

1

0.000

0.101

-2logL1= 866.602707

2)模型 2:认为肥胖的发生与性别、年龄组及胆固醇含量相关 logit P

=β+βX1+β X2-1+β X3-1+β X4-1+βX3

1

2-1

3-1

4-1

3

参数估计及假设检验

3

变量 B S.E, Wals df Sig. Exp (B) 性别 X1 -0.451 0.185 5.964 1 0.015 0.637 年龄组 X2(1) 1.034 0.297 12.084 1 0.001 2.811 年龄组 X2(2)

0.556 0.313 3.154 1 0.076 1.744

年龄组 X2(3)

-0.266

0.303

0.774

1

0.379

0.766

胆固醇 X3

0.123 0.240 0.262 1 0.609 1.131 常量

-2.295

0.257

79.638

1

0.000

0.101

-2logL1=866.343194

对 X3 的回归系数进行假设检验, P >0.05,说明 X3 没有纳入模型的必要。

3)模型 3:认为肥胖的发生与性别、年龄组、胆固醇及甘油三酯含

量相关

logit P =β+βX1+β X2-1+ 01 2-1

β X3-1+ 3-1

β X4-1+ 4-1

βX4

4

参数估计及假设检验

3

变量 B S.E, Wals df Sig. Exp (B) 性别 X1 -0.500 0.186 7.190 1 0.007 0.607 年龄组 X2(1) 0.927 0.290 10.235 1 0.001 2.528 年龄组 X2(2) 0.454 0.314 2.088 1 0.148 1.574 年龄组 X2(3) -0.335 0.305 1.208 1 0.272 0.716 甘油三酯 X4

0.703 0.187 14.081 1 0.000 2.020 常量

-2.416

0.261

85.727

1

0.000

0.089

-2logL1=852.959317

引入 X4 后,对其回归系数进行检验,

P <0.05,说明扣除性别与年龄

影响后,甘油三酯与肥胖仍存在明显关系。

对模型 1、2、3 的似然值进行比较,模型 3<模型 1,说明模型 3 优于

模型 1,使用模型 3 拟合效果更好。

20-判别分析

20-1

Bayes判别

(1)先验概率: p=1/3

(2)判别函数计算

Bayes线性判别函数系数估计值1

判别函数

变量Y1Y2Y3

X1.028.156.086

X2 2.285 3.745 4.400

X3.756 2.301.390

X4 2.901-.011 1.063

X5 2.126 1.674-.160

X6.055.137.112

X7.078-.134.042

(常量 )-4.920-12.776-7.763 Y1=0.028X1+2.285X2+0.756X3+2.901X4+2.126X5+0.055X6+0.078X7-4.920 Y2=0.156X1+3.745X2+2.301X3-0.011X4+1.674X5+0.137X6-0.134X7-12.776 Y3=0.086X1+4.400X2+0.390X3+1.063X4-0.160X5+0.112X6+0.042X7-7.763

(3)判别效果评价:回顾性估计误判概率8/63=12.70%

回顾性判别效果评价

判别分类

原分类合计

123

文档来源为 :从网络收集整理.word版本可编辑 .欢迎下载支持 .

1290332

2110213

3111618

合计31112163

逐步判别

(1)确定变量筛选α、 :给定α=0.05, =0.1;

(2)筛选变量

第一步: X1 入选, F=28.028;

第二步: X5 入选, F=17.519;

第三步: X6 入选, F=15.307;

第四步: X7 入选, F=13.211;

(3)先验概率取等概率,建立Bayes判别函数

Bayes线性判别函数系数估计值2

判别函数

变量Y1Y2Y3

X10.0120.1190.058

X5 3.020 1.9220.792

X60.0490.1270.105

X70.111-0.0520.109

(常量 )-3.631-9.784-5.749 Y1=0.012X1+3.020X5+0.049X6+0.111X7-3.631

Y2=0.119X1+1.922X5+0.127X6-0.052X7-9.784

文档来源为 :从网络收集整理.word 版本可编辑 .欢迎下载支持.

Y3=0.058X1+0.792X5+0.105X6+0.109X7-5.749

(4)判别效果评价回顾性估计误判概率为 12/63=19.05%

判别分类

合计原分类

123

1270532

2110213

3221418

合计30122163 21-聚类分析

21-1

1使用系统聚类法(最大相似系数法)对变量进行聚类

图 21-1

根据系统分类图(图 21-1),若分为三类,则 X6、X12、X3、X1、X10、

X7、X5、X2、X8、X11 为一类, X4 为一类, X9 为一类。

2使用系统聚类法(类平均法)对样品进行聚类

图 21-2

根据系统分类图(图21-2),若分为三类,则13、16、 15、29、14、

23、24、21、22、12、28、10、17、11、20 为一类, 1、6 为一类, 8、

9、2、3、7、4、5 为一类。

3使用动态聚类法对样品进行聚类

根据 SPSS结果,分成以下三类。

类别样品编号

11、6、9

210、11、12、 13、14、 15、16、 17、28、 29、20、21、22、23、24

32、3、4、5、7、8

21-3

1使用系统聚类法(类平均法)对指标进行聚类

图 21-3

根据系统分类图(图21-3),若分为三类,则可食率、果形指数、风

味、色泽、 TA 为一类,维生素 C 含量、硬度、 TSS、固酸比为一类,单果重为一类。

2使用系统聚类法(最大相似系数法)对指标进行聚类

图 21-4

根据系统分类图(图21-4),若分为三类,则 4 为一类, 54 为一类,其余为一类。

22-主成分分析与因子分析

22-1主成分分析

利用 SPSS进行主成分分析,得到如下结果(表22-1至表 22-)

表 22-1 简单统计量

Cpp icp map sbp dbp 均值0.0517-0.02730.0050-0.00600.0773标准差0.15950.23660.21820.12300.1746

表 22-2 相关矩阵的特征值

成份初始特征值贡献率累积贡献率

1 3.16963.38563.385

2.99519.9078

3.292

3.50110.01193.303

4.325 6.49299.796

5.010.204100.000

表 22-3 相关矩阵的特征向量

Z1Z2Z3Z4Z5 Cpp.950-.239-.170-.074.077

icp.248.966-.072.017.018

map.771.029.635.042.000

sbp.878-.064-.209.425-.033

dbp.917.023-.138-.370-.053

图 22-1 碎石图

1.1 主成分个数的选择从表22-2虽然只有第一个特征值大于1,但结合累积贡献率和碎石图,取前三个主成分为宜。

1.2 主成分表达式由表22-3根据各主成分所对应的特征向量,可得出前三个主成分为

Z1=0.950CPP+0.248ICP+0.771MAP+0.878SBP+0.917DBP

Z2=-0.239CPP+0.966ICP+0.029MAP-0.064SBP+0.023DBP

Z3=-0.170CPP-0.072ICP+0.635MAP-0.209SBP-0.138DBP

1.3 因子载荷阵

表 22-4 因子载荷矩阵

文档来源为 :从网络收集整理.word 版本可编辑 .欢迎下载支持.

Z1Z2Z3Z4Z5

Cpp 1.691-.425-.302-.132.137

icp.247.964-.072.017.018

map.545.021.450.029.000

sbp.500-.036-.119.242-.019

dbp.093.002-.014-.037-.005由因子载荷阵可知,第一主成分Z1 与 Cpp、map 和 sbp 关系较为密

切,第二主成分Z2 与 Cpp、icp 关系较为密切,第三主成分与Cpp、map 关系较为密切, dbp 与三个主成分关系均一般。

22-2 因子分析

约相关矩阵的特征值、因子载荷阵与表22-2、22-3相同。

由表 22-2虽然只有第一个特征值大于1,但其贡献率不足70%,故考虑提取前 3 个公因子。

表 22-5 因子载荷阵

因子 1因子 2因子 3

Cpp0.950-0.239-0.170

icp0.2480.966-0.072

map0.7710.0290.635

sbp0.878-0.064-0.209

dbp0.9170.023-0.138

表 22-6 主成分因子分析后的公共度

Cpp icp map sbp dbp

文档来源为 :从网络收集整理.word 版本可编辑 .欢迎下载支持.

0.9890.9990.9980.8180.861

竖读表22-5发现因子 1 在多数原始指标上都有较大的载荷,因子2

在icp上有较大的载荷,因子 3 在map 上有较大的载荷;

由表22-6 可知,各共性方差均超过80%,说明 3 个公因子已经能够

较好反应各指标包括的大部分信息。

27-常用综合评价方法

二、

1、TOPSIS法评价某医院 5 年的医疗质量

(1)原始数据

年度X1X2X3X4X5X6X7 199********.77.3 1.0178.397.52 199********.37.40.891.1982 199********.87.30.6291.197.3 3.2 199********.5 6.90.690.297.7 2.9 199********.3 6.90.2595.597.9 3.6(2)评价指标同趋势化

X1-X7 中,X1、X2、X3、X5、X6 为高优指标, X4、X7 为低优指标,

估取其倒数,将所有指标同趋势化,数据如下:

年度X1X2X3X4X5X6X7 199********.70.1370.99078.397.50.500 199********.30.135 1.25091.198.00.500 199********.80.137 1.61391.197.30.313

199********.50.145 1.66790.297.70.345 199********.30.145 4.00095.597.90.278(3)归一化处理

进行归一化处理后得到如下矩阵 :

年度X1X2X3X4X5X6X7 19940.4230.4080.4380.2020.3920.4460.561 19950.4780.4590.4320.2560.4560.4490.561 19960.4320.4350.4380.3300.4560.4450.351 19970.4140.4500.4630.3410.4510.4470.387 19980.4830.4810.4630.8180.4780.4480.312(4)确定有限方案中的最优方案及最劣方案

最优方案 A-= (0.483,0.481,0.463,0.818,0.478,0.449,0.561)

最劣方案 A+= (0.414,0.408,0.432,0.202,0.392,0.445,0.312)(5)计算评价对象各指标值与最优方案及最劣方案的距离D i+与 D i-,

见下表

(6)计算与最优方法的接近程度 C i,见下表

(7)按 C i大小将评价对象排序,见下表

年度D i+ D i-C i排序结果

19940.2500.6290.2843

19950.2750.5640.3282

19960.1510.5370.2205

19970.1760.5140.2554

19980.6300.2490.7161

根据排序结果可以看出,该医院 1998年医疗质量最高, 1996年最差。

2、使用秩和比法( RSR)对不同职业生殖结局进行综合评价

(1)对原始数据进行编秩:见下表

高优指标由小到大,低优指标由大到小,同一指标数值相同者编平均秩。 X1-X4 均为低优指标,故由大到小编秩。

(2)计算秩和比,并由大到小进行排序,见下表。

职业X1R1X2R2X3R3X4R4RSR排序

112.0249.02617.79436.1170.663

2 2.64811.44412.32736.9060.781

3 2.8478.52717.05564.3320.663

413.1629.87516.45633.4480.663

57.48612.47321.20337.1350.534

613.73133.79148.57189.1610.136

77.51512.88221.46254.0830.385

812.183 2.718 6.77837.2440.722

(3)确定 RSR分布

RSR?∑?R Probit

0.125111112.5 3.85

0.375122225 4.33

0.531133337.5 4.67

0.656364,5,6562.5 5.32

医学统计学试题及答案

医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体与样本:总体就是根据研究目的确定的同质观察单位的全体。样 本就是从总体中随机抽取的部分观察单位。 (3) 参数与统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量与总体参数的差别称为抽样误 差。 (5) 概率:就是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 就是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1、 平均数 就是描述数据分布集中趋势(中心位置)与平均水平的指标 2、 标准差 就是描述数据分布离散程度(或变量变化的变异程度)的指标 3、 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4、 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4、 σ± σ96.1± σ58.2± 68、27% 95% 99% 5、 47、5% 6、均数、标准差 7、 全距、方差、标准差、变异系数

医学统计学题库

1 医学统计学题库 一、最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __。 A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __。 A.变异系数 B. 几何均数 C. 中位数 D. 均数 3. 下述_ ___种资料为计数资料。 A. 血红蛋白( g/L ) B. 红细胞计数( 31012 /L ) C. 抗体滴度 D. 血型 4. 表示事物内部各个组成部分所占比重的相对数是___ ____。 A. 相对比 B. 率 C. 构成比 D. 率的标准误 5. 说明样本均数抽样误差大小的指标是___ _____。 A. 变异系数 B. 标准差 C. 标准误 D. 全距 6. 正态分布曲线下中间面积为99% 的变量值范围为___ _____。 A. μσ±196 . B. μσ±258. C. μσ±1 D. μσ±125. 7. 8名新生儿的身长(cm )依次为:50, 53, 58, 54, 55, 52, 54, 52。 中位数M 为__ __。 A. 53.5 B. 54.5 C. 54 D. 53 8. 表示两个变量之间的直线相关关系的密切程度和方向的统计指标是_ _。 A. 变异系数 B. 相关系数 C. 均数 D. 回归系数 9. 某市1955年和2015年的三种死因别死亡率,若用统计图表示宜 选用____ _______。 A. 直条图 B. 直方图 C. 百分直条图 D. 统计地图 10. 下述___ ____为第一类错误的定义。 A.拒绝了实际上是不成立的H 0 B.接受了实际上是不成立的H 0 C.拒绝了实际上是成立的H 0

医学统计学课后答案.

第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance ,CV )亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio ),又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百 分之几,它是对比的最简单形式。其计算公式为 比=A /B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: ) 比例基数(单位总数 可能发生某现象的观察单位数 实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

2017年人民大学统计学生物医学统计学考研参考书

2017年人民大学统计学生物医学统计学考研参考书 统计学:生物医学统计学 风险管理与精算学: 《概率论》,李贤平,高等教育出版社 《数理统计基础》,陆璇,清华大学出版社 《概率论与数理统计》,茆诗松、周纪芗,中国统计出版社 《应用回归分析》,何晓群等编,中国人民大学出版社 《统计学》,贾俊平等编,中国人民大学出版社 概率论与数理统计: 《数学分析》上、下册复旦大学数学系陈传璋、金福临等编高等教育出版社《高等代数》北京大学出版社 《概率论》李贤平高等教育出版社 《数理统计基础》陆璇清华大学出版社 《概率论与数理统计》茆诗松、周纪芗中国统计出版社 流行病与卫生统计学: 《流行病学》詹思延人民卫生出版社 《卫生统计学》方积乾、徐勇勇、陈峰编人民卫生出版社 (专业学位)应用统计: 《统计学》第四版贾俊平中国人民大学出版社配套习题 《应用回归分析》何晓群等编中国人民大学出版社 《多元回归分析》何晓群等编中国人民大学出版社 《抽样技术》金勇进等编中国人民大学出版社 《时间序列分析》易丹辉中国人民大学出版社 《概率论与数理统计》第三版刘次华高等教育出版社配套习题 2017年新祥旭考研全程复习计划

一、英语全程规划 基础阶段(3月-6月) 1.学习目标:完成至少1轮的单词背诵,巩固语法基础 2.阶段重点:英语单词、语法 3.复习建议: (1)英语每天抽空背背单词,建议时长0.5-1h;不管是用单词软件还是传统词书,不管是用词根词缀还是死记硬背,最重要的是每天都背。积累到某一天时,你会发现好多文章都看得懂了。 (2)英语基础不牢的童鞋,应该花点时间复习语法。语法知识能帮助你在读文章和翻译时更加流畅、对文章意思把握得更准确。 (3)多看看新闻,关注时事热点。近年来的英语作文和阅读都是涉及到热点话题的。 (4)不建议大家在这个阶段做习题集。 强化阶段(7月-10月) 1.学习目标:熟读并详细分析近10年真题 2.阶段重点:真题真题真题,重点是阅读 3.复习建议: (1)单词记忆每天进行,不间断。 (2)定时做真题阅读,做完后详细分析。 ①利用早上整段的时间做真题(作文可以不写),不要查单词,完全自己做,然后对答案,之后看一下答案分析。 ②每天分析2-3篇,分析包括:第一遍分析正确选项,第二遍分析错误选项的设置,第三遍在原位中找对应的句子,是每个选项对应的句子哟,分析为什么这样出题,第四遍,了解文章的背景,作者的情感。 ③此阶段不建议专门建立单词笔记本,重要的单词在分析时顺便查一下就好。 ④时间比较充足的童鞋可以全文翻译阅读原文。 (3)完成阅读后,用同样的方法完型、翻译和新题型。完型和新题型这两类题型不用全文

医学统计学课后答案解析

第二章 1?答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表 示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓开口”资料, 是指数据的一端或者两端有不确定值。 百分位数(percentile)是一种位置指标,以P X表示,一个百分位数P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。 即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2?答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1?不灵敏;2?不稳定。 四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q= Q u —Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反 映资料的离散程度。 方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance , CV)亦称离散系数(coefficient of dispersion ), 为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3?答:常用的相对数指标有:比,构成比和率。 比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百 分之几,它是对比的最简单形式。其计算公式为比二A/B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分 率(%。)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: 率.= 实际发生某现象的观察单位数迸比例基数(K) 可能发生某现象的观察单位总数 构成比(proportion)又称构成指标,它说明一种事物内部各组成部分所占的比重或

医学统计学试题及答案

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学(第六版马斌荣)课后答案 很全面

医学统计学(第六版) 课后答案 第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2 第三章正态分布与医学参考值范围 一、单项选择题 答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A 二、计算与分析 1 2[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。又因血铅含量仅过大为异常,故应计算只有上限的单侧范围,即95P 。

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指 标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为×109/L ~×109/L ,其含义是 E. 该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是检验要求大样本资料

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

医学统计学第三版第四章课后习题答案

2. ANOVA 实验结果 Sum of Squares df Mean Square F Sig. Between Groups 43.194 3 14.398 13.697 .000 Within Groups 37.842 36 1.051 Total 81.036 39 Multiple Comparisons Dependent Variable: 实验结果 Dunnett t (2-sided)a (I) 分组(J) 分组Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound 0.5 对照组-2.15000*.45851 .000 -3.2743 -1.0257 1.0 对照组- 2.27000*.45851 .000 - 3.3943 -1.1457 1.5 对照组-2.66000*.45851 .000 -3.7843 -1.5357 F=13.697 P=0.000004 P A=0.000113 P B=0.000051 P C=0.000004均小于0.001 根据完全随机资料的方差分析,按α=0.05水准,拒绝H0,接受H1,认为四组治疗组小白鼠的肿瘤重量总体均数不全相等,即不同剂量药物注射液的抑癌作用有差别。 3. Tests of Between-Subjects Effects Dependent Variable: 重量 Source Type III Sum of Squares df Mean Square F Sig. Hypothesis 99736.333 1 99736.333 58.489 .005 Error 5115.667 3 1705.222a 治疗 Hypothesis 6503.167 2 3251.583 44.867 .000 Error 434.833 6 72.472b 分组 Hypothesis 5115.667 3 1705.222 23.529 .001 Error 434.833 6 72.472b F:44.867 23.529 P:0.000246 0.001020<0.01 根据随机区组资料的方差分析,按α=0.05水准,拒绝H0,接受H1,三组注射不同剂量雌激素的大白鼠子宫重量总体均数不全相等,即注射不同剂量的雌激素对大白鼠子宫重量有影响 5.

医学统计学第二版高等教育出版社课后习题答案剖析

第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就

医学统计学试题及答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

医学统计学试题及其答案

l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2

医学统计学课后习题答案

医学统计学课后习题答案 Revised by Jack on December 14,2020

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝 大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%

相关文档
相关文档 最新文档