文档库 最新最全的文档下载
当前位置:文档库 › 卫生统计学 赵耐青习题答案

卫生统计学 赵耐青习题答案

卫生统计学 赵耐青习题答案
卫生统计学 赵耐青习题答案

习题答案

第一章

一、就是非题

1、家庭中子女数就是离散型得定量变量。

答:对。

2、同质个体之间得变异称为个体变异。

答:对。

3、学校对某个课程进行1 次考试,可以理解为对学生掌握该课程知识得一次随机抽样。答:对。

4、某医生用某个新药治疗了100 名牛皮癣患者,其中55 个人有效,则该药得有效率为55%。

答:错。只能说该样本有效率为55%或称用此药总体有效率得样本估计值为55%。

5、已知在某个人群中,糖尿病得患病率为8%,则可以认为在该人群中,随机抽一个对象, 其患糖尿病得概率为8%。

答:对,人群得患病率称为总体患病率。在该人群中随机抽取一个对象,每个对象均有相

同得机会被抽中,抽到就是糖尿病患者得概率为8%。

二、选择题

1、下列属于连续型变量得就是A 。

A 血压

B 职业

C 性别

D 民族

2、某高校欲了解大学新生心理健康状况,随机选取了1000 例大学新生调查,这1000 例大学生新生调查问卷就是A 。

A 一份随机样本

B 研究总体

C 目标总体

D 个体

3、某研究用X 表示儿童在一年中患感冒得次数,共收集了1000 人,请问:儿童在一年中患感冒次数得资料属于C 。

A 连续型资料

B 有序分类资料

C 不具有分类得离散型资料

D 以上均不对

4、下列描述中,不正确得就是D 。

A 总体中得个体具有同质性

B 总体中得个体大同小异

C 总体中得个体在同质得基础上有变异

D 如果个体间有变异那它们肯定不就是来自同一总体

5.用某个降糖药物对糖尿病患者进行治疗,根据某个大规模随机抽样调查得研究结果得

到该药得降糖有效率为85%得结论,请问降糖有效率就是指D 。

A 每治疗100 个糖尿病患者,正好有85 个人降糖有效,15 个人降糖无效

B 每个接受该药物治疗得糖尿病患者,降糖有效得机会为85%

C 接受该药物治疗得糖尿病人群中,降糖有效得比例为85%

D 根据该研究得入选标准所规定得糖尿病患者人群中,估计该药降糖有效得比例为

85%

三、简答题

1、某医生收治200 名患者,随机分成2 组,每组100 人。一组用A 药,另一组用B 药。经过2 个月得治疗,A 药组治愈了90 人,B 组治愈了85 名患者,请根据现有结果评议

下列说法就是否正确,为什么?

a)A 药组得疗效高于B 药组。

b)A 药得疗效高于B 药。

答:a)正确,因为就两组样本而言,得确A 组疗效高于B 组。

b) 不正确,因为样本得结果存在抽样误差,因此有可能人群得A 药疗效高于B 药,也

可能人群得两药得疗效相同甚至人群B 药得疗效高于A 药,

2、某校同一年级得A 班与B 班用同一试卷进行一次数学测验。经过盲态改卷后,公布成绩:A 班得平均成绩为80 分,B 班得平均成绩为81 分,请评议下列说法就是否正确,为

什么?

a)可以称A 班得这次考试得平均成绩低于B 班,不存在抽样误差。

b)可以称A 班得数学平均水平低于B 班。

答:a) 正确,因为此处将A 班与B 班作为研究总体,故不存在抽样误差。

b)不正确,因为这一次数学平均成绩只就是两班数学成绩总体中得两个样本,样本得差异

可能仅仅由抽样误差造成。

3、在某个治疗儿童哮喘得激素喷雾剂新药得临床试验中,研究者收集了300 名哮喘儿童患者,随机分为试验组与对照组,试验组在哮喘缓解期内采用激素喷雾剂,在哮喘发作期

内采用激素喷雾剂+扩展气管药;对照组在哮喘缓解期不使用任何药物,在哮喘发作期

内采用扩展气管药物。通过治疗3 个月,以肺功能检查中得第1 秒用力呼吸率

(FEV1/FRC1)作为主要有效性评价指标,评价两种治疗方案得有效性与安全性。请阐

述这个研究中得总体与总体均数就是什么?

答:试验组得研究总体就是接受试验组治疗方案得全体哮喘儿童患者在治疗3 个月时得FEV1/FRC1 值得全体。对照组得研究总体就是接受对照组治疗方案得全体哮喘儿童患者在治疗3 个月时得FEV1/FRC1 值得全体。

试验组对应得总体均数就是接受试验组治疗方案得全体哮喘儿童患者在治疗3 个月时得FEV1/FRC1 得平均值;对照组对应得总体均数就是接受对照组治疗方案得全体哮喘儿童

患者在治疗3 个月时得FEV1/FRC1 得平均值。

4、请简述什么就是小概率事件?对于一次随机抽样,能否认为小概率事件就是不可能发生得?

答:在统计学中,如果随机事件发生得概率小于或等于0、05,则通常可以认为就是一个小

概率事件,表示该事件在大多数情况下不会发生,并且一般可以认为小概率事件在一次随机抽样中不会发生,这就就是小概率事件原理。小概率事件原理就是统计学检验得基础。

5、变量得类型有哪几种?请举例说明,各有什么特点?

答:(1) 连续型变量,可以一个区间中任意取值得变量,即在忽略测量精度得情况下,

连续型变量在理论上可以取到区间中得任意一个值,并且通常含有测量单位。观察连续型变量所得到得数据资料称为计量资料(measurement data)。如例1-1 中得身高变量就就是连续型变

量,身高资料为计量资料。、(2) 离散型变量, 变量得取值范围就是有限个值或者为一个数列。离散型变量得取值情况可以分为具有分类性质得资料与不具有分类性质得资料,表示分类情况得离散型变量亦称分类变量(categorical variable)。观察分类变量所得到得资料称为分类资料(categorical data)。分类资料可以分为二分类资料与多分类资料,而多分类资料又分成无序分类资料与有序分类资料,二分类资料如症状指标分为感染或未感染,无序多分类资料(nominal data) 如血型可以分为A、B、AB 与O 型,有序多分类资料(ordinal data) 如病情指标分为无症状、轻度、中度与重度。

第二章

一、就是非题

1.不论数据呈何种分布,都可以用算术均数与中位数表示其平均水平。

答:错。只有资料满足正态或近似正态分布时计算算术均数就是比较有统计学意义得。

2.在一组变量值中少数几个变量值比大多数变量值大几百倍,一般不宜用算术均数表示其

平均水平。

答:对,可以采用中位数表示。

3.只要单位相同,用s 与用CV 来表示两组资料得离散程度,结论就是完全一样得。

答:错,标准差S 就是绝对误差得一种度量,变异系数CV 就是相对误差得一种度量,对于两组

资料离散程度得比较,即使两组资料得度量单位相同,也完全有可能出现两个指标得结论就是

不同得。在实际应用时,选择离散程度得指标时,考虑其结果就是否有研究背景意义。例如: 一组资料为成人得身高观察值,另一组资料为2 岁幼儿得身高观察值,虽然可以用标准差S

比较两组得离散程度,也不能认为这就是错误得,但根本没有研究背景意义,相反选择变异系数CV 比较两组资料得相对变异程度,这就有一定得研究背景意义。

4.描述200 人血压得分布,应绘制频数图。

答:对。

5、算术均数与中位数均不容易受极值得影响。

答:错。算术均数比中位数容易受到极值得影响。

二、选择题

1.中位数就是表示变量值A 得指标。

A. 平均水平

B. 变化范围

C. 频数分布

D. 相互间差别大小

2.对于最小组段无确定下限值与(或)最大组段无确定上限值得频数分布表资料,宜用下

列哪些指标进行统计描述? C ____

A 中位数,极差

B 中位数,四分位数间距

C 中位数,四分位数范围

D 中位数,标准差

3.描述年龄(分8 组)与疗效(有效率)得关系,应绘制A 。

A.线图B、圆图C、直方图D、百分条图

4、为了描述资料分布概况,绘制直方图时,直方图得纵轴可以为D 。

A 频数

B 频率

C 频率密度(频率/组距)

D 都可以

三、简答与分析题

1. 100 名健康成年女子血清总蛋白含量(g/L)如表2-14,试描述之。

表2-12 100 名成年健康女子血清总蛋白含量(g/L)

73、5 74、3 78、8 78、0 70、4 80、5 84、3 68、8 69、7 71、2

72、0 79、5 75、6 78、8 72、0 72、0 72、7 75、0 74、3 71、2

68、0 75、0 75、0 74、3 75、8 65、0 67、3 78、8 71、2 69、7

73、5 73、5 75、8 64、3 75、8 80、3 81、6 72、0 74、3 73、5

68、0 75、8 72、0 76、5 70、4 71、2 67、3 68、8 75、0 70、4

74、3 70、4 79、5 74、3 76、5 77、6 81、2 76、5 72、0 75、0

72、7 73、5 76、5 74、7 65、0 76、5 69、7 73、5 75、4 72、7

72、7 67、2 73、5 70、4 77、2 68、8 74、3 72、7 67、3 67、3

74、3 75、8 79、5 72、7 73、5 73、5 72、0 75、0 81、6 74、3

70、4 73、5 73、5 76、5 72、7 77、2 80、5 70、4 75、0 76、5

答:制作频数表如下:

_____________________________________________________________________

组段频数百分比累积频数累积百分比

____________________________________________________________________

64~ 3 3、00 3 3、00

66~ 5 5、00 8 8、00

68~ 8 8、00 16 16、00

70~ 11 11、00 27 27、00

72~ 25 25、00 52 52、00

74~ 24 24、00 76 76、00

76~ 10 10、00 86 86、00

78~ 7 7、00 93 93、00

80~ 6 6、00 99 99、00

84~ 1 1、00 100 100、00

变量例数均数标准差最小值最大值中位数25 百分位数75 百分位数x 100 73、7 3、925 64、3 84、3 73、5 71、2 75、8

2.某医师测得300 名正常人尿汞值(ng/L)如表2-15,试描述资料。

表2-13 300 名正常人尿汞值(ng/L)

尿汞例数累计例数累计百分数(%)

0~ 49 49 16、3

4~ 27 76 25、3

8~ 58 134 44、7

12~ 50 184 61、3

16~ 45 229 76、3

20~ 22 251 83、7

24~ 16 267 89、0

28~ 10 277 92、3

32~ 7 284 94、7

36~ 5 289 96、3

40~ 5 294 98、0

44~ 0 294 98、0

48~ 3 297 99、0

52~ 0 297 99、0

56~ 2 299 99、7

60~ 1 300 100、0

合计300 ——

答:根据资料给出统计描述得指标如下:

例数均数标准差最小值最大值

16 15、053 49、014 2 62

3.对于同一得非负样本资料,其算数均数一定大于等于几何均数。答:根据初等数学中得不等式1 2

1 2

n n

n

a a a a a a

n

+ + +

≥ ,可以得到算数均数一定大于

等于几何均数。

4.常用得描述集中趋势得指标有哪些,并简述其适用条件。

答:(1)算术均数:适用对称分布,特别就是正态或近似正态分布得数值变量资料。

(2)几何均数:适用于频数分布呈正偏态得资料,或者经对数变换后服从正态分布(对数

正态分布)得资料,以及等比数列资料。

(3)中位数:适用各种类型得资料,尤其以下情况:

A 资料分布呈明显偏态;

B 资料一端或两端存在不确定数值(开口资料或无界资料);C

资料分布不明。

第三章

一、就是非题

1、二项分布越接近Poisson 分布时,也越接近正态分布。

答:错。当二项分布得π不太接近0或者1,随着n得增大,nπ与n(1?π)均较大时, 二项分布得X 得逐渐近似正态分布; n 较大,π较小,二项分布得X 近似总体均数为

μ= nπ得Poisson 分布,只有n较大、π较小并且nπ较大时,二项分布得X 既近似Poisson 分布又近似正态分布,其本质就是当n 较大、π较小时二项分布得X 所近似得

Poisson 分布在其总体均数μ= nπ较大时逼近正态分布。

2、从同一新生儿总体(无限总体)中随机抽样200 人,其中新生儿窒息人数服从二项

分布。

答:对。因为可以假定每个新生发生窒息得概率π就是相同得并且相互独立,对于随机抽取200 人,新生儿窒息人数X 服从二项分布B(n,π)。

3、在n 趋向无穷大、总体比例π趋向于0,且nπ保持常数时得二项分布得极限分布就是

Poisson 分布。

答:对。这就是二项分布得性质。

4、某一放射物体,以一分钟为单位得放射性计数为50,40,30,30,10,如果以5 分

钟为时间单位,其标准差为160

5 。

答:错。设i X 服从总体均数为μ得Poisson 分布,i = 1,2,3,4,5,并且相互独立。根据Poisson 分布得可加性, 1 2 3 4 5 X + X + X + X + X 服从总体均数为5μ,___________其总

体方差为

5μ,本题5 分钟得总体方差5μ得估计值为50 + 40 + 30 + 30 +10 = 160,所以其标准

差为160 。

5、一个放射性物体一分钟脉冲数为20 次,另一个放射性物体一分钟脉冲数为50 次。

假定两种放射性物体得脉冲性质相同,并且两种放射性物体发生脉冲就是相互独立得,

则这两种物体混合后,其一分钟脉冲数得总体均数估计值为70 次。

答:对。根据Poisson 分布得可加性,这两种物体混合后得发生得脉冲数为1 2 X + X ,混

合后一分钟脉冲数得总体均数估计值为20+50=70 次。

6、一个放射性物体平均每分钟脉冲数为5 次(可以认为服从Poisson 分布),用X 表示

连续观察20 分钟得脉冲数,则X 也服从Poisson 分布。

答:对,这就是Poisson 分布得可加性。

7、一个放射性物体平均每分钟脉冲数为5 次(可以认为服从Poisson 分布),用X 表示

连续观察20 分钟得脉冲数,则X 得总体均数与总体方差均为100 次。

答:对。Poisson 分布得可加性原理。

8、用X 表示某个放射性物体得每分钟脉冲数,其平均每分钟脉冲数为5 次(可以认为

服从Poisson 分布),用Y 表示连续观察20 分钟得脉冲数,则可以认为Y 近似服从正

态分布,但不能认为X 近似服从正态分布。

答:对。因为Y 得总体均数为100,当μ比较小得时候,Poisson 分布就是一个偏态得分布, 但就是当μ增大时,Poisson 分布会逐渐趋于对称。

二、选择题

1、理论上,二项分布就是一种B。

A 连续性分布

B 离散分布

C 均匀分布

D 标准正态分布

2、在样本例数不变得情况下,下列何种情况时,二项分布越接近对称分布。C

A 总体率π越大

B 样本率P 越大

C 总体率π越接近0、5

D 总体率π越小

3、医学上认为人得尿氟浓度以偏高为不正常,若正常人得尿氟浓度X 呈对数正态分

布,Y = lgX , G 为X 得几何均数,尿氟浓度得95%参考值范围得界值计算公式就是A 。

A lg 1( 1、64 ) Y ?Y + S

B + 1、96 X G S

C + 1、64 X G S

D lg 1( 1、96 ) Y ?Y + S

4、设1 2 10 X , X , , X 均服从B(4,0、01) , 并且 1 2 10 X , X , , X 相互独立。令1 2 10 Y = X + X + + X ,则D

A Y 近似服从二项分布

B Y 近似服从Poisson 分布

C Y 近似服从正态分布

D Y ~ B(40,0、01)

5、设1 2 10 X , X , , X 均服从Poisson(2、2) ,并且 1 2 10 X , X , , X 相互独立。令

1 2 10 Y = (X + X + + X ) /10,则C

A Y 近似服从B(10,0、22)

B Y 服从Poisson(22)分布

C Y 近似服从正态分布

D Y 服从Poisson(2、2)分布

三、简答题

1、如果X 得总体均数为μ,总体标准差为σ,令Y =a+bX,则可以证明:Y 得总体均

数为a+bμ,标准差为bσ。如果X 服从μ=40 得Poisson 分布,请问:Y = X /2 得总体

均数与标准差就是多少?

答:总体均数=20,总体标准差= 40 / 2。

2、设X 服从μ=40 得Poisson 分布,请问:Y = X /2 就是否服从Poisson 分布?为什么?答:不就是得。因为Y = X /2 得总体均数=20,不等于总体方差10。

3、设X 服从μ=40 得Poisson 分布,可以认为X 近似服从正态分布。令Y = X /10,

试问:就是否可以认为Y 也近似服从正态分布?

答:正态分布得随机变量乘以一个非0 常数仍服从正态分布,所以可以认为Y 也近似

服从正态分布。

4、设X 服从均数为μ得 Poisson 分布。请利用两个概率之比:P(X +1) / P(X ),证明: 当x < μ?1 时,概率P(X )随着X 增大而增加;当X > μ时,概率P(X )随着X 增大

而减小。

答:

1

( 1)/( ) ( )/[ ] /( 1)

( 1)! !

x x

P X x P X x e e x

x x

μμμμ

μ

+

= + = = ??= +

+

, 显然, 当

x < μ?1 时,对应x +1 < μ,由此得到1

x 1

μ

>

+

,所以P(X = x +1) / P(X = x) > 1,

说明概率P(X ) 随着X 增大而增加 ; 当X > μ时 , 则

( 1)/( ) 1

1

P X x P X x

x x

μμ

= + = = < <

+

,说明当X>μ时,概率P(X )随着X 增大而减

5、已知某饮用水得合格标准就是每升水得大肠杆菌数≤2 个,如果随机抽取1 升饮用水, 检测出大肠杆菌数得95%参考值范围就是多少?(提示考虑合格标准得总体均数最大值

为2 个/L,求95%参考值范围)。

答:由于合格标准得总体均数最大值为2 个/L,对于正常而言,大肠杆菌数越少越好,

所以这就是单侧参考值范围。即求满足累计概率得不等式2

0 0

( | 2) 2 0、95

!

X X k

k k

P k e

k

μ?

= =

Σ= =Σ≤

得最大X 得解。

X 0 1 2 3 4 5 6

P(X ) 0、135335 0、270671 0、270671 0、180447 0、090224 0、036089 0、01203

( )

X

k

P k

= Σ

0、135335 0、406006 0、676676 0、857123 0、947347 0、983436 0、995466

根据上述计算得到 X 得95%参考值范围就是X < 5个/L。?

第四章

一、就是非题

1、设X 得总体均数为μ,则样本均数X 得总体均数也为μ。

答:对。经随机抽样得到得样本均数X 得总体均数也为μ。

2、设X 得总体方差为σ2,则样本均数X 得总体方差也为σ2。

答:错。经随机抽样后得到得样本均数X 得总体方差为σ2/n。

3、设随机变量1, , n X …X 均服从B(1,π) ,n 很大时,则

1

1 n

i

i

X X

= Σ近似服从

N(π,π(1?π) / n)

答:对。

4、某研究者做了一个儿童血铅浓度得流行病学调查,共调查了1000 人,检测了每个人血铅浓度。虽然血铅检浓度一般呈非正态分布,但由于该研究样本量很大,可以认为这些

血铅浓度近似服从正态分布。

答:错。血铅浓度得分布与样本量就是否很大无关,如果样本量充分大时,血铅浓度得样本均数得分布近似正态分布。

5、某研究者做了一个儿童血铅浓度得流行病学调查,共调查了1000 人,检测了每个人血铅浓度,计算这1000 人得血铅平均浓度。对于现有得1000 人得血铅浓度资料,可以认

为该资料得样本均数近似服从正态分布。

答: 错。样本均数得概率分布就是指随机抽样前将要随机抽取得样本,其样本均数近似服从某个概率分布,样本量很大时,样本均数逼近正态分布。对于这个资料而言,这就是已经完成随机抽样得资料,这个资料得样本均数只就是一个数,不存在服从哪种分布得问题。

6、某研究者做了一个儿童血铅浓度得流行病学调查,已知血铅测量值非正态分布,计划调查1000 人,并将计算1000 人得血铅浓度得样本均数,由于该研究样本量很大,可以认

为随机抽样所获得血铅浓度得样本均数将近似服从正态分布。

答:对。如果从某个均数为μ,标准差为σ得非正态分布得总体中抽样,只要样本量足够大, 则样本均数X 得分布也将近似于正态分布N(μ,σ 2 / n)。

二、选择题

1、以下方法中唯一可行得减小抽样误差得方法就是___B____。

A、减少个体变异

B、增加样本量

C、设立对照

D、严格贯彻随机抽样得原则

2、X S 表示____C____。

A、总体均数得离散程度

B、总体标准差得离散程度

C、样本均数得离散程度

D、样本标准差得离散程度

3、设连续性随机变量X得总体均数为μ,从X总体中反复随机抽样,随样本量n 增大,

X

X

S

将趋于____D____。

A、X 得原始分布

B、正态分布

C、均数得抽样分布

D、标准正态分布

4、在均数为μ,标准差为σ 得正态总体中随机抽样,理论上| X ?μ|≥____B____得可能性

为5%。

A、1、96σ B 1、96 X σC、0、05/ 2,v t S D 1、96 X S

5、下面关于标准误得四种说法中,哪一种就是不正确____C____。

A、标准误就是样本统计量得标准差

B、标准误反映了样本统计量得变异

C、标准误反映了总体参数得变异

D、标准误反映了抽样误差得大小

6、变量X 偏离正态分布,只要样本量足够大,样本均数___C_____。

A、偏离正态分布

B、服从F 分布

C、近似正态分布

D、服从t 分布

三、简答题

1、样本均数得抽样误差定义就是什么?

答:样本均数得抽样误差就是指样本均数与总体均数间得差异,但同时可以表现为从同一总体

中多次随机抽样所得得样本均数间得差异,通常用样本均数得标准误度量平均得抽样误差大小。

2、估计样本均数得平均抽样误差得统计量就是什么?

答:就是样本均数得标准差,即样本均数得标准误。

3、简述样本均数得抽样误差得规律?。

答:样本均数得标准误得理论值为x n

σ

σ= ,而其估计值为X

S S

n

= ;

4、简述t 分布、F 分布,χ2 分布曲线得特征与自由度得关系。

答:t 分布就是一簇以0 为中心,左右对称得单峰曲线,随着自由度得增加,t 分布曲线将越

来越接近于标准正态分布曲线,当自由度为无穷大时,t 分布就就是标准正态分布。t 分布得曲线下两侧尾部得面积可以通过查对应自由度下得t 分布界值表得到。

χ2 分布得图形为一簇单峰正偏态分布曲线,且随着自由度得增加,正偏得程度越来越小。

χ2 分布得曲线下右侧尾部得面积可通过查χ2 界值表得到。

F 分布得特征有:(1)F 分布有两个自由度,F 得取值范围为0~∞。(2)F 分布为一

簇单峰正偏态分布曲线,与两个自由度有关。(3)每一对自由度下得F 分布曲线下面积,

见方差分析用F 界值表(附表4),横标目为第一自由度,纵标目为第二自由度,表中分别给

出了概率为0、05 与0、01 时得F 界值,记为

, , Fανν。

t 分布,χ2 分布与F 分布就是三种没有未知参数,只有自由度得概率分布,常用于抽样研

究中,故称为三种常见得抽样分布。

5、简述正态分布、t 分布、F 分布、χ2 分布之间得关系。

(μ,σ 2 ),那么从总体中随机抽取得样本,其样答:(1)若随机变量X 服从于正态分布N

( , 2 ) X N μσ。令Z 为对X 进行标准化变换得结果,Z 均数X 将服从于正态分布

将服从于标

准正态分布,即

X /

Z X X

n

μμ

σσ

= ? = ?服从标准正态分布。(2)自由度为1 得χ2 分布可以

通过将服从标准正态分布得变量平方得到。(3)若随机变量X1 与X2 分别为服从自由度为v1 与v2 得χ2 分布,并且相互独立,则比值

1 )

2

1 1 1

2

2 2 2

χ /

χ

F X

X

ν

ν

νν

νν

= = 分布(

分布( 2 )/

服从自由度为(v1,v2)得F 分布(F-distribution)。

6、目前一般得统计软件(如SAS,SPSS 与Stata)均能随机模拟产生服从均匀分布、正态分布、二项分布得随机数。利用这些程序,可以生成指定参数下得随机数据,这种产生

随机数得方法称为“蒙特卡洛方法”(Monte-Carlo Method)。请参考光盘中随机模拟操作, 借助统计软件随机模拟产生随机数据,重现本章中关于均数与率得抽样分布规律。

答:以Stata 为例

正态分布资料得样本均数得分布模拟。

用记事本写入下来语句

clear

set memory 100m

di "输入样本量总体均数总体标准差"

scalar m=`1'

scalar mm=`2'

scalar oo=`3'

set obs 10000

local j=1

gen xx=0

gen ss=0

while `j'<=m{

gen x`j'=invnorm(uniform())*oo+mm

replace xx=xx+x`j'

replace ss=ss+x`j'*x`j'

local j=`j'+1

}

gen ssd=sqrt((ss-xx*xx/m)/(m-1))

replace xx=xx/m

di "mean=" xx

di "sd=" ssd

用文件名"simumean、do"保存

在Stata 窗口中打入

do [路径]simumean 样本量总体均数总体标准差

对于Stata 7、0,输入下列命令显示样本均数得频数图graph xx,bin(50) xlabel

对于Stata 8、0,输入下列命令显示样本均数得频数图graph7 xx,bin(50) xlabel

非正态分布得样本均数得分布模拟。

用记事本写入下来语句

clear

set memory 100m

di "输入样本量"

scalar m=`1'

set obs 10000

local j=1

gen xx=0

gen ss=0

while `j'<=m{

gen x`j'=invnorm(uniform())^2

replace xx=xx+x`j'

replace ss=ss+x`j'*x`j'

local j=`j'+1

}

gen ssd=sqrt((ss-xx*xx/m)/(m-1))

replace xx=xx/m

di "mean=" xx

di "sd=" ssd

用文件名"simumean1、do"保存

在Stata 窗口中打入

do [路径]simumean1 样本量总体均数总体标准差对于Stata 7、0,输入下列命令显示样本均数得频数图graph xx,bin(50) xlabel

显示原始资料得频数分布图

graph x1,bin(50) xlabel

对于Stata 8、0,输入下列命令显示样本均数得频数图

graph7 xx,bin(50) xlabel

显示原始资料得频数分布图

graph7 x1,bin(50) xlabel

样本率得分布模拟。

用记事本写入下来语句

clear

set memory 100m

di "输入样本量总体率"

scalar m=`1'

scalar pp=`2'

set obs 10000

local j=1

gen xx=0

gen ss=0

while `j'<=m{

replace xx=xx+int(uniform()+pp)

local j=`j'+1

}

gen ppp=xx/m

su ppp

用文件名"simumean3、do"保存

在Stata 窗口中打入

do [路径]simumean3 样本量总体率

对于Stata 7、0,输入下列命令显示样本率得频数图

graph ppp,bin(50) xlabel

对于Stata 8、0,输入下列命令显示样本率得频数图

graph7 ppp,bin(50) xlabel

7、利用蒙特卡洛方法,产生标准正态分布得随机数,并计算样本方差,验证方差乘自由度(n ?1)S2服从于自由度为n ?1得χ2 分布,两个独立样本得方差之比服从于自由度为

1 n ?1,

2 n ?1得F 分布。

答:

标准正态分布资料得样本方差×(n-1)得分布模拟。

用记事本写入下来语句

clear

set memory 100m

di "输入样本量"

scalar m=`1'

set obs 10000

local j=1

gen xx=0

gen ss=0

while `j'<=m{

gen x`j'=invnorm(uniform())

replace xx=xx+x`j'

replace ss=ss+x`j'*x`j'

local j=`j'+1

}

gen ss= ss-xx*xx/m

用文件名"simuvariance、do"保存

在Stata 窗口中打入

do [路径] simuvariance、do 样本量

对于Stata 7、0,输入下列命令显示样本均数得频数图

graph ss,bin(50) xlabel

对于Stata 8、0,输入下列命令显示样本均数得频数图

graph7 ss,bin(50) xlabel

F 分布得模拟。

用记事本写入下来语句

clear

set memory 100m

di "输入样本量1 总体均数1 样本量2 总体均数2 总体标准差" scalar m1=`1'

local mn1=`1'

scalar mm1=`2'

scalar m2=`3'

scalar mm2=`4'

scalar oo=`5'

set obs 10000

local j=1

gen xx=0

gen ss=0

gen xx0=0

while `j'<=m1{

replace xx0=invnorm(uniform())*oo+m1

replace xx=xx+xx0

replace ss=ss+xx0*xx0

local j=`j'+1

}

gen ss1= (ss-xx*xx/m1)/(m1-1)

replace ss=0

replace xx=0

local j=1

while `j'<=m2{

gen xx0=invnorm(uniform())*oo+m2

replace xx=xx+xx0

replace ss=ss+xx0*xx0

local j=`j'+1

}

gen ss2= (ss-xx*xx/m2)/(m2-1)

gen f=ss1/ss2

用文件名"simuf、do"保存

在Stata 窗口中打入

do [路径] simuf、do 样本量

对于Stata 7、0,输入下列命令显示统计量F 得频数图

graph f,bin(50) xlabel

对于Stata 8、0,输入下列命令显示统计量F 得频数图

graph7 f,bin(50) xlabel

第五章

一、就是非题

1.t 检验统计量服从自由度为ν得t 分布。

答:错。只有在H0 假设为真时才成立。

2、当拒绝0 H 时,只可能发生第一类错误。

答:对。

3、对于H0 :μ= μ0 H1 :μ≠μ0得t检验,当 1 H 为真时,检验统计量/ 2,n 1 t tα?> 得

_______概率为1?β。

答:对。当1 H 为真时,作出正确推断得概率即为1?β。

4、对于0 0 1 0 H :μ= μH :μ≠μ得t检验, 0 H 为真而言,发生拒绝0 H 得机

会与样

本量n 无关。

答:对。无论样本量n 多大,犯第一类错误得概率为α。

5、对于定量资料用95%可信区间得公式0、05/ 2,n 1 X X t S?±估计总体均数所在范围,

要求资料服从正态分布或样本量很大。

答:对。

二.选择题

1.在同一总体随机抽样,其她条件不变,样本量越大,则总体均数得95%可信

区间( A )。

A 越窄

B 越宽

C 越可靠

D 越稳定

2.从两个不同总体中随机抽样,样本含量相同,则两总体均数95%可信区间

(D )。

A 标准差小者,可信度大

B 标准差小者,准确度高

C 标准差小者,可信度大且准确度高

D 两者得可信度相同

3.其她条件不变,可信度1-α 越大,则总体均数可信区间( A )

A 越宽

B 越窄C不变D还与第二类错误有关

4.其她条件不变,可信度1-α 越大,则随机抽样所获得得总体均数可信区间将

不包含总体均数得概率( B )。

A 越大

B 越小

C 不变

D 不确定

5、区间内包含总体均数得概率为(D )。

A 95%

B 97、5%

C 99%

D 100%

6 从某正态总体中随机抽样,样本含量固定, 区间内包含样本均数

得概率为( A )。

A 95%

B 97、5%

C 99%

D 不确定

7.增大样本含量,则错误得就是( A )。

A 可信区间得可信度变大

B x S 变小

C 同样可信度情况下,可信区间变窄

D 抽样误差减少

8.下列公式中,哪一个可以用于正态分布总体均数得95%可信区间得估计(C )。

A μ±1、96σX

B 1、96 X μ±σ

C 0、05(v) X X ±t S

D 0、05(v) X ±t S

9.由两个独立样本计算得到两个总体均数得可信区间,则下列结论中正确得就是( C )。

A 如果两个可信区间无重叠,可认为两样本均数差别无统计意义

B 如果两个可信区间有重叠,可认为两样本均数差别有统计意义

C 如果两个可信区间无重叠,可认为两样本均数差别有统计意义

D 以上都不对

10.在总体方差相等得条件下,由两个独立样本计算两个总体均数之差得可信区间包含了0,则( B )。

A 可认为两样本均数差别无统计学意义

B 可认为两样本均数差别有统计学意义

C 可认为两总体均数差别无统计学意义

D 可认为两总体均数差别有统计学意义

11.假设检验中得第二类错误就是指( D )所犯得错误。

1、96 X μ±σ

1、96 X μ±σ

A 拒绝了实际上成立得H0

B 未拒绝实际上成立得H0

C 拒绝了实际上不成立得H0

D 未拒绝实际上不成立得H0

12、两样本均数比较得假设检验中,差别有统计学意义时,P 越小,说明( D )。

A、两样本均数差别越大

B、两总体均数差别越大

C、越有理由认为两样本均数不同

D、越有理由认为两总体均数不同

13.作两样本均数差别得t 检验中,P 值与α 值中( A )。

A.α 值就是研究者指定得

B.P 值就是研究者指定得

C.两者意义相同,数值不同

D.两者意义相同,数值相同

14、两样本均数得t 检验,按0、05 得检验水准拒绝H0,若此时推断有误,其错误得概率为( A )。

A 0、05

B >0、05

C <0、05

D 不一定

15、在样本均数与总体均数差别得双侧显著性检验中,结果为P<α 而拒绝H0,接受H1,原因就是( D )。

A、H0 假设成立得可能性小于α

B、H1 假设成立得可能性大于1-α

C、H0 成立得可能性小于α 且H1 成立得可能性大于1-α

D、从H0 成立得总体中随机抽取一个样本,其样本均数比现有样本得均数更

远离(H0 为真时)总体均数得可能性小于α

注:假设检验就是反证法思想,即:考察0 H 为真情况下,样本统计量出现背离0 H

且逼近1 H 得概率就是否为小概率事件,所以假设检验中不涉及到0 H 成立得概率。

三、统计分析题与简答题

1、在假设检验中,当出现P >α时,虽然不能拒绝H0,但不能推断H0成立。

(提示:假设检验就是基于反证法得思想)。

答:假设检验就是基于反证法得思想。拒绝H0就是因为在H0为真得假设下样本

统计量出现在小概率事件范围内,所以可以推断H0非真;反之,在H0为

真得假设下样本统计量未出现在小概率事件范围,只就是没有足够证据支持

不能拒绝H0。正如反证法只就是寻找推翻假设得证据,并不就是寻找支持假设

得证据,不能推翻假设得结果并不能成为证实假设成立得证据。事实上,

不拒绝H0 时犯第二类错误得概率β有时还很大,并且无法由研究者直接

控制,所以不拒绝H0 时,不能直接推断H0 成立。

2、下面就是18 例冠心病患者高密度脂蛋白(HDL,g/L)得测定结果,请回答下列问题。

0、30,0、43,0、26,0、34,0、57,0、49,0、35,0、22,0、33,0、37,0、28,0、35,

0、40,0、36,0、42,0、28,0、41,0、30

1)本题所研究得总体就是什么?

答:满足者该研究中入选标准得全部冠心病患得高密度脂蛋白(HDL,g/L)

实际值得全体构成得集合。

2)根据本题得研究背景与研究问题,请用研究背景语言给出本题总体均

数得具体定义。

答:满足者该研究中入选标准得全部冠心病患得高密度脂蛋白(HDL,g/L)

实际值得平均数。

3)试估计本题得总体均数及其95%可信区间,并用通俗得研究背景语言

论述您得结果。

答:X = 0、3589, 0、08567, 18, 0、08567 / 18 0、02 X S = n = S = = ,

95%可信区间为: x X t s 0、05,17 ±=0、3589±2、11×0、02=(0、3167, 0、4011)。以95%可信度推断冠心病患者人群得高密度脂蛋白(HDL,g/L)得平均数在

0、3167~0、4011 g/L。

3、已知大肠杆菌在饮用水中呈Poisson 分布,根据有关规定:对于合格得饮

用水而言,平均每升饮用水中得大肠杆菌个数不超过2 个,先在某饮用水

生产处抽样2L 水,经检测发现6 个大肠杆菌,请估计该处得饮用水平均

1L 中得大肠杆菌数在什么范围内?

答:X=6,查Poisson 分布总体均数得可信区间界值表得,95%得可信区间为

(2、20/2, 13、06/2)=(1、10,6、53)。

4、续第3 题,在实际得卫生监督执法中,一般不进行统计分析,但需要根据

统计学原理与饮用水卫生标准,指定一个饮用水大肠杆菌数得界值:随机

抽取1L 水,当检测到得细菌数低于这个界值,可以推断该处饮用水得平

均1L 水得大肠杆菌数不会超过2 个,请以95%得可信度确定这个界值。

答:μ= 2,查Poisson 分布总体均数得95%可信区间界值表得到大于 2 得

最小下限为X=6,其95%可信区间为(2、2,13、1),而X=5 得95%可信区

间为(1、6,11、7),所以当检测结果为大肠杆菌数≥6 时,可以推断该处饮

用水得平均每升水得大肠杆菌数μ> 2,即该饮用水不合格。

5、续第3 题与第4 题,请推敲下列描述有何不同,适用于何种情况?

1) 每1L 饮用水中得平均大肠杆菌个数不超过2 个就是合格得

2)合格得饮用水中,1L 饮用水得大肠杆菌个数不得高于于2 个

3)第3 题中,能否按1L 水检测到3 个大肠杆菌估计该处得饮用水平均每每

1L 中得大肠杆菌数在什么范围内,为什么?

答:第一个问题就是对于合格得饮用水而言,平均每1L 饮用水得大肠杆菌个

数不超过2(μ≤2),也就就是在检测样品为 1 升饮用水时,容许样品中得大

肠杆菌数超过2 个。

第二个问题就是指检测样品为1 升水时,不容许样品中得大肠杆菌数超过2

个。(X ≤2)

3)根据Poisson 分布得95%可信区间推断该处得饮用水平均每升中得大肠

杆菌数在(0、62,8、8)

第六章

一、就是非题

1、随机区组设计得检验效能一定高于完全随机设计

答:错。如果在完全随机设计中,实验条件与实验过程控制都非常好,研究对象得同质性非常好,几乎不存在可能得混杂因素,即可以认为可能混杂效应很小甚至可以忽略,则完全随机设计得检验效能可能要高于随机区组设计。

2、随机对照试验就就是实验性研究

答:对。随机对照试验得英文名就是Random control trial,缩写为RCT。在随机分组前,随机对照试验得研究对象来自同一人群,通过选择不同得干预,构成试验组与对照组,由此评价干预效应。因此随机对照试验就就是实验性研究,但要注意:实验性研究未必就是随机对照试验。

3、随机对照试验就就是完全随机设计

答:错。随机对照试验贯彻了随机化原则,对照组与实验组间除实验因素不同外,其她条件基本相同,研究设计可以就是完全随机对照设计,也可以就是随机区组

设计。

4、采取随机分组可以提高检验效能

答:错。采取随机分组得主要目得就是控制或减少混杂因素对结果得影响,与检验效能没有直接得连续。

5、为了研究A 因素与死亡得关系,采用队列研究,但所获样本资料不能估计人群得A 因素暴露比例。

答:对。因为队列研究就是根据A 因素得不同暴露水平分别入选研究对象,由此建立不同暴露水平得队列进行随访研究得。如按A 因素暴露与非暴露分别入组2000 人进行随访,因此暴露人数与非暴露人数就是1:1,与人群中得暴露比例无关。即:队列研究中得研究对象中得暴露比例就是人为确定得,不就是人群得暴露

例。

二、选择题

1、病例对照研究得主要缺点之一就是 C

A、研究周期长

B、病例不容易收集

C、容易产生选择性偏倚

D、容易失访

2、病例对照研究得主要优点之一就是 C

A、容易失访

B、不容易发生测量偏倚

C、患病率很低得疾病也适用

D、很容易选择与收集对照

3、病例对照研究最好应选择 D 为对照

A、健康人

B、医院中未患该疾病得人

C、医院中得正常人

D、根据研究背景选择符合一定条件得未患该疾病得

4、采用配对设计得主要目得就是 B 。

A 减少样本含量

B 减少混杂因素对结果得影响

C 提高统计检验得功效

D 有利于统计分析

5、下列说法哪一个就是正确得。

A、采用完全随机设计可以使试验组与对照组同时减少混杂因素得影响

B、采用随机区组设计可以控制了混杂因素对结果得影响

C、采用随机区组设计可以减少了混杂因素对结果得影响,当效应指标与研究因素之间存在混杂效应得情况下,采用配对设计可以提高了统计检验得效

能。

D、采用完全随机设计可以控制混杂因素在试验组与对照组达到概率意义下

得平衡,由此提高了统计检验得效能。

三、简答题

1、实验性研究与观察性研究得根本区别就是什么?

答:主要区别在于就是否人为给予干预措施,如果研究者人为施加了干预措施那么

就就是实验性研究,如果研究者没有施加干预措施,而就是以客观、真实得观察为依

据,对观察结果进行描述与对比分析,那么就就是观察性研究。另外在干预前,实验性研究得研究对象来自同一群体;比较性质得观察性研究得对象一般来自不同人群。

2、实验设计得三个基本原则就是什么?

答:实验设计得基本原则:对照、随机、重复。设立对照与贯彻随机化就是使各组均衡可比得两个非常重要得手段。重复就就是指试验组与对照组需要满足一定得样

本量。

3、随机化得作用就是什么?

答:随机化就是采用随机得方式,使每个受试对象都有同等得机会被抽取或分到不

同得实验组与对照组。随机化使不可控制得混杂因素在实验组与对照组中得影响较为均匀,并可归于实验误差之中;它也就是对资料进行统计推断得前提,各种统计分析方法都就是建立在随机化得基础上。

4、为比较两种药物对小鼠移植性肉瘤生长有无抑制作用得效果,如果由文献报道,小鼠肿瘤重量得标准差在0、7g 左右而小鼠肿瘤重量测量得有效精度在

0、5g 左右,规定此检验分辨得能力Δ = 0、5 g,标准差S = 0、7 g,α= 0、05, Z0、05/ 2 =1、96以及β=0、20,试估计每组所需样本量?如何将小鼠分组?并写

出分组结果。

答: 每组样本量估计

2 2 2 2

0、05 / 2 0、2

2 2

2( ) 2(1、96 0、842) 0、7 31

0、5

n Z Z

+ σ+

= = =

Δ

考虑到可能存在一定得脱落,增加 20%样本量,故每组样本量取n =1、2×31 = 38。

随机分组方案如下:

将76 只小鼠编号:1,2, (76)

设置种子数200(可以任意设置一个数值作为种子数)

借助Stata 软件产生76 个在(0,1)上均匀分布得随机数,每个随机数对应一

个研究对象:小鼠。

对76 个随机数从小到大排序,最小得38 个随机数对应得小鼠编号为试验组,最大得38 个随机数对应得小鼠编号为对照组。

借助Stata 软件实现如下:

set obs 76 设置观察记录数为76

gen id=_n 产生编号1~76

set seed 200 设置种子数200

gen r=uniform() 产生随机数

sort r 对随机数进行排序

gen group=1-int((_n-1)/38) 设置最小得38 个随机数为group=1,其它为

group=0

sort id 按编号排序

list id group 列出随机分组名单

第七章

一、就是非题

1、在两样本t 检验中,t 检验统计量服从自由度为n1+n2-2 得t 分布。

答: 错,只有H0 :μ1 = μ2为真才成立

2、对于两个样本得样本量都很大时,t 检验对正态性得要求可以忽略。

答:对,根据中心极限定理可知,样本量很大时,样本均数得分布逼近正态分

卫生统计学考试试题及答案(附解释)题库

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

卫生统计学选择题及答案

t分布与标准正态分布有一定的关系,下述错误的叙述是_____ A.参数数目不同 B.t分布中的自由度趋于无穷大时,曲线逼近标准正态分布 C.为单峰分布 D.对称轴位置在0 E.曲线下面积的分布规律相同 在抽样研究中,当样本例数逐渐增多时_____. A.标准误逐渐加大 B.标准差逐渐加大 C.标准差逐渐减小 D.标准误逐渐减小 E.标准差趋近于0 抽样误差是指。 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别(参数与统计量之间由于抽样而产生的差别) C.样本中每个个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 下面说法中不正确的是_____. A.没有个体差异就不会有抽样误差 B.抽样误差的大小一般用标准误来表示 C.好的抽样设计方法,可避免抽样误差的产生 D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等 E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心,左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时,二都分布一致 D.当样本含量无限大时,t分布与标准正态分布一致 E.当总体均数增大时,分布曲线的中心位置均向右移 抽样研究中,适当增加观察单位数,可() A.减小Ⅰ型错误 B.减小Ⅱ型错误 C.减小抽样误差 D.提高检验效能 E.以上均正确

说明两个有关联的同类指标之比为。 A.率 B.构成比 C.频率 D.相对比 E.频数 构成比用来反映。 A.某现象发生的强度 B.表示两个同类指标的比 C.反映某事物内部各部分占全部的比重 D.表示某一现象在时间顺序的排列 E.上述A与C都对 以下属于分类变量的是___________. A.IQ得分 B.心率 C.住院天数 D.性别 E.胸围 计算麻疹疫苗接种后血清检查的阳转率,分母为______. A.麻疹易感人群 B.麻疹患者数 C.麻疹疫苗接种人数 D.麻疹疫苗接种后的阳转人数 E.麻疹疫苗接种后的阴性人数 关于构成比,不正确的是_____. A.构成比中某一部分比重的增减相应地会影响其他部分的比重 B.构成比说明某现象发生的强度大小 C.构成比说明某一事物内部各组成部分所占的分布 D.若内部构成不同,可对率进行标准化 E.构成比之和必为100% 甲乙两地某病的死亡率进行标准化计算时,其标准的选择______. A.不能用甲地的数据 B.不能用乙地的数据 C.不能用甲地和乙地的合并数据 D.可用甲地或乙地的数据 E.以上都不对 用均数与标准差可全面描述资料的分布特征() A.正态分布和近似正态分布 B.正偏态分布 C.负偏态分布 D.任意分布

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

卫生统计学试题6含答案

. 统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

. A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卫生统计学部分题库

对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______. A.有相关关系 B.无任何关系 C.无直线相关关系 D.无因果关系 E.有伴随关系 若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用_____. A.直线相关分析 B.秩相关分析 C.直线回归分析 D.方差分析 E.病例对照研究 四格表资料的χ2检验应使用校正公式而未使用时,会导致。 A.χ2增大,P值减小 B.χ2减小,P值也减小 C.χ2增大,P值也增大 D.χ2减小,P值增大 E.视数据不同而异 配对设计四格表资料比较两个率有无差别的无效假设为。 A.μ1=μ2 B.π1=π2 C.μ1≠μ2 D.π1≠π2 E.b=c 四格表χ2检验的校正公式应用条件为。 A.n>40且T>5 B.n<40且T>5 C.n>40且1<T<5 D.n<40且1<T<5 E.n>40且T<1 两组设计两样本均数比效的t检验公式中,位于分母位置上的是。 A.两样本均数之差 B.两样本均数之差的方差 C.两样本均数之差的标准误 D.两样本均数方差之差

E.两样本均数标准误之差 两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______. A.t值不变 B.t值变小 C.t值变大 D.t值变小或变大 E.不能判断 在假设检验中,P值和α的关系为。 A.P值越大,α值就越大 B.P值越大,α值就越小 C.P值和α值均可由研究者事先设定 D.P值和α值都不可以由研究者事先设定 E.P值的大小与α值的大小无关 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心,左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时,二都分布一致 D.当样本含量无限大时,t分布与标准正态分布一致 E.当总体均数增大时,分布曲线的中心位置均向右移 下面关于均数的正确的说法是______. A.当样本含量增大时,均数也增大 B.均数总大于中位数 C.均数总大于标准差 D.均数是所有观察值的平均值 E.均数是最大和最小值的平均值 从同一正态总体中随机抽取多个样本,用样本均数来估计总体均数的可信区间,下列哪一样本得到的估计精度高。 A.均数大的样本 B.均数小的样本 C.标准差小的样本 D.标准误小的样本 E.标准误大的样 以一定概率由样本均数估计总体均数,宜采用。 A.抽样误差估计 B.点估计 C.参考值范围估计 D.区间估计

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

卫生统计学试题参考答案

医学统计方法选择题一: 医学统计方法概述 l.统计中所说的总体是指:A A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示B A某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对 3.抽签的方法属于 D A分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样 4.测量身高、体重等指标的原始资料叫:B A计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗人数8 23 6 3 1 该资料的类型是:D A计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的C A有价值的部分B有意义的部分C有代表性的部分 D任意一部分E典型部分 7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对 8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断 C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料 E搜集资料、整理资料、分析资料、进行推断 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:B A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则D A对照的原则B随机原则C重复原则 D交叉的原则E以上都不对 第八章数值变量资料的统计描述 11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率 12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择C A X B G C M D S E CV 13.各观察值均加(或减)同一数后:B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对 14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卫生统计学试题(含答案)

医学统计方法选择题一 医学统计方法概述 l .统计中所说的总体是指: A A 根据研究目的确定的同质的研究对象的全体 B 随意想象的研究对象的全体 C 根据地区划分的研究对象的全体 D 根据时间划分的研究对象的全体 E 根据人群划分的研究对象的全体 2. 概率P=0,则表示B A 某事件必然发生 B 某事件必然不发生 D 某事件发生的可能性很大 E 以上均不对 7. 将计量资料制作成频数表的过程,属于 A 统计设计 B 收集资料 C 整理资料 8. 统计工作的步骤正确的是 C A 收集资料、设计、整理资料、分析资料 C 设计、收集资料、整理资料、分析资料 E 搜集资料、整理资料、分析资料、进行推断 ¬¬ 统计工作哪个基本步骤: C D 分析资料 E 以上均不对 B 收集资料、整理资料、设计、统计推断 D 收集资料、整理资料、核对、分析资料 B 10. 以下何者不是实验设计应遵循的原则 D A 对照的原则 B 随机原则 C 重复原则 D 交叉的原则 E 以上都不对 第八章 数值变量资料的统计描述 11. 表示血清学滴度资料平均水平最常计算 B A 算术均数 B 几何均数 C 中位数 D 全距 E 率 12. 某计量资料的分布性质未 明,要计算集中趋势指标,宜选择 C A X B G C M D S E CV 13. 各观察值均加(或减)同一数后: B A 均数不变,标准差改变 B 均数改变,标准差不变 C 两者均不变 D 两者均改变 E 以上均不对 14. 某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24+(小时), 问 3.抽签的方法属于 D A 分层抽样 B 系统抽样 C 整群抽样 4.测量身高、体重等指标的原始资料叫: A 计数资料 B 计量资料 某种新疗法治疗某病患者 治愈 8 D 单纯随机抽样 E 二级抽样 5. 治疗结果 治疗人数 该资料的类型是: A 计数资料 6.样本是总体的 A 有价值的部分 D 任意一部分 显效 23 B C 等级资料 41 人, 好转 6 D 分类资料 治疗结果如下: 恶化 3 E 有序分类资料 计量资料 C B 有意义的部分 C 有代表性的部分 E 典型部分 C 无序分类资料 死亡 1 D 有序分类资料 E 数值变量资料 A 抽样误差 B 系统误差 C 随机误差 D 责任事故 E 以上都不对 C 某事件发生的可能性很小 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:

9住院医师规培考试 卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中,共发现病人231例。其中男性158例占68.40%,女性73例占31.60%,提示()* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时,其标准选择()* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平,欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平,应采用()* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟合回归直线,则其回归系数b值()*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是()* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 6、实验设计应遵循的基本原则是()* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时,统计量T为较小的秩和,则正确的是()* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

卫生统计学选择题(方积乾)汇编

一、选择题 (一)A1题 每一道题下面有A、B、C、D、E五个被选答案,请从中选择一个最佳答案。 1.下面的变量中,属于分类变量的是(B) A.脉搏 B.血型 C.肺活量 D.红细胞计数 E.血压 2.下面的变量中,属于定量变量的是(B) A.性别 B.体重 C.血型 D.职业 E.民族 3.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料属于(A) A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义变量资料 4.上述资料可以转换为(C) A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义变量资料 5.若要通过样本作统计推断,样本应是(C) A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 6.统计量(E) A.是统计总体数据得到的量 B.反映总体统计特征的量 C.是根据总体中的全部数据计算出的统计指标 D.是用参数估计出来的 E.是由样本数据计算出的统计指标7.因果关系(C) A.就是变量间数量上的联系 B.可以用统计方法证明 C.必定表现为数量间的联系 D.可以通过单独考察两个变量间关系得出 E.可以通过变量间数量上的联系来证明(二)A2型每一道题以一个小案例出现,其下面都有A、B、C、D、E五个备选答案,请从中选择3一个最佳答案。 1. 教材中提及美国人1954年实施了旨在评价Salk疫苗预防小儿麻痹或死于脊髓灰质 炎效果的临床试验。有180万儿童参与,约有1/4参与者得到了随机化。这180万儿童是(C) A.目标总体 B.研究总体 C.1份样本 D.1份随机样本 E.180万份样本 2.上述试验最终肯定了索尔克疫苗的效果。请问此结论是针对(C)而言。 A.180万儿童 B.每个儿童 C.所有使用索菲克疫苗的儿童 D.所有儿童 E.180万儿童中随机化的1/4 二、是非题 1.定量变量、分类变量和有序变量可以相互转换。(×) 2.假变量可以参与计算,所以假变量是定量变量。(×) 3.离散变量在数值很大时。单位为“千”或“万”时可以取小数值,此时可接近地视为连续型变量(√) 4.同质的个体间不存在差异。(×) 5.如果个体间有变异,则它们一定不是来自同一总体。(×) 选择题 (一)A1型 每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。 1.用频率表计算平均数时各组的组中值应为(E) A.本组段变量值的平均数 B.本组段变量值的中位数 C.本组段的上限值 D.本组段的下限值 E.(本组段上限值+本组段下限值)/2 2.离散型定量变量的频率分布图可以用(B)表达。

卫生统计学题库

《卫生统计学》考试题库 目录 第一章绪论 第二章定量资料的统计描述 第三章正态分布 第四章总体均数的估计和假设检验 第五章方差分析 第六章分类资料的统计描述 第七章二项分布与Poisson分布及其应用 第八章χ2检验 第九章秩和检验 第十章回归与相关 第十一章常用统计图表 第十二章实验设计 第十三章调查设计

第十四章医学人口统计与疾病统计常用指标第十五章寿命表 第十六章随访资料的生存分析 附录:单项选择题参考答案

第一章绪论 一、名词解释 1. 参数(parameter) 2. 统计量(statistic) 3. 总体 (population) 4. 样本(sample) 5. 同质(homogeneity) 6. 变异 (variation) 7. 概率 (probability) 8. 抽样误差 (sampling error) 二、单选题 1.在实际工作中,同质是指: A.被研究指标的影响因素相同 B.研究对象的有关情况一样 C.被研究指标的主要影响因素相同 D.研究对象的个体差异很小 E.以上都对 2. 变异是指: A.各观察单位之间的差异 B.同质基础上,各观察单位之间的差异 C.各观察单位某测定值差异较大 D.各观察单位有关情况不同 E.以上都对3.统计中所说的总体是指: A.根据研究目的而确定的同质的个体之全部 B.根据地区划分的研究对象的全体 C.根据时间划分的研究对象的全体 D.随意想象的研究对象的全体 E.根据人群划分的研究对象的全体 4. 统计中所说的样本是指: A.从总体中随意抽取一部分 B.有意识地选择总体中的典型部分 C.依照研究者的要求选取有意义的一部分 D.从总体中随机抽取有代表性的一部分 E.以上都不是 5.按随机方法抽取的样本特点是:

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

卫生统计学试卷(附答案)

2004~2005学年第(1)学期预防医学专业本科 期末考试试卷 (卫生统计学课程) 姓名____________________ 班级____________________ 学号____________________ 考试时间:200 年月日午 —(北京时间)

一、选择题(每题1分,共60分) 1、A1、A2型题 A. 48.0 B. 49.0 C. 52.0 D .53.0 E.55.0 2. 比较7岁男童与17岁青年身高的变异程度,宜用: A. 极 差 B. 四分位数间距 C. 方差 D. 标准差 E. 变异系数 3. 根据观测结果,已建立y 关于x 的回归方程? 2.0 3.0y x =+,该回归方程表示x 每增加1个单位,y 平均增加几个单位? A. 1 B. 2 C. 3 D. 4 E.5 4. 设从 5.11=μ的总体中作五次随机抽样(n =5),问哪一个样本的数据既精确又准确? A. 8,9,10,11,12 B. 6,8,10,12,14 C. 6,10,12,14,18 D. 8,10,12,14,16 E. 10,11,12,13,14 5. 为表示某地近20年来婴儿死亡率的变化情况,宜绘制 A.散点图 B. 直条图 C. 百分条图 D. 普通线图 E. 直方图 6. 临床上用针灸治疗某型头痛,有效的概率为60%现用该法治疗5例,问其中至少2例有效的概率约为 A. 0.913 B. 0.087 C. 0.230 D.0.317 E. 以上都不对 7.二项分布、Poisson 分布、正态分布各有几个参数? A. 1,1,2 B. 2,1,2 C. 1,2,2 D. 2,2,2 E. 1,2,1 8. 假定某细菌的菌落数服从Poisson 分布,经观察得平均菌落数为9,问菌落数的标准差为: A. 18 B. 9 C. 3 D. 81 E. 27 9. 对于同一资料的直线相关系数与回归系数,下列论断有几句是正确的? 相关系数越大,回归系数也越大。 相关系数与与回归系数符号一致。 相关系数的t r 等于回归系数的t b 。 相关系数描述关联关系,回归系数描述因果关系。 A.1句 B.2句 C. 3句 D. 4句 E. 0句 10.下列四句话有几句是正确的? 标准差是用来描述随机变量的离散程度的。 标准误是用来描述统计量的变异程度的。 t 检验只用于检验两样本均数的差别。 χ2可用来比较两个或多个率的差别。 A. 0句 B. 1句 C. 2句 D. 3句 E. 4句

《卫生统计学》习题及答案

1.表示均数抽样误差大小的统计指标是( C )。 A)标准差B)方差 C)均数标准误D)变异系数 2.抽样研究中,s为定值,若逐渐增大样本含量,则样本( B )。 A)标准误增大B)标准误减少 C)标准误不改变D)标准误的变化与样本含量无关 3.均数标准误越大,则表示此次抽样得到的样本均数( C )。 A)系统误差越大B)可靠程度越大 C)抽样误差越大D)可比性越差 4.假设已知某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg,标准差为11.2 mmHg,后者反映的是( A )。 A)个体变异B)抽样误差 C)总体均数不同D)抽样误差或总体均数不同 5.配对计数资料差别的卡方检验,其备择假设是( D )。 A)p1=p2 B)p1≠p2 C)B=C D)B≠C 6.下列关于总体均数可信区间的论述是正确的,除了( C )外。 A)总体均数的区间估计是一种常用的参数估计 B)总体均数可信区间所求的是在一定概率下的总体均数范围 C)求出总体均数可信区间后,即可推断总体均数肯定会在此范围内

D)95%是指此范围包含总体均数在内的可能性是95%,即估计错误的概率是5% 试题来源:【2016公卫执业医师考试宝典免 费下载】 小编教你如何快速通过公卫执业医师考试 查看其他试题,请扫描二维码,立即获得本 题库手机版详情咨询 7.总体率可信区间的估计符合下列( C )情况时,可以借用正态近似法处理。 A)样本例数n足够大时B)样本率p不太大时 C)np和n(1-p)大于5时D)p接近1或0时 8.正太近似法估计总体率95%可信区间用( D )。 A)p±1.96s B)p±1.96σ C)p±2.58σD)p±1.96sp 9.统计推断的内容( C )。 A)用样本指标估计相应总体指标B)假设检验 C)A和B答案均是D)估计参考值范围 10.关于假设检验,下列哪个是正确的( A )。 A)检验假设是对总体作的某种假设 B)检验假设是对样本作的某种假设

卫生统计学重点整理资料东大

卫生统计学 第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3): 设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4): ⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称 之为同质,或具有同质性。 ⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。 ⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。 ⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。样本中 包含的观察单位个数成为样本含量。 ⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总 体均数μ、总体率π等。 ⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本 均数?x 、样本率ρ等。 ⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变 量;变量值的集合成为资料。 ⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般 有度、量、衡单位。 ⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别 或属性,一般无度、量、衡单位。可细分为:①计数资料;②等级资料第二章调查研究设计

★1、调查研究的特点(P7): ①不能人为施加干预措施;②不能随机分组; ③很难控制干扰因素;④一般不能下因果结论 2、常用抽样方法(名称、原理): ⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数 字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察单位按某一 顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将总体分成若 干层,该特征的测定值在层内变异较小,层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。 ⑷整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组 成,随机抽取一部分群,调查抽中群的全部次级观察单位。 第三章实验设计 ★1、实验设计的特点(注意与调查研究的特点的区别): ⑴研究者可人为设置处理因素; ⑵受试对象接受何种处理因素或处理因素的何种水平是随机的。 ★2、实验设计的三要素、四原则: ⑴基本要素:①处理因素②受试对象③实验效应 ⑵基本原则:①对照原则②随机原则③重复原则④均衡原则 4、实验设计的基本步骤: ⑴明确实验目的;⑵确定研究对象;⑶确定可比的实验组和对照组; ⑷确定把受试对象分配到各处理组中的原则;⑸确定样本含量; ⑹确定方法和指标;⑺偏倚及其控制 5、常用的实验设计方案:主要掌握完全随机设计和配对设计。 第四章定量资料的统计描述 ★1、频数表的编制:①求极差②确定组数和组距(一般8~15组)

卫生统计学题库55974

盛年不重来,一日难再晨。及时宜自勉,岁月不待人。 最佳选择题 1.收集资料的方法是:E A.收集各种报表 B.收集各种工作记录 C.进行专题调查 D.进行科学实验 E.以上都对 2.统计工作的基本步骤是:D A.调查资料、审核资料、整理资料 B.收集资料、审核资料、分析资料 C.调查资料、整理资料、分析资料 D.收集资料、整理资料、分析资料 E.以上都对 3.在抽样研究中样本是:D A.总体中的一部分 B.总体中任意一部分 C.总体中典型部分 D.总体中有代表性的一部分 E.总体中有意义的一部分 4.计量资料、计数资料和等级资料的关系是:C A.计量资料兼有计数资料和等级资料的一些性质 B.计数资料兼有计量资料和等级资料的一些性质 C.等级资料兼有计量资料和计数资料的一些性质 D.计数资料有计量资料的一些性质 E.以上都不是 5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度,宜绘制D : A.普通线图 B.直方图 C.构成比直条图 D.半对数线图 E.直条图 6.直方图可用于: A.某现象的内部构成 B.各现象的比较 C.某现象的比较 D.某现象的频数分布 E.某现象的发展速度 7.统计图表的要求是: A.简单明了 B.层次清楚 C.说明问题明确 D.避免臃肿复杂 E.以上都对 8.在列频数表时,分组数目一般为: A.5-10 B.8-15 C.10-30 D.15-20 E.>20 9.平均数作为一种统计指标是用来分析: A.计数资料 B.计量资料 C.等级分组资料 D.调查资料 E.以上都不对 10.表示变量值变异情况的常用指标是: A.全距 B.标准差 C.方差 D.变异系数 E.以上均是 11.确定正常人某个指标正常值范围时,调查对象是: A.从未患过病的人 B.健康达到了要求的人 C.排除影响被研究指标的疾病和因素的人 D.只患 过小病但不影响研究指标的人 E.排除了患过某病或接触过某因素的人 12.标准误: A.与标准差呈反比 B.与标准差呈正比 C.与标准差的平方呈反比 D.与标准差平方呈正比 E.以上都不对 13.是指: A.所有观察值对总体均数的离散程度 B.某一个样本均数的离散程度 C.所有样本均数对总体均数的离散程度 D.某些样本均数对总体均数的离散程度 E.所有含量相同的样本均数对总体均数的离散程度 x

卫生统计学考试题及答案要点

《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 P的含义假设检验中21. 型错误II I型和22. 检验效能23. 24.检验水准方差分析25. 26.随机区组设计27.相对数- 1 - 28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 二、单项选择题

1.观察单位为研究中的( D )。 A.样本B.全部对象 C.影响因素D.个体 2.总体是由(C )。 A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是(B )。 A.研究样本统计量B.由样本统计量推断总体参数 C.研究典型案例研究误差D.研究总体统计量 4.参数是指( B )。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的(A )。 - 2 - .抽样时应使得总体中的每一个个体都有同等的机会被抽取A .研究者在抽样时应精心挑选个体,以使样本更能代表总体B .随机抽样即随意抽取个体C .为确保样本具有更好的代表性,样本量应越大越好D B )。6.各观察值均加(或减)同一数后( .均数改变,标准差不变BA.均数不变,标准差改变 .两者均改变 D .两者均不变C )。7.比较身高和体重两组数据变异度大小宜采用(A B.方差.变异系数 A D.标准差C.极差 D )可用来描述计量资料的离散程度。8.以下指标中( .几何均数 B A.算术均数 D.标准差C.中位数 )。9.血清学滴度资料最常用来表示其平均水平的指标是(C B.中位数A.算术平均数 D.平均数C.几何均数 。)10.两样本均数的比较,可用(C 检验B.t A.方差分析 .方差齐性检验 D C.两者均可 ?。D 11.配伍组设计的方差分析中,)等于(配伍???? A.--B.总误差总处理?????? D.---C.+处理总误差总处理误差??|X??|?,的正态总体中随机抽样,)的概率为5% 。12.在均数为标准差为( B tSst?1.96 C.D. A. B.?1.96??,,X20.0520.05X13.完全随机设计方差分析的检验假设是(D )。 A.各处理组样本均数相等B.各处理组总体均数相等 C.各处理组样本均数不相等D.各处理组总体均数不全相等 14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( D )。 2检验χB A.分别进行比较.两个率比较的 - 3 -

相关文档
相关文档 最新文档