文档库 最新最全的文档下载
当前位置:文档库 › 《卫生统计学》练习题

《卫生统计学》练习题

《卫生统计学》练习题
《卫生统计学》练习题

《卫生统计学》练习题

一、 判断题

1、某地1956年婴儿死亡人数中死于肺炎占18%,1976年则占16%,故认 为20年来

对婴儿肺炎的防治效果不明显。(× )

2、研究人员测量了2006例患者外周血的红细胞数,所得资料为计数资料。( × )

3、当样本含量越大时,率的标准误越大。 ( × )

4、统计分析包括统计描述和统计推断。( √ )

5、只要增加样本含量到足够大,就可以避免Ⅰ和Ⅱ型错误( × )

6、变异系数总是小于1 ( )

7、若两样本均数比较的假设检验结果P 值等于0.000,则说明差异非常大。( × )

8、非参数统计方法是用于检验总体中位数、极差等总体参数的方法。( × )

9、同一资料的r 值越小,则b 值越小。( × )

10、两个大样本均数的比较,Z 检验比t 检验要准确。×

11、样本量增大时,可同时减少第一类错误和第二类错误。( )

12、收集资料是统计工作的的基础,因此要求及时、准确和完整。( )

13、个体间的变异是抽样误差的主要来源。( )

14、两样本率比较可采用Z 检验,也可采用四格表 2 检验。( )

16、直线回归反映两变量间的依存关系,而直线相关反映两变量间的相互直线关系。(

) 17、两变量关系越密切r 值越大。( )

18、.描述一群呈正态分布变量值的集中位置,可选用平均数。(× )

19、对于任何分布的资料,9010P ~P 范围内包含了80%的变量值。( )

20、对于任何分布的资料,1595~P P 范围内包含了80%的变量值。( )

21、对于任何分布的资料,P 5~P 95范围内包含了90%的变量值。( )

22、用某药治疗某种病患者4例、3例治愈,不计算治愈率为75%,其理由是推断总

体治愈率的可信区间太宽 ( )

23、某病住院日的分布呈中间高两边低,平均住院日为10天,中位数为5天,可以

看出住院日的分布是正偏态峰的 ( )

24.某病住院日的分布呈中间高两边低,平均住院日为5天,中位数为10天,可以看

出住院日的分布是正偏态峰的。( × )

25、抽样误差是表示个体值与总体参数值之差。( × )

26、搜集资料是统计工作的基础,因此要求及时准确完整。( )

27、通常单侧检验较双侧检验更为灵敏,更为检验出差别,因此宜广泛使用(× )

28、正态分布一定是对称分布,故对称分布必为正态分布。( × )

29、正态分布中均数和中位数相等。( )

30、若两样本均数比较的假设检验结果P 值远远小于0.01,则说明差异非常大(× )

31、若两样本率比较的假设检验结果P 值等于0.000,则说明差异非常大。(× )

32、对同一参数的估计,99%可信区间比90%可信区间好。( × )

33、某儿童保健所,测定100名同年龄性别儿童的身高、体重和胸围 ,可用方差分

析来检验这三项指标差异有无显著性。( × )

34、均数总是比标准差大。( × )

35、均数总是大于中位数。( × )

36、样本均数大时,标准差也一定会大。(× )

37、变异程度的指标数值越小,均数代表性越好。( )

38、、方差分析的基本思想SS 总=SS 组间+SS 组内。 ( )

39、完全随机设计的方差分析中,必然有 SS 总=SS 组间+SS 组内。( )

40、某化工厂某病连续4年患病率分别为6.30%、9.7%、11.0%、15.4%,则该病4年

总 患病率为:(6.0+9.7+110.0+15.4)/4=10.53% ( × )

41、因秩和检验适用范围广泛,故对资料进行统计处理时,首选秩和检验 ( × )

42、四个样本率做比较,2)3(05.02χχ> ,可认为各总体率不全相等。

( ) 43、四个样本率比较的假设检验,2)3(05.02χχ> ,可认为各总体率均不相等。×

44、x .y S 愈大,说明实测点距回归直线的纵向距离愈近。( × )

45、百分条图表示事物各组成部分在总体中所占比重,以长条的全长为100%,按资料的大

小或逻辑顺序依次进行绘制。( )

46、 “最小二乘”是指观察值和回归方程计算值之差的总和最小。( × )

47、 多组均数比较的方差分析的Dunnett 检验适用于多个均数两两之间的全面比较。

( ? )

48、相关系数的假设检验P 值愈小,则说明两变量X 与Y 的关系愈密切。 ( × )

49、可直接比较不同地区寿命表中的预期寿命。( )

50、同一资料中样本回归系数b<0,P>0.05,可认为两变量呈负相关。 ( × )

51、同一资料的r>0,则b<0。( × )

52、计量资料、计数资料和等级资料可根据分析需要相互转化。( )

53、圆图表示事物各组成部分在总体中所占比重,以圆的面积表示事物的全部,用扇形的面

积表示各部分的比重。( )

54、条图、线图和半对数线图都有纵轴与横轴且它们的纵轴单位都要从0开始。(× )

55、对同一个样本资料必然有 , 。 ( × )

56、统计推断包括总体均数或总体率的估计及其假设检验。( )

57、假设检验的作用是检验是否存在随机抽样误差。( × )

58、标化率都可直接进行比较。(× )

59、Sy.x 为观察值y 距回归直线的标准差,如果变量x 与y 的相关系数r=1,则Sy.x

=0。 ( )

60、σ已知时,总体均数的95%可信区间可用x ±1.96σ表示。 ( )

61、如果直线相关系数r =1,则SS 总=SS 回。 ( )

62、如果样本不是通过随机抽样得来的,假设检验就失去意义。 ( )

二、最佳选择题

1、计算某抗体滴度的平均水平,一般选择 ( )

A 、X

B 、G

C 、M

D 、S

2、偏态分布宜用( )描述其分布的集中趋势。

A 、算术均数

B 、标准差

C 、中位数

D 、四分位数间距

3、描述一组偏态分布资料的变异度,以( )指标较好。

A 、全距

B 、 标准差

C 、变异系数

D 、四分位数间距

4、总体是由 ( )

A .个体组成 B. 研究对象组成

C .同质个体组成 D. 研究指标组成

5、观察单位为研究中的()

A.样本 B. 全部对象

C.影响因素 D. 个体

6、关于标准差,那项是错误的。()

A.反映全部观察值的离散程度

B.度量了一组数据偏离平均数的大小

C.反映了均数代表性的好坏

D.不会小于算术均数

7、标准正态分布的均数与标准差分别为()

A.0与1

B.1与0

C.0与0

D.1与1

8、以下指标中( D )可用来描述计量资料的离散程度。()

A、算术均数

B、几何均数

C、中位数

D、标准差

9、将100名病人随机等分成两组后分别给予A、B方案治疗,疗效按等级划分为治愈、好转、有效和无效。欲知两种方案的疗效何者较优,宜作

A、两样本均数比较的t检验

B、两组多类构成比比较的χ2检验

C、两样本率比较的假设检验

D、两样本比较的秩和检验

10、对于配对比较的秩和检验,其检验假设为()。

A、样本的差数应来自均数为0的正态总体

B、样本的差数应来自均数为0的非正态总体

C、样本的差数来自中位数为0的总体

D、样本的差数来自方差齐性和正态分布的总体

11、由样本均数估计总体均数可靠性大小的指标是:()

A、标准差S

B、标准误

C、方差

D、变异系数

12、两样本均数比较的t检验,差别有统计意义时,P越小,说明()。

A、两样本均数差别越大

B、两总体均数差别越大

C、越有理由认为两总体均数不同

D、越有理由认为两总体均数相同

13、各观察值均加或均减同一位数后:()

A、均数不变,标准差改变

B、均数改变,标准差不变

C、两者都改变

D、两者都不变

14、配对样本差值的Wilcoxon符号秩检验,确定P值的方法为()。

A、T越大,P越大

B、T越大,P越小

C、T值在界值范围内,P小于相应的α

D、T值在界值范围内,P大于相应的α

15、标准正态分布曲线下中间90%的面积,所对应横轴尺度U的范围是()

A、-1.645到+1.645

B、-1.960到+1.960

C、-2.580到+2.580

D、-1.68到+1.960

,可认为:()

16、四个样本率作比较,Х2 >Х2

0.01(3)

A、各总体率不等或不全相等

B、各总体率均不相等

C、各样本率均不相等

D、各样本率不等或不全相等

17、为了由样本推断总体,样本应该是:()

A、总体中任意一部分

B、总体中的典型部分

C、总体中有意义的一部分

D、总体中有代表性的一部分

18、要评价某市一名8岁女孩的身高是否偏高或偏矮,应选用的统计方法是:()

A、用该市8岁女孩的身高的95%或99%参考值范围来评价

B、作身高差别的假设检验来评价

C、用身高均数的95%或99%可信区间来评价

D、不能作评价

19、用某药治疗某种病患者5例,4例治愈,宜写为4/5,而不计算治愈率为80%,其理由

是( )

A 、样本治愈率的可信区间太宽

B 、样本治愈率的可信区间太窄

C 、总体治愈率的可信区间太宽

D 、总体`治愈率的可信区间太窄

20、样本均数的抽样误差是不可避免的,下述哪种情况使其减少。( )

A 、设法减少总体标准差

B 、设法减少样本标准差

C 、设法增大总体标准差

D 、增大样本含量

21、甲乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1

X 和21S ;2X 和22S ,则理论上( )。

A 、12X X =

B 、2212S S =

C 、由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括0

D 、作两方差齐性的F 检验,必然方差齐

22、数列8、-3、5、0、1、4、-1的中位数是( )。

A 、2

B 、1

C 、2.5

D 、0.5

23、某地2006年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L ,标准

差为4g/L ,则其95%的参考值范围( )。

A 、74±4?4

B 、74±1.96?4

C 、74±2.58?4

D 、74±2.58?4÷10

24、下述资料用何种指标反映抗体平均滴度较合适( )

抗体滴度:≤1:4 1:8 1:16 1:32 1:64

人 数 : 8 12 16 14 7

A 、几何均数

B 、中位数

C 、算术均数

D 、中位数和几何均数

25、一组变量的标准差将( )。

A.随变量值的个数 n 的增大而增大

B.随变量值的个数 n 的增加而减小

C.随变量值之间的变异增大而增大

D.随系统误差的减小而减小

26、参数是指( )。

A 、参与个体数

B 、描述总体特征的统计指标

C 、描述样本特征的统计指标

D 、样本的总和

27、正态分布有两个参数μ与σ,( )相应的正态曲线的形状越扁平。

A 、μ越大

B 、μ越小

C 、σ越大

D 、σ越小 28、从样本得到变量X 与Y 的相关系数r =0.92, 则

A 、X 与Y 之间一定存在因果关系

B 、若对此份资料作回归分析, 其回归系数是正值

C 、若对此份资料作回归分析, 其回归系数是负值

D 、表明总体相关系数ρ≠0

29、已知r =1,则一定有( )。

A 、b =1

B 、a =1

C 、b>0

D 、b<0

30、符合方差分析检验条件的成组设计资料如果采用秩和检验,则( )。

A 、第一类错误增大

B 、第二类错误增大

C 、第一类错误减小

D 、第二类错误减小

31、某地调查25岁男大学生2009名,身高标准差为4.09cm,体重标准差为4.10kg,比较两者

的变异程度,结果 ( )

A. 体重变异度大

B.身高变异度较大

C.两者变异度相同

D.由单位不同,两者标准差不能直接比较

32、数列7、-3、5、0、1、2、-1的中位数是()

A. 2

B. 1

C. 2.5

D.0.5

33正态曲线下,横轴上,从均数到+∞的面积为( )。

A.95%

B.50%

C.97.5%

D.不能确定(与标准差的大小有关)

34、多样本计量资料的比较,当分布类型不清时选择()。

A、t检验

B、2χ检验

C、u检验

D、H检验

35、等级资料比较宜用:()

A. t检验

B.χ2检验

C.秩和检验

D.F检验

36、关于标准差,那项是错误的()。

A、反映全部观察值的离散程度

B、度量了一组数据偏离均数的大小

C、反映了均数代表性的好坏

D、不会小于算术均数

37、完全随机设计方差分析中的组间均方是()的统计量。

A、表示抽样误差大小

B、表示某处理因素的效应作用大小

C、表示某处理因素的效应和随机误差两者综合影响的结果

D、表示n个数据的离散程度

38、配对设计资料的符号秩检验中,如相同秩次过多,未计算校正u c值,而计算u值,不

拒绝H0时()。

A、第一类错误增加

B、第一类错误减少

C、第二类错误增加

D、第二类错误减小

39、行×列表的χ2检验应注意:()

A.任一格理论数小于5,则要用校正公式

B.任一格理论数小于5,则要将相应组合并

C.若1/5以上格子理论数小于5,则要用校正公式

D.若1/5以上格子理论数小于5,则要考虑合理并组

40、配对比较的秩和检验的基本思想是:如果假设成立,则对样本来说:()

A.正秩和的绝对值大于负秩和的绝对值

B.负秩和的绝对值大于正秩和的绝对值

C.正秩和与负秩和的绝对值相等

D.正秩和与负秩和的绝对值不会相差很大

41、设配对设计资料的变量值为X1和X2,则配对资料的秩和检验()

A.把X1与X2的差数绝对值从小到大编秩

B.把X1和X2综合从小到大编秩

C.把X1和X2综合按绝对值从小到大编秩

D.把X1与X2的差数从小到大编秩

42、表示某地区某年各种死因的构成比,可绘制()

A. 条图

B. 圆图

C. 直方图

D. 统计地图

43、比较某地在两个年份几种传染病的发病率可用()

A. 构成比条图

B. 复式条图

C. 线图

D. 直方图

44、欲比较两地20年来冠心病和恶性肿瘤死亡率的上升速度,最好选用()

A. 普通线图

B. 半对数线图

C. 条图

D. 直方图

45、调查某地6至16岁学生近视情况,需描述近视学生的年龄分布可用()

A. 普通线图

B. 半对数线图

C. 条图

D. 直方图

46、、图示7岁男童体重与胸围的关系,宜绘制:()

A.条图

B.散点图 D.线图 E.直方图

47、以下关于参数点估计的说法正确的是()

A、CV越小,表示用该样本估计总体均数越可靠

B、B、

σ越小,表示用该样本估计总体均数越准确

X

C、

σ越大,表示用该样本估计总体均数的可靠性越差

X

D、S越小,表示用该样本估计总体均数越可靠

48、从样本得到变量X与Y的相关系数r=0.99, 则()

A.X与Y之间一定存在因果关系

B.若对此份资料作回归分析, 其回归系数是正值

C.若对此份资料作回归分析, 其回归系数是负值

D.表明总体相关系数ρ≠0

49、如果直线相关系数r=1,则一定有()。

A、SS总=SS残

B、SS残=SS回

C、SS总=SS回

D、SS总>SS回

50、直线回归系数假设检验,其自由度为( )。

A、n

B、n-1

C、n-2

D、2n-1

51、在两样本均数比较的t检验中,无效假设是()。

A、两样本均数不等

B、两样本均数相等

C、两总体均数不等

D、两总体均数相等

52、某病患者9人的潜伏期如下:1、2、3、3、3、4、5、6、30则平均潜伏期为()

A.均数为7天,很好的代表了大多数的潜伏期

B.中位数为3天

C.中位数为4天

D.中位数为3.5天,不受个别人潜伏期长的影响

53、两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小()A.α=0.05 B.α=0.01 C.α=0.15 D.α=0.20

54、()小,表示用该样本均数估计总体均数的可靠性大。

D、R

A、CV

B、S

C、σ

X

55、正态曲线下、横轴上,从均数到均数+1.96倍标准差的面积为()

A.98.5%

B.45%

C.97.5%

D.47.5%

56、正态曲线下、横轴上,从均数-2.58倍标准差到均数的面积为()

A.49.5% B.45% C.97.5% D.98.5%

57、正态曲线下、横轴上,从均数-1.96倍标准差到均数的面积为( )。

A、95%

B、45%

C、97.5%

D、47.5%

58、通常可采用以下那种方法来减小抽样误差:()

A、减小样本标准差

B、减小样本含量

C、扩大样本含量

D、以上都不对

59、完全随机设计方差分析的检验假设是()。

A、各处理组样本均数相等

B、各处理组总体均数相等

C、各处理组样本均数不相等

D、各处理组总体均数不相等

60、第一类误差α和第二类误差β的关系有:()

A.α>β

B.α<β

C.α愈大β愈大

D.α愈大β愈小

61、对同一种患者分两组(每组100人)用两种方法治疗,甲法有效60人,无效40 人;乙法有效50人,无效50人。若要检验甲法和乙法的疗效有无差别,采用()

A. t检验或非参数T检验

B. χ2检验或t检验

C. χ2检验或u 检验

D. χ2检验或H 检验

62、 关于构成比的叙述,下列哪项是正确的? ( )

A.反映某现象发生的强度

B.反映某事物内部各部分占全部构成的比重

C.既反映某现象发生的强度,也反映某事物内部各部分占全部构成的比重

D.表示两个同类指标的比

63、以下指标中__________可用来描述计量资料的离散程度。

A.算术均数

B.几何均数

C.中位数

D.标准差

64、以下说法正确的是 ( )

A .两个样本率的比较可用u (Z )检验也可用2χ检验

B .两个样本均数的比较可用u (Z )检验也可用2χ检验

C .对于多个率或构成比的比较,u (Z )检验可以替代2χ检验

D .对于两个样本率的比较,2χ检验比u (Z )检验可靠

65、某地2008年随机抽取100名健康女性,算得其血清总蛋白含量的均数为72g/L ,标准

差为4g/L ,则其95%的参考值范围 ( )

A.72±4?4

B.72±1.96?4

C.72±2.58?4

D.72±2.58?4÷10

66、关于标准差,那项是错误的 。 ( )

A.反映全部观察值的离散程度

B.度量了一组数据偏离平均数的大小

C.反映了均数代表性的好坏

D.不会小于算术均数

67、用最小二乘法确定直线回归方程的原则是各观察点 ( )

A .距直线的纵向距离相等

B .距直线的纵向距离的平方和最小

C .与直线的垂直距离相等

D .与直线的垂直距离的平方和最小

68、方差分析结果,F 处理>12

0.05,(,)F νν,则统计推论是 ( ) A. 各总体均数不全相等 B. 各总体均数都不相等

C. 各样本均数都不相等

D. 各总体方差不全相等

69一组变量的标准差将 ( )

A.随变量值的个数n 的增大而增大

B.随变量值的个数n 的增加而减小

C.随变量值之间的变异增大而增大

D.随系统误差的减小而减小

70、随机区组设计要求 ( )

A .区组内个体差异小,区组间差异大

B .区组内没有个体差异,区组间差异大

C .区组内个体差异大,区组间差异小

D .区组内没有个体差异,区组间差异小

三、计算分析题

1、用甲乙两种方法检查已确诊的乳腺癌患者120名。甲法的检出率为60%,乙法的

检出率为50%,甲、乙两法一致的检出率为35%,问:

(1)该资料为何种设计类型?属于什么性质的资料?

(2)列出计算检验统计量的计算表

(3)甲、乙两法何者为优?

(4)据你所作的结论,可能犯何种类型的统计错误?

2、用两种方法对80例腺病毒性肺炎患者进行检测。其中两种方法均为阳性者40 例;两种

方法均为阴性者20例;甲法阳性乙法阴性者9例;甲法阴性乙法阳性者11例。 (1)该资料为何种设计类型?属于什么性质的资料?

(2)列出计算检验统计量的计算表。

(3)分别计算两种方法检测的阳性率。

(4)甲、乙两法何者为优?

(5)据你所作的结论,可能犯何种类型的统计错误?

3、某医生随机检测了某地225名健康成年男子的血清胆固醇含量,得X=4.0(mmol/L),S=0.6(mmol/L)。

(1)、指出本研究的总体、观察单位(或研究单位)和变量。

(2)、本研究的抽样误差为多少?

(3)、试估计某地健康成年男子的血清胆固醇含量总体均数的95%的可信区间。

(4)、试估计某地健康成年男子的血清胆固醇含量的95%的医学参考值范围。

(5)指出

X

S减少代表的意义。

4、某医生随机检测了某地400名健康成年男子的某指标值,得X=10.0,S=1.20。

(1)、指出本研究的总体和观察单位(或研究单位)。

(2)、本研究的抽样误差为多少?

(3)、试估计某地健康成年男子的某指标值总体均数的99%的可信区间。

(4)试估计某地健康成年男子的某指标值的95%的医学参考值范围。

(5)指出

X

S减少代表的意义。

5、某胸科医院,同时用甲、乙两法测定200份痰标本中的抗酸杆菌,结果如下表。问甲、

乙两法的检出率有无差别?

甲、乙两法检测痰标本中的抗酸杆菌结果

甲法

乙法

+-合计

+48 28 76

-22 102 124

合计70 130 200

6、某地随机抽样调查了部分健康成男性的红细胞数和血红蛋白量,结果如下表:

某年某地健康成年人的红细胞数和血红蛋白含量

指标例数均数标准差标准值*

红细胞数(1012/L)225 4.79 0.50 4.84

血红蛋白(g/L)225 136.0 6.2 140.0 请就上表资料:

(1)说明男性的红细胞数与血红蛋白含量的变异程度何者为大?

(2)计算男性两项指标的抽样误差。

(3)试估计该地健康成年男性红细胞数的均数。

(4)该地男性红细胞数是否均低于上表的标准值(若测定方法相同)

7、某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果如下表:

某年某地健康成年人的红细胞数和血红蛋白含量

指标性别例数均数标准差

红细胞数(1012/L)男100 4.50 0.50 女225 4.00 0.30

血红蛋白(g/L)男100 130.0 8.0 女225 120.0 10.0

请就上表资料:

(1)说明女性的红细胞数与血红蛋白的变异程度何者为大?

(2)计算男性两项指标的抽样误差。

(3)试估计该地健康成年女性红细胞数的均数。

(4)比较该地健康成年男、女血红蛋白含量是否不同,应使用何种假设检验方法?(不

必计算)

(5)若计算得到的检验统计量大于相应检验水准α=0.05时该检验统计量的临界值时,你

如何下结论?可能犯何种类型的统计错误?犯错误的概率有多大?(5分)

8、某医科大学附属医院对120例曾用过洋地黄药与50例未用过洋地黄药的肺心病患者作心

电图检查,结果曾用过洋地黄药患者发生心律失常80例,未用过洋地黄药患者发生心律失

常20例。

(1)该研究为何种类型的设计?属于什么性质的资料?

(2)列出计算检验统计量的计算表

(3)两组病人的心律失常发生率有无差别?

(4)据你所作的结论,可能犯何种类型的统计错误?

9、某研究人员采用不同浓度的含铅饲料喂养大白幼鼠,以观察铅污染对幼鼠脑铅含量的影响,资料如下:

不同铅浓度的饲料对幼鼠脑铅含量的影响

组别 n 脑铅含量±S(10-4

低剂量组 6 5.226±0.627

高剂量组 6 6.418±0.772

对照组 6 4.778±0.579

研究者用成组比较t检验对三组脑铅浓度做假设检验,结果表明:高剂量组与对照组差别有

统计学意义(P<0.05),而低剂量组与对照组差别无统计学意义(P>0.05)。你认为此分析

方法是否合理,为什么?简述其理由,并请提出你认为合理的分析方法。(写出具体步骤,

不必计算)

10、某医院对12例慢性苯中毒患者用中草药抗苯一号治疗,测得白细胞计数如下:(单

位:10 9/L)

患者编号 1 2 3 4 5 6 7 8 9 10 11 12

治疗前 6.0 4.8 5.0 3.4 7.0 3.8 6.0 3.5 4.3 4.9 6.4 5.3

治疗后 4.2 5.4 6.3 3.8 4.4 4.0 5.9 3.0 5.0 5.1 6.5 4.8

问:

(1) 该实验设计属何种设计?

(2) 该资料属何种类型资料?

(3)欲分析该药对白细胞数是否有影响,宜选用何种假设检验方法?

(4) 若计算得到的检验统计量大于相应检验水准α=0.05时该检验统计量的临界值时,你如何下结论?可能犯何种类型的统计错误?犯错误的概率有多大?

11、为探讨复方黄芪冲剂治疗佝偻病的疗效,某医师将80例患者随机分为两组, 复方黄芪冲

剂治疗50例,有效25例,有效率50.0%,钙片组治疗30例,12例有效,有效率40.0%。(1)该研究为何种类型的设计?

(2)属于什么性质的资料?

(3)列出计算检验统计量的计算表。

(4)计算理论频数。

(5)两药治疗慢性咽炎的有效率有无差别?

12、用兰芩口服液治疗慢性咽炎患者100例,有效者60例;用银黄口服液治疗慢性咽炎患

者80例,有效者20例。

(1)该研究为何种类型的设计?属于什么性质的资料?

(2)列出计算检验统计量的计算表

(3)两药治疗慢性咽炎的有效率有无差别?

(4)据你所作的结论,可能犯何种类型的统计错误?

四、名词解释

1、总体

2、抽样误差

3、标准误

4、标准差

5、变异

6、极差

7、参数检验

8、非参数

检验9、参数10、参数估计11、统计推断12、统计量13、中位数14、四分位数间距15、正态分布16、标准正态分布17、率18、构成比19、直线回归20、直线相关21、相关系

数22、回归系数23.抽样误差24、变异系数

五、填空题

1、统计分析包括和。

2、统计推断包括两个重要方面是_____________和_____________。

3、四分位数间距是——和——的差。

4、描述正态分布的计量资料两个参数是和。

5、常用的统计资料类型分、和。

6、常用平均数有均数、———和中位数。

7、血清学滴度资料最常用来表示其平均水平的指标是_____________。

8、常用相对数有率、和相对比。

9、总体均数区间估计的两个要素是和。

10、t检验分布曲线的形状与———有关。

检验的自由度为。

11、成组t检验的自由度为,2

12、四格表资料的χ2检验,其自由度为_____________。

13、t 检验分布曲线的形状与_____________有关。

14、随机区组设计的方差分析,可将总变异分解为———————————。

15、变异系数用于①———————————————————————;

②———————————————————————。

16、正态分布曲线下,横轴上从μ-1.96σ到μ范围内的面积为_____________。

17、横轴上,正态曲线下,从μ-1.96σ到μ+2.58σ的面积为 。

18、S —

X 大小与 成正比。

19、确定医学正常值范围,习惯上以95%为界值。若资料是正态分布,应计算(双侧)________________,若资料呈偏态分布,应计算_________________及____________________。

20、X 服从N (5,22)的正态分布,X 的50P 为———。

21、X 服从N (3,22)的正态分布,X 的5.97P 为:———。

22.X 服从N (5,22)的正态分布,X 的 2.5P 为:_____________。

23、X 服从N (4,22)的正态分布,X 的5.97P 为:_____________。

24、对于任何分布的资料,955P ~P 的范围包含了 变量值。

25、比较某地区某时期三种疾病的发病率在各年度的发展速度,应该绘制 。

26、某地1980年~1990年结核病死亡率变动趋势应绘制_____________图;表示两种现象

间的相关关系绘制_____________图。

27、表示事物发展速度的资料宜用_____________图,说明某现象随另一现象变迁的资料

宜用_____________图。

28、反映某地某种传染病随时间变化的速度宜绘制______________________图。

29、Sp p 96.1 表示———————————————————————。

30、率的抽样误差,通常用_____________表示。

31、随机区组设计的方差分析,可将总变异分解为_____________。

32、完全随机设计的方差分析,可将总变异分解为———————————。

33、资料8、3、2、7、10的算术均数等于_____________,其中位数等于_____________。

34、两个样本均数比较的t 检验,其应用条件为:————————————————

和—————————————————。

35、变量系数常用于: ○

1_________;○2_____________。 36、两个率比较的χ2检验,其自由度为———。

37、三个样本率比较的χ2检验,其自由度为_____________。

38、根据资料的 和 选用合适的统计图。

39、相关系数r 的假设检验,H 0表示为———————。

40、回归系数b 的假设检验,H 0表示为———————。

41、t 检验的应用条件○

1__________________________○2_______________________○3__________________。

42、收集资料的任务是取得________________ 的原始资料,而整理资料的目地是使原始

数据处理_______________ 便于进一步计算和分析指标。

43、对于多个样本的秩和检验,当R=3,ni>5时,应查_________________表。

44、正态分布的两个参数是_____________和_____________。

45、σ是指———对μ的离散程度;X σ是指———对μ的离散程度。

46、非参数检验较参数检验的检验效能_____________。

47、符合参数检验条件的资料,如采用非参数检验方法,一般情况下,犯第______________

类错误的概率增大。

48、对于多个样本的秩和检验,当R=3,n i >5时,应查_____________表。

49、某病住院日的分布呈中间高两边低,平均住院日为5天,中位数为10天,可以看出

住院日的分布是 。

50、一完全随机设计的计量资料,有4个处理组,每组的例数分别为13、22、17、8,方差分析时其误差项的自由度为____________________。

六、简答题

1、试述应用相对数应注意的问题?

2、简述定量变量值频数表的制定步骤与内容。

3、正态分布与标准正态分布联系与区别。

4、简述配对设计资料的符号秩和检验的基本步骤。

5、简述假设检验与区间估计的联系。

6、试总结从样本数据判断总体回归关系是否成立的统计方法有哪些?

7、试举例说明均数的标准差与标准误的区别与联系。

8、为什么假设检验的结论不能绝对化?

9、什么叫做秩转换的非参数检验?它适用于哪些情况?

10.直线回归与直线相关的区别有哪些?

11、医学参考值范围的意义和制定方法是什么?

12、.以两样本均数比较的t 检验为例,说明假设检验的基本步骤。

13、简述四格表资料 检验公式选择条件:

14、随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不

同?

答案

一、判断题

1、×

2、×

3、×

4、√

5、×

6、×

7、×

8、×

9、× 10、×11、√ 12、√13、√ 14、√ 16、√ 17、×18、× 19、√ 20、√ 21、√ 22、√ 23、√24、× 25、× 26、√ 27、× 28、× 29、√ 30、× 32、× 33、× 34、×

35、× 36、× 37、√ 38、√ 39、√ 40、× 41、× 42、√ 43、× 44、×

45、√ 46、× 47、× 48、× 49、√ 50、× 51、× 52、√ 53、√ 54、×

19、×55、× 56、√ 57、× 58、× 59、√ 60、× 61、√ 62、√

四、名词解释题

1、总体:是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。

2、抽样误差:由于抽样造成的样本统计量与总体参数的差异,称为抽样误差,是由个体变异产生的。

3、S:标准误的点估计值,它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。

4、S:样本标准差,是描述一组变量值离散程度的统计指标。常用于正态分布或近似正态分布的资料,标准差小,均数的代表性好。

5、变异:个体间测量结果的差异称为变异。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。

6、极差亦称全距,即最大值与最小值之差,用于资料的离散程度的粗略分析,其计算简便但稳定性较差。

7、参数检验:以特定的总体分布为前提,对总体参数进行假设检验的一类检验方法。

8、非参数检验:是一种不依赖总体分布的具体形式的统计检验方法。检验的是分布,不是参数。

9、参数:是反映总体的指标,如总体均数、总体率等,总体参数是固定的常数。

10、参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计和区间估

计。

11、统计推断:通过样本指标来说明总体特征,这种通过样本信息获取总体特征的过程称为统计推断。统计推断包括两个方面的重要内容:一是参数估计,二是假设检验。

12、统计量:是指与总体参数相对应的样本统计指标,如样本均数、样本率等,样本统计量可用来估计总体参数,统计量是在总体参数附近波动的随机变量。

13、中位数:将一组观察值由小到大排列,位次居中的那个数。

14、四分位数间距是由第3四分位数(75P )和第1四分位数(25P )相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。

15、正态分布:若资料X 的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布。

16、标准正态分布:均数为0,标准差为1的正态分布。

17、率:又称频率指标,说明一定时期内某现象发生的频率或强度。计算公式为:

, 表示方式有:百分率(%)、千分

率(?)等。

18、构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布。计算公式

为: ,通常以百分数表示。

19、直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该 直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称 简单回归。

20、直线相关:直线相关又称线性相关、简单相关,用于双变量正态分布的资料,有正相关 负相关和零相关等关系。直线相关的性质可用散点图直观地说明。

21、相关系数:相关系数又称积差相关系数,以符号r 表示样本相关系数,ρ表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。

22、回归系数:在直线回归方程中用b 表示,是描述变量间依存关系的方向和变化幅度的统计指标,b 的统计意义为X 每增(减)一个单位时,Y 平均改变b 个单位

23、变异系数:变异系数属于变异指标,适合于正态分布或者近似正态分布的资料,常用于比较均数相差较大或度量衡单位不同的观察值的变异程度,计算公式为100%s cv x

=

?。 五、填空题:

1、统计描述、统计推断

2、参数估计、假设推断

3、7525p p 和

4、μσ和

5、计量资料、计数资料、等级资料

6、几何均数

7、几何均数

8、构成比

%100?=观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比%100?=单位总数可能发生某现象的观察数发生某现象的观察单位率

9、准确度、精密度

10、自由度

11、122n n +-、(R-1)(C-1)

12、1

14、ss ss ss ss =++处理总区组误差

15、均数相差悬殊、度量衡单位不同

16、50%

17、97%

18、抽差误差

19、 2.597.51.96,x s p p ±-

20、5

21、6.92

22、1.08

23、7.92

24、90%

25、半对数线图

26、普通线图、散点图

27、半对数线图、普通线图

28、半对数线图

29、总体率的95%可信区间

30、p s

32、ss ss ss =+总组间组内

33、6、7

34、两样本来自正态分布的总体、两总体方差相等或齐性。

36、1

37、2

38、性质、分析目的

39、0ρ=

40、0β=

41、随机性、正态性、方差齐性

42、准确可靠、系统化、条理化

43、2x 界值

45、总体个体值、样本均数

46、低

47、Ⅱ

49、负偏态分布

50、57

六、简答题:

1、答:应用相对数应注意事项:

(1)算相对数时分母应该有足够数量;

(2)分析时不能以构成比代替率;

(3)分别将分子和分母合计求合计率或平均率;

(4)相对数的比较应该注意其可比性;

(5)样本率或构成比比较时应做假设检验

2答:

(1)求全距:R=最大值-最小值

(2)求组距:i=R/组数 一般分为10-15组

(3)确定组限:第一组包括最小值,最后一组包括最大值,L ≤x <U

(4)划记汇总:将所有观察值逐一划记到各组段,并统计各组段的频数和总频数。

3、答:二种分布均为连续型随机变量的分布。正态分布、标准正态分布均为对称分布。标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。

4、答:基本步骤:

(1)、求出各对数值的差值;

(2)、建立检验假设,确定检验水准;

0H :差值总体中位数为零

1H :差值总体中位数不为零

0.05α=

(3)、编秩次

Ⅰ、按差值的绝对值自小至大排秩次,并保持原差数的正负号;

Ⅱ、差数的绝对值相等符号相反时,取平均秩次;

Ⅲ、差数为零时,弃之,总的对子数相应减少。

(4)求秩和:将正负秩次分别相加,得到T T +-和,任取正负秩和作为统计量T 值;

(5)查T 界值表,确定p 值范围,作出推断结论。

Ⅰ、当样本例数n ≤50时,查配对资料符合秩和检验用T 界值表,T 愈小,p 愈小,T 在 ()n T α界内时,p >α,当T 恰为表中的界值时,p 值一般都小于对应的概率值。

Ⅱ、当n >50时,按近似正态分布用u 检验

u =

当相同秩次较多时,采用校正公式:

u =

按u 界值确定p 值范围,作出推断结论。

5、答:假设检验用于推断质的不同,即判断两个(或多个)总体参数中是否不同,而可信区间用于说明量的大小 ,即推断总体参数的范围。两者既相互联系,又不区别。假设检验与区间估计的联系在于可信区间亦可回答假设检验的问题,若算得的可信区间包含了0H ,则按α水准,不拒绝0H ,若不包含了0H ,则按α水准,拒绝0H ,接受1H 。也就是说在判断两个(或多个)总体参数是否不等时,假设检验和可信区间是完全等价的。

6、答:用b t 、r t 作t 检验;用F 对b 和2R 作方差分析;直接查r 界值表。

7、答:例如某医生从某地2006年的正常成年男性中,随机抽取25人,算得其血红蛋白的均数X 为138.5g/L ,标准差S 为5.20g/L ,标准误X S 为1.04g/L 。在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标,它反映了这25个数据对其算术均数的离散情况。因此标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,反映了样本均数与总体均数的差异,说明了均数的抽样误差大小。

本例均数的标准误 1.04S ===,

此式将标准差和标准误从数学上有机地联系起来了,同时还可以看出:当标准差不变时,通过增加样本含量可以减少标准误。

8、答:因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝H 0时,可能犯I 型错误;“接受”H 0时可能犯II 型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字词如“肯定”,“一定”,“必定”就不恰当。

9、答:秩转换的非参数检验是先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量,其特点是假设检验的结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。它适用于:不满足正态或(和)方差齐性的小样本计量资料;分布不知是否正态的小样本资料;一端或两端是不确切数值的资料;等级资料。

10、答:

区别:

(1) 资料要求上:相关要求X 、Y 服从以变量正态分布,回归要求Y 在给定某个X 值时服

从正态分布,X 是可以精确测量和严格控制的变量。

(2) 应用上:说明两变量间相互关系用相关,说明两变量依存变化的数量关系用回归。

(3) 意义上:r 说明具有直线关系两变量间相互关系的方向与密切程度,b 表示X 每变化

一个单位所导致Y 的平均变化量。

(4) 计算上:

XY xx l b l = (5) 取值范围:-1≤r ≤1,-∞<b <∞

(6) 单位:r 没有单位,b 有单位。

11、答:

医学参考值范围是指大多数正常人的解剖、生理、生化、免疫、等各种数据的波动范围,所谓正常人,并非一定是“健康人”,而是指排除影响研究指标因素的同质人群。制定医学参考值范围,首先要选择足够数量的正常人,对选定的人进行正确测定, 根据实际确定单侧还是双侧界值,并选取适当的百分范围,最后,采用相应的方法计算出参考值范围。估计医学参考值的范围方法有百分位数法和正态分布法,应根据资料类型和实际情况选择。

12、答:

基本步骤:

(1)1.建立检验假设,确定检验水准 假设有两种:

即检验假设(hypothesis under test / to be tested),常称无效假设或零/原假设(null hypothesis):

记为H 0: μ1=μ2,

备择假设常称对立假设(alternative hypothesis)。:记为 H 1 :μ1≠μ2,(双侧)1212μμμμ> 或(单侧)

α=0.05

单双侧检验根据研究目的和专业知识确定。

检验水准α:是预先设定的概率值,一般取α=0.05

(2)选用适当的检验方法并计算相应的检验统计量。

根据研究设计资料类型和统计推断目的选择适当的检验方法,并计算相应的检验统计量。

(3)确定p 值,并作出推断结论。

根据算得的统计量值确定p 值(p 值是从H 0规定的总体中随机抽样,得到现有统计量或更极端情况的概率),并与事先设定的检验水准α比较,若P ≤α,则结论为按所取的α检验水准,拒绝H 0,接受H 1,有统计学意义(统计结论)。可认为……不等或不同(专业结论)。 若P >α,则结论为按α检验水准,不拒绝H 0,无统计学意义(统计结论)。还不能认为……不等或不同(专业结论)。

13、答:

(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。

(2)对于两样本率比较的四格表资料,应根据各格的理论值T 和总例数n 的大小选择

不同的2

χ计算公式:① 当40≥n 且所有的5≥T 时,用2χ检验的基本公式22

()A T T χ-=∑或四格表资料2χ检验的专用公式22()()()()()ad bc n a b c d a c b d χ-=++++;②当40≥n 但有51<≤T 时,用四格表资料2χ检验的校正公式22

(0.5)c

A T T χ--=∑或22

2()()()()()n c |ad -bc|-n =a+b c+d a+c b+d χ,或改用四格表资料的Fisher 确切概率法;③当40

若资料满足两样本率u 检验的条件,也可用u 检验。

(3)对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时①当

()40b c +≥时,22()b c b c χ-=+;②当()40b c +<时,c b c b c +--=22)1(χ。

14、答:

区 别 点

完全随机设计 随机区组设计 设计 采用完全随机化的分组方法,将

全部试验对象分配到g 个处理组

(水平组),各组分别接受不同的

处理。

随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。 变异分解

三种变异: SS SS SS =+总组间组内 四种变异: SS SS SS SS =++处理区组总误差

(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。

(2)对于两样本率比较的四格表资料,应根据各格的理论值T 和总例数n 的大小选择

不同的2

χ计算公式:① 当40≥n 且所有的5≥T 时,用2χ检验的基本公式22

()A T T χ-=∑或四格表资料2χ检验的专用公式22()()()()()ad bc n a b c d a c b d χ-=++++;②当40≥n 但有51<≤T 时,用四格表资料2χ检验的校正公式22(0.5)c A T T

χ--=∑或22

2()()()()()n c |ad -bc|-n =a+b c+d a+c b+d χ,或改用四格表资料的Fisher 确切概率法;③当40

若资料满足两样本率u 检验的条件,也可用u 检验。

(3)对于配对设计的四格表资料,若检验两种方法的检测结果有无差别时①当

()40b c +≥时,2

2()b c b c χ-=+;②当()40b c +<时,c b c b c +--=22)1(χ。

卫生统计学考试试题及答案

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

卫生统计学选择题及答案

t分布与标准正态分布有一定的关系,下述错误的叙述是_____ A.参数数目不同 B.t分布中的自由度趋于无穷大时,曲线逼近标准正态分布 C.为单峰分布 D.对称轴位置在0 E.曲线下面积的分布规律相同 在抽样研究中,当样本例数逐渐增多时_____. A.标准误逐渐加大 B.标准差逐渐加大 C.标准差逐渐减小 D.标准误逐渐减小 E.标准差趋近于0 抽样误差是指。 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别(参数与统计量之间由于抽样而产生的差别) C.样本中每个个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 下面说法中不正确的是_____. A.没有个体差异就不会有抽样误差 B.抽样误差的大小一般用标准误来表示 C.好的抽样设计方法,可避免抽样误差的产生 D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等 E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心,左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时,二都分布一致 D.当样本含量无限大时,t分布与标准正态分布一致 E.当总体均数增大时,分布曲线的中心位置均向右移 抽样研究中,适当增加观察单位数,可() A.减小Ⅰ型错误 B.减小Ⅱ型错误 C.减小抽样误差 D.提高检验效能 E.以上均正确

说明两个有关联的同类指标之比为。 A.率 B.构成比 C.频率 D.相对比 E.频数 构成比用来反映。 A.某现象发生的强度 B.表示两个同类指标的比 C.反映某事物内部各部分占全部的比重 D.表示某一现象在时间顺序的排列 E.上述A与C都对 以下属于分类变量的是___________. A.IQ得分 B.心率 C.住院天数 D.性别 E.胸围 计算麻疹疫苗接种后血清检查的阳转率,分母为______. A.麻疹易感人群 B.麻疹患者数 C.麻疹疫苗接种人数 D.麻疹疫苗接种后的阳转人数 E.麻疹疫苗接种后的阴性人数 关于构成比,不正确的是_____. A.构成比中某一部分比重的增减相应地会影响其他部分的比重 B.构成比说明某现象发生的强度大小 C.构成比说明某一事物内部各组成部分所占的分布 D.若内部构成不同,可对率进行标准化 E.构成比之和必为100% 甲乙两地某病的死亡率进行标准化计算时,其标准的选择______. A.不能用甲地的数据 B.不能用乙地的数据 C.不能用甲地和乙地的合并数据 D.可用甲地或乙地的数据 E.以上都不对 用均数与标准差可全面描述资料的分布特征() A.正态分布和近似正态分布 B.正偏态分布 C.负偏态分布 D.任意分布

卫生统计学试题汇总(印)

最佳选择题 1.收集资料的方法是:E A.收集各种报表 B.收集各种工作记录 C.进行专题调查 D.进行科学实验 E.以上都对 2.统计工作的基本步骤是:D A.调查资料、审核资料、整理资料 B.收集资料、审核资料、分析资料 C.调查资料、整理资料、分析资料 D.收集资料、整理资料、分析资料 E.以上都对 3.在抽样研究中样本是:D A.总体中的一部分 B.总体中任意一部分 C.总体中典型部分 D.总体中有代表性的一部分 E.总体中有意义的一部分 4.计量资料、计数资料和等级资料的关系是:C A.计量资料兼有计数资料和等级资料的一些性质 B.计数资料兼有计量资料和等级资料的一些性质 C.等级资料兼有计量资料和计数资料的一些性质 D.计数资料有计量资料的一些性质 E.以上都不是 5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度,宜绘制D : A.普通线图 B.直方图 C.构成比直条图 D.半对数线图 E.直条图 6.直方图可用于: A.某现象的内部构成 B.各现象的比较 C.某现象的比较 D.某现象的频数分布 E.某现象的发展速度 7.统计图表的要求是: A.简单明了 B.层次清楚 C.说明问题明确 D.避免臃肿复杂 E.以上都对 8.在列频数表时,分组数目一般为: A.5-10 B.8-15 C.10-30 D.15-20 E.>20 9.平均数作为一种统计指标是用来分析: A.计数资料 B.计量资料 C.等级分组资料 D.调查资料 E.以上都不对 10.表示变量值变异情况的常用指标是: A.全距 B.标准差 C.方差 D.变异系数 E.以上均是 11.确定正常人某个指标正常值范围时,调查对象是: A.从未患过病的人 B.健康达到了要求的人 C.排除影响被研究指标的疾病和因素的人 D.只患过小病但不影响研究指标的人 E.排除了患过某病或接触过某因素的人 12.标准误: A.与标准差呈反比 B.与标准差呈正比 C.与标准差的平方呈反比 D.与标准差平方呈正比 E.以上都不对 13. x σ是指: A.所有观察值对总体均数的离散程度 B.某一个样本均数的离散程度 C.所有样本均数对总体均数的离散程度 D.某些样本均数对总体均数的离散程度 E.所有含量相同的样本均数对总体均数的离散程度 14. 2.58X X S ±表示: A.95%的正常值范围 B.95%的可信区间 C.99%的正常值范围

《卫生统计学》试卷(3)答案

2001级预防医学专业《卫生统计学》试卷 2004年5月31日专业学号姓名得分 一、单项选择题(每题2分,共40分) 1.标准正态分布的中位数为________A A. 0 B. 1 C. 0.5 D. 与标准差有关 2. 2检验能分析 D A.两样本率差异有无统计学意义 B. 多个样本率差异有无统计学意义 C. 两有序分类变量的关联性 D. 以上都对 3.医学试验设计的基本原则是D A. 对照 B. 随机 C. 重复 D. 以上均正确 4.以下关于二项分布的说法,错误的是________ D A. 二项分布要求随机试验仅有两个互相对立的结果,每次试验间是互相独立的; B. 二项分布要求各次随机试验的阳性率是恒定不变的; C. 从一个装有10个白球和10个黑球的口袋中随机摸球,每次摸出一球,记录其颜色后放回袋中,重复10次,作为一次试验。若以摸出白球作为阳性,则每次试验的阳性率服从二项分布; D. 虽然二项分布要求各次随机试验的阳性率是不变的,但在样本含量比较大,且阳性率和阴性率均不太小时,也可以近似利用二项分布的原理来解决阳性率有微弱改变时的有关问题。如从一个装有5000个白球和5000个黑球的口袋中随机摸球,每次摸出一球,记录其颜色后不放回袋中,重复10次,作为一次试验。可以近似利用二项分布的有关原理来解决这样的问题。 5.关于正态分布,以下说法正确的是________ B A.仅仅标准正态分布其曲线下面积才为1; B.在横轴上,从负无限大到1.96所对应的曲线下面积为0.975; C.从服从正态分布的总体中抽样,不管其样本含量有多大,其样本均数均服从正态分布; D.以上都不对。

卫生统计学部分题库

对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______. A.有相关关系 B.无任何关系 C.无直线相关关系 D.无因果关系 E.有伴随关系 若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用_____. A.直线相关分析 B.秩相关分析 C.直线回归分析 D.方差分析 E.病例对照研究 四格表资料的χ2检验应使用校正公式而未使用时,会导致。 A.χ2增大,P值减小 B.χ2减小,P值也减小 C.χ2增大,P值也增大 D.χ2减小,P值增大 E.视数据不同而异 配对设计四格表资料比较两个率有无差别的无效假设为。 A.μ1=μ2 B.π1=π2 C.μ1≠μ2 D.π1≠π2 E.b=c 四格表χ2检验的校正公式应用条件为。 A.n>40且T>5 B.n<40且T>5 C.n>40且1<T<5 D.n<40且1<T<5 E.n>40且T<1 两组设计两样本均数比效的t检验公式中,位于分母位置上的是。 A.两样本均数之差 B.两样本均数之差的方差 C.两样本均数之差的标准误 D.两样本均数方差之差

E.两样本均数标准误之差 两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______. A.t值不变 B.t值变小 C.t值变大 D.t值变小或变大 E.不能判断 在假设检验中,P值和α的关系为。 A.P值越大,α值就越大 B.P值越大,α值就越小 C.P值和α值均可由研究者事先设定 D.P值和α值都不可以由研究者事先设定 E.P值的大小与α值的大小无关 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心,左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时,二都分布一致 D.当样本含量无限大时,t分布与标准正态分布一致 E.当总体均数增大时,分布曲线的中心位置均向右移 下面关于均数的正确的说法是______. A.当样本含量增大时,均数也增大 B.均数总大于中位数 C.均数总大于标准差 D.均数是所有观察值的平均值 E.均数是最大和最小值的平均值 从同一正态总体中随机抽取多个样本,用样本均数来估计总体均数的可信区间,下列哪一样本得到的估计精度高。 A.均数大的样本 B.均数小的样本 C.标准差小的样本 D.标准误小的样本 E.标准误大的样 以一定概率由样本均数估计总体均数,宜采用。 A.抽样误差估计 B.点估计 C.参考值范围估计 D.区间估计

卫生统计学试卷(含答案)

卫生统计学试卷 姓名:__________ 考试时间:_______ ___ (本大题满分40分,每小题1分) 1. 算术均数适用于:( ) A. 偏态分布资料 B. 分布类型不明的资料 C. 对数正态分布资料 D. 以上都不是 E. 正态分布资料 2. 某医生在进行科室病例资料统计时,拟用算术平均数表示平均水平,应当选用什么样的资料:( ) A. 性质不同的变量值 B. 差异相同的变量值 C. 性质相同的变量值 D. 个体差异较大的变量值 E. 个体差异较小的变量值 3. 均数与标准差适用于:( ) A. 正态分布 B. 正偏态分布 C. 不对称分布 D. 偏态分布 E. 负偏态分布 4. 样本含量的估计是( )。 A. 不必估计,调查整个总体最好 B. 保证研究结论具有一定可靠性的前提下确定的最少例数 C. 经济条件允许的情况下,越多越好 D. 时间允许的情况下,越多越好 E. 根据实际情况,能选多少是多少 5. 标化后的总死亡率:( ) A. 它反映了事物实际发生的强度 B. 以上都不对 C. 它反映了实际水平 D. 它不随标准选择的变化而变化 E. 仅仅作为比较的基础,它反映了一种相对水平 6. 下面说法中不正确的是( )。 A. 抽样误差的大小一般用标准误来表示 B. 好的抽样设计方法,可避免抽样误差的产生 C. 没有个体差异就不会有抽样误差 D. 抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别 E. 医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等 7. 计算某血清血凝抑制抗体滴度的平均水平,宜用:( ) A. 四分位数 B. 几何均数 C. 相对数 D. 中位数 E. 均数 8. 变异系数是表示资料的:( ) A. 对称分布 B. 平均水平 C. 相对变异 D. 集中趋势 E. 变异数 9. 统计上所说的样本是指:( ) A. 总体中的每一个个体 B. 按照随机原则抽取总体中有代表性部分 C. 按照研究者要求抽取总体中有意义的部分 D. 有意识的抽取总体中有典型部分 E. 随意抽取总体中任意部分 10. 一群7岁男孩身高标准差为5cm,体重标准差为3kg,则二者变异程度比较:( ) A. 身高变异小于体重 B. 身高变异不等于体重 C. 身高变异等于体重

卫生统计学试题6含答案

. 统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

. A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卫生统计学名词解释

1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 2.概率是描述随机事件发生可能性大小的数值,常用P表示。随机事件概率的大小在0与1之间,P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。习惯上将P≤0.05的事件,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为不发生。 6. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 7.系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 8.随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。 9.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。 10.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 11.频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。 12.算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。 13.几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 14.中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。 15.极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。 16.百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

卫生统计学试题

卫生统计学习题 定量资料的统计描述 1. 1985年某省农村30例6-7岁正常男童胸围(cm)测量结果如下:51.654. 154.056.9 57.755. 558.355. 453.857. 751.353. 857.354. 852.155. 354.854.7 53.457. 153.155. 951.454. 656.161. 859.356. 859.853.9 (1)试编制以上数据的频数表,绘制直方图,概括其分布特征。(2)用合适的统计量描述其集中趋势和离散趋势。 (3)对样本进行正态性检验

第三章定性资料的统计描述 1.某地通过卫生服务的基线调查得到如下资料,试作如下分析:(1)计算全人口的性别比; (2)计算育龄妇女(15~49岁)占总人口的百分比; (3)计算总负担系数; (4)计算老年人口系数 某地人口构成情况 年龄组(岁)男(%)女(%)年龄组(岁)男(%)女(%)0~ 4.24.045~ 2.42.7 5~ 3.23.150~ 2.12.4 10~ 4.44.255~ 1.2 2.2 15~ 5.55.360~ 1.3 2.4 20~

5.15.265~ 1.11.4 25~ 6.06.170~ 0.81.2 30~ 4.34.575~ 0.50.9 35~ 3.23.380~ 0.20.5 40~ 2.32.585~ 0.10.2 第四章常用概率分布 1.假定虚症患者中,气虚型占30%。现随机抽查30名虚症患者,求其中没有1名气虚型的概率、有4名气虚型的概率。 2.某溶液平均1毫升中含有大肠杆菌3个。摇均后,随机抽取1毫升该溶液,内含大肠杆菌2个和低于2个的概率各是多少? 3.某人群中12岁男童身高的分布近似正态分布,均数为 144.00cm,标准差为 5.77cm,试估计

卫生统计学试卷B含答案

卫生统计学试卷 适用范围:__________ 出题教师:__________ 试卷满分 100 分,考试时间 60 分钟;书写要工整、清楚、标点符号使用正确。 一、单选题,以下各题有多个选项,其中只有一个选项是正确的,请选择正确答案(本大题满分40分,每小题1分) 1. 某研究属于观察性研究抑或试验性研究是根据确定的。 A. 是否给予研究对象干预措施 B. 是否遵循随机化原则 C. 研究者的工作属性 D. 研究对象所提供的信息 E. 在现场工作,还是在实验室工作 2. 为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用( )。 A. 普通线图 B. 直方图 C. 复式直条图 D. 直条图 E. 半对数线图 3. 统计中所说的总体是指:( ) A. 根据地区划分的研究对象的全体。 B. 据研究目的确定的同质的研究对象的全体。 C. 根据时间划分的研究对象的全体。 D. 随意想象的研究对象的全体。 E. 根据人群划分的研究对象的全体。 4. 对两样本均数作t检验,n1=20,n2=20,其自由度等于:( ) A. 39 B. 40 C. 20 D. 19 E. 38 5. 标化后的总死亡率:( ) A. 它反映了事物实际发生的强度 B. 以上都不对 C. 仅仅作为比较的基础,它反映了一种相对水平 D. 它反映了实际水平

E. 它不随标准选择的变化而变化 6. 计量资料编制频数表时,一般分组数目为:( ) A. 8~15组 B. 15~20组 C. 5~10组 D. 10~15组 E. 随便分几组 7. 均数与标准差适用于:( ) A. 偏态分布 B. 不对称分布 C. 正偏态分布 D. 负偏态分布 E. 正态分布的资料 8. 某地区抽样调查1000名成年人的血压值,此资料属于:( ) A. 有序分类资料 B. 离散型资料 C. 无序分类资料 D. 数值变量资料 E. 集中型资料 9. 120名10岁男孩身高资料是:( ) A. 定量不连续资料 B. 定性连续资料 C. 定性二分类资料 D. 定量连续性资料 10. 偏态分布资料宜用下面那一项描述其分布的集中趋势:( ) A. 标准差 B. 算术均数 C. 四分位数间距 D. 中位数 E. 方差 11. 两样本均数比较时,分别取以下检验水准,以所犯第二类错误最小:( ) A. α=0.02 B. α=0.01 C. α=0.05 D. α=0.15 E. α=0.10

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变 量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量: a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量: a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、 分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜 集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与 总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离 散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

卫生统计学试题6含答案

统计试题题库 1、下列那个就是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2、两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3、四格表资料的卡方检验时无需校正,应满足的条件就是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4、总体应该就是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5、两样本均数比较的t检验中,结果为P<0、05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6、抽样误差就是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7、抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8、以舒张压≥12、7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9、实验设计中要求严格遵守四个基本原则,其目的就是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少与抵消非实验因素的干扰 E.以上都不对 10、两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件就是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11、同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV E.S2

卫生统计学题库

《卫生统计学》考试题库 目录 第一章绪论 第二章定量资料的统计描述 第三章正态分布 第四章总体均数的估计和假设检验 第五章方差分析 第六章分类资料的统计描述 第七章二项分布与Poisson分布及其应用 第八章χ2检验 第九章秩和检验 第十章回归与相关 第十一章常用统计图表 第十二章实验设计 第十三章调查设计

第十四章医学人口统计与疾病统计常用指标第十五章寿命表 第十六章随访资料的生存分析 附录:单项选择题参考答案

第一章绪论 一、名词解释 1. 参数(parameter) 2. 统计量(statistic) 3. 总体 (population) 4. 样本(sample) 5. 同质(homogeneity) 6. 变异 (variation) 7. 概率 (probability) 8. 抽样误差 (sampling error) 二、单选题 1.在实际工作中,同质是指: A.被研究指标的影响因素相同 B.研究对象的有关情况一样 C.被研究指标的主要影响因素相同 D.研究对象的个体差异很小 E.以上都对 2. 变异是指: A.各观察单位之间的差异 B.同质基础上,各观察单位之间的差异 C.各观察单位某测定值差异较大 D.各观察单位有关情况不同 E.以上都对3.统计中所说的总体是指: A.根据研究目的而确定的同质的个体之全部 B.根据地区划分的研究对象的全体 C.根据时间划分的研究对象的全体 D.随意想象的研究对象的全体 E.根据人群划分的研究对象的全体 4. 统计中所说的样本是指: A.从总体中随意抽取一部分 B.有意识地选择总体中的典型部分 C.依照研究者的要求选取有意义的一部分 D.从总体中随机抽取有代表性的一部分 E.以上都不是 5.按随机方法抽取的样本特点是:

卫生统计学方法与应用中

1、甲乙两地某病的死亡率进行标准化计算时,其标准选择() * ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 2、实验设计应遵循的基本原则是() * ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 3、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟 合回归直线,则其回归系数b值() * ? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 4、以下属于分类变量的是() * ? A.IQ得分 ? B.心率 ? C.住院天数 ? D.性别 ? E.胸围 5、抽样调查某市正常成年男性与女性各300人,测得其血红蛋白含量( g/L)。欲比较男 性与女性的血红蛋白含量是否有差异,假设男性和女性的血红蛋白含量的总体方差相等,应采用() *c ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验

6、进行方差分析时,数据应满足() * ? A.独立性、正态性、大样本 ? B.独立性、正态性、方差齐性 ? C.独立性、方差齐性、大样本 ? D.独立性、正态性、平行性 ? E.正态性、方差齐性、大样本 7、同类定量资料下列指标,反映样本均数对总体均数代表性的是() *? A.四位分数间距 ? B.标准误 ? C.变异系数 ? D.百位分数 ? E.中位数 8、完全随机设计的方差分析组间变异来自于() * ? A.个体 ? B.全部观察值 ? C.随机因素 ? D.处理因素 ? E.随机因素和处理因素 9、统计工作的基本步骤是() * ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 10、生存分析中的结果变量是() *d ? A.生存时间 ? B.寿命表法生存曲线呈阶梯型 ? C.生存率 ? D.生存时间与随访结局 ? E.生存时间与生存率 11、反映血型为AB型的人在人群中所占的比例,宜计算() * ? A.率 ? B.标准化率

卫生统计学考试题及答案要点

《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 P的含义假设检验中21. 型错误II I型和22. 检验效能23. 24.检验水准方差分析25. 26.随机区组设计27.相对数- 1 - 28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 二、单项选择题

1.观察单位为研究中的( D )。 A.样本B.全部对象 C.影响因素D.个体 2.总体是由(C )。 A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是(B )。 A.研究样本统计量B.由样本统计量推断总体参数 C.研究典型案例研究误差D.研究总体统计量 4.参数是指( B )。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的(A )。 - 2 - .抽样时应使得总体中的每一个个体都有同等的机会被抽取A .研究者在抽样时应精心挑选个体,以使样本更能代表总体B .随机抽样即随意抽取个体C .为确保样本具有更好的代表性,样本量应越大越好D B )。6.各观察值均加(或减)同一数后( .均数改变,标准差不变BA.均数不变,标准差改变 .两者均改变 D .两者均不变C )。7.比较身高和体重两组数据变异度大小宜采用(A B.方差.变异系数 A D.标准差C.极差 D )可用来描述计量资料的离散程度。8.以下指标中( .几何均数 B A.算术均数 D.标准差C.中位数 )。9.血清学滴度资料最常用来表示其平均水平的指标是(C B.中位数A.算术平均数 D.平均数C.几何均数 。)10.两样本均数的比较,可用(C 检验B.t A.方差分析 .方差齐性检验 D C.两者均可 ?。D 11.配伍组设计的方差分析中,)等于(配伍???? A.--B.总误差总处理?????? D.---C.+处理总误差总处理误差??|X??|?,的正态总体中随机抽样,)的概率为5% 。12.在均数为标准差为( B tSst?1.96 C.D. A. B.?1.96??,,X20.0520.05X13.完全随机设计方差分析的检验假设是(D )。 A.各处理组样本均数相等B.各处理组总体均数相等 C.各处理组样本均数不相等D.各处理组总体均数不全相等 14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( D )。 2检验χB A.分别进行比较.两个率比较的 - 3 -

相关文档