复习资料
第一大题:单项选择题
1、欲了解某市8岁小学生的身高情况,该市某小学二年级8岁小学生是:()
? A. 样本
? B. 有限总体
? C. 无限总体
? D. 个体
2、抽样调查了某地4岁男孩的生长发育情况,得到身高均数为98.67cm,标准差为4.63cm,头围均数为46.23cm,标准差为3.16cm,欲比较两者的变异程度,下列结论正确的是:()
? A. 身高变异程度大
? B. 头围变异程度大
? C. 身高和头围的变异程度相同
? D. 由于两者的均数相差很大,无法比较两者的变异程度
3、在计算方差时,若将各观察值同时减去某一常数后求得的方差:( )
? A. 会变小
? B. 会变大
? C. 不变
? D. 会出现负值
4、某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为( )
? A. 概率
? B. 构成比
?
C. 发病率
?
D. 相对比
5、两个分类变量的频数表资料作关联性分析,可用( )
?
A. 积距相关或等级相关
?
B. 积距相关或列联系数
?
C. 列联系数或等级相关
?
D. 只有等级相关
6、对于服从双变量正态分布的资料,如果直线相关分析算出的值越大,则经回归分析得的相应的b 值:
?
A. 越大
?
B. 越小
?
C. 比r小
?
D. 可能较大也可能较小
7、多组均数的两两比较中,若不用q检验而用t 检验,则:()
?
A. 结果更合理
?
B. 结果一样
?
C. 会把一些无差别的总体判断为有差别
?
D. 会把一些有差别的总体判断为无差别
8、在比较甲、乙两种监测方法测量结果是否一直时,若采用配对设计秩和检验,甲、乙两法测量值之差中有-0.02、0.02,若差值绝对值的位次为3、4,则这两个差值的秩次分别为:()
?
A. -3.5,3.5
? B. -3.5,-3.5
? C. 3.5,3.5
? D. -3,4
9、Y=14+4X是1~7岁儿童以年龄(岁)估计体重(市斤)回归方程,若体重换成国际单位kg,则此方程:()
? A. 截距改变
? B. 回归系数改变
? C. 两者都改变
? D. 两者都不变
10、某卫生局对其辖区内甲、乙两医院医疗技术人员的业务素质进行考核,在甲医院随机抽取100人,80人考核结果为优良;乙医院随机抽取150人,100人考核结果为优良。本题中资料类型与设计类型分别为:
? A. 定量资料成组设计
? B. 定量资料配对设计
? C. 分类资料成组设计
? D. 分类资料配对设计
11、在某农村地区随机抽取100名儿童,进行蛔虫感染情况粪检,结果50名儿童蛔虫卵粪检为阳性,则该地儿童蛔虫卵粪检总体阳性率的95%的置信区间为:()? A. 35%-60%
? B. 37%-63%
? C. 30%-70%
? D. 40%-60% 12、两样本均数比较,经t 检验,差别有显著性时,P 越小,说明:()
?
A. 两样本均数差别越大
?
B. 两总体均数差别越大
?
C. 越有理由认为两总体均数不同
?
D. 越有理由认为两样本均数不同
13、用于推断总体特征的样本应该是:( )
?
A. 从总体中随机抽取的一部分
?
B. 从总体中随便抽取的一部分
?
C. 总体中有价值的一部分
?
D. 总体中便于测量的一部分
14、某研究欲了解男性高血压患者与女性高血压患者血脂是否有差异,从某市6家医院随机调查了400人,测量血脂水平,经t 检验,得P<0.05,有统计学差异,由此推断该地男、女高血压患者血脂总体均数有差别,这里所谓有统计学差异是指:( )
?
A. 两样本均数差别有统计学差异
?
B. 两总体均数差别有统计学差异
?
C. 两样本均数和两总体均数的差别有统计学差异
?
D. 其是有一个样本均数和总体均数有统计学差异
15、下列关于医学参考值范围的叙述不正确的是:()
?
A. 没有疾病的人的解剖、生理、生化等数据的波动范围
?
B. 习惯以包含95%或99%的观察值为界值
?
C. 根据专业知识确定单侧范围或双侧范围
? D. 资料为正态分布时,选择正态分布法计算
16、假设某地35岁以上正常成年男性收缩压的总体均数为120.2mmHg,标准差为11.2mmHg,后者反映的是:()
? A. 个体变异的大小
? B. 抽样误差的大小
? C. 系统误差的大小
? D. 总体的平均水平
17、在计算标准化率时,标准人口应选择:()
? A. 文献中经常涉及的非目标人群
? B. 方便获得、与目标人群不同类的人群
? C. 前人研究过、与目标人群不相关的人群
? D. 有代表性的、较稳定的、数量较大的人群
18、Wilcoxon两样本比较的秩和检验在编秩时,若遇到两组中有相同数值,应:()
? A. 不计秩次
? B. 依次序编秩
? C. 取其平均秩次
? D. 以平均秩次的整数为秩
19、下列关于直线回归的说法中,错误的是:()
? A. 回归分析前应绘制散点图
? B. 应变量与自变量关系应为线性
? C. 回归方程可用来描述两定量变量间数量依存的关系
?
D. 假设检验的P 值能够反映自变量对应变量数量上的影响大小
20、下列关于样本含量的叙述,正确的是: ( )
?
A. 样本含量越大越好
?
B. 以实际可以收集到的样本例数为准
?
C. 时间、财力、人力等条件允许下的最大样本例数
?
D. 一定的推断精度和检验效能下的最少样本例数
21、均数与标准差的关系:()
?
A. 均数越大,标准差越大
?
B. 均数越大,标准差越小
?
C. 标准差越大,均数对各变量值的代表性越好
?
D. 标准差越小,均数对各变量值的代表性越好
22、两样本均数比较,经t检验,差别有显著性时,P越小,说明:()
?
A. 两个样本均数差别越大
?
B. 两总体均数差别越大
?
C. 越有理由认为两总体均数不同
?
D. 越有理由认为两样本均数不同
23、成组设计的方差分析中,有( )
?
A. MS组间=MS组内
?
B. SS组内=SS组间
?
C. MS总=MS组间+MS组内
?
D. SS 总=SS 组间+SS 组内
24、比较身高和体重两组数据变异度大小宜采用:( )
? A. 变异系数(CV ) ? B. 方差(S ) ? C. 极差(R )
?
D. 四分位数间距
25、正态近似法估计总体率的95%置信区间为:( )
? A. )96.1,96.1(n S P n S P +- ? B. )58.2,58.2(n S
P n S
P +-
? C. )96.1,96.1(P P S P S P +-
?
D. )58.2,58.2(P P S P S P +-
26、成组设计四格表资料的X 2检验,选用基本公式()
T
T A 2
2-=
χ的条件
? A. A ≥5 ? B. T ≥5
? C. A ≥5且T ≥5
?
D. n ≥40且T ≥5
27、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数 =1,则有: ( )
? A. SS 总=SS 残 ?
B. SS 残=SS 回
?
C. SS 总=SS 回 ?
D. SS 总>SS 回
28、3. 由两样本均数的差别推断两总体均数的差别,H 0 :μ1 =μ2,H 1 :μ1 ≠μ2 。 t 检验结果P <0.05,拒绝H 0 ,接受H 1 ,是因为:( )
?
A. 第一型错误小于5% ?
B. H 0成立的可能性小于5% ?
C. 第二型错误小于5% ?
D. H 1成立的可能性大于95%
29、正态分布曲线下,横轴上,从均数μ到μ1.96S S 的面积为:( )
?
A. 95% ?
B. 45% ?
C. 97.5% ?
D. 47.5%
30、符合t 检验条件的数值变量资料如果采用秩和检验,则下列说法正确的是:
?
A. 第一类错误增大 ?
B. 第二类错误增大 ?
C. 第一类错误减少 ?
D. 第二类错误减少
31、实验设计应遵循的基本原则是:
?
A. 随机化、对照、盲法 ?
B. 随机化、盲法、配对
? C. 随机化、重复、配对
? D. 随机化、对照、重复
32、以下资料类型不宜用秩和检验的是:()
? A. 等级资料
? B. 二项分布
? C. 极度偏态分布资料
? D. 数据一端不确定资料
33、某研究检测了男性和女性红细胞数,经检验该资料总体方差相等,欲比较男性和女性的红细胞数有无差异,取双侧a=0.05,经成组t检验得P <0.01,则:()? A. 可认为男性和女性的红细胞均数差异有统计学意义
? B. 可认为男性和女性的红细胞均数无差异
? C. 可认为男性和女性的红细胞均数差异很大
? D. 尚不能认为男性和女性的红细胞均数有差异
34、根据500例正常人的发铅原始数据(偏态分布),计算其95%医学参考值范围应采用:( )
? A. 双侧正态分布法
? B. 双侧百分位数法
? C. 单上侧百分位数法
? D. 单下侧百分位数法
35、用于推断总体特征的样本应该是: ( )
? A. 从总体中随机抽取的一部分
?
B. 从总体中随便抽取的一部分
?
C. 总体中有价值的一部分
?
D. 总体中便于测量的一部分
36、宜用均数和标准差进行统计描述的资料分布类型是:( )
?
A. 正态分布
?
B. 对数正态分布
?
C. 正偏态分布
?
D. 两端无确切值的分布
37、关于t分布特征的叙述错误的是:( )
?
A. 分布为单峰分布
?
B. t分布曲线是一簇曲线
?
C. 以0为中心,左右对称
?
D. 自由度越大,t分布曲线的峰部越低,尾部越高
38、随机抽取某市100名10岁女孩,测得其体重均数为35kg,若以一定的概率估计该市10岁女孩体重的总体均数,宜采用:()
?
A. 点估计
?
B. 区间估计
?
C. 假设检验
?
D. 医学参考值范围
39、下列关于样本含量的叙述,正确的是:()
?
A. 样本含量越大越好
? B. 以实际可以收集到的样本例数为准
? C. 以实际可以收集到的样本例数为准
? D. 一定的推断精度和检验效能下的最少样本例数
40、方差分析的应用条件:()
? A. 样本小,来自正态总体,样本间相互独立
? B. 样本来自正态总体,样本例数足够小
? C. 样本例数小,样本相互独立
? D. 样本来自正态总体,方差齐,样本数据独立
41、用最小二乘法建立直线回归方程的原则是各实测点距回归直线的:()
? A. 纵向距离平方和最小
? B. 垂直距离的和最小
? C. 垂直距离的平方和最小
? D. 纵向距离之和最小
42、若以成年男性血红蛋白低于120g/L为贫血的判断标准,调查某地成年男性1000人,记录每人是否患有贫血,结果有19名贫血患者,981名非贫血患者,则该资料的类型为:()
? A. 定量资料
? B. 二项分类资料
? C. 有序多分类资料
? D. 无序多分类资料
43、对两个地区恶性肿瘤发病率进行比较时,应该:( )
?
A. 排除两地人口年龄构成不同的影晌
?
B. 排除两地总人口数不同的影响
? C. 排除各年龄组死亡人数不同的影响
? D. 排除抽样误差
44、用某疗法治疗急性腰扭伤病人30例,两周后25例患者痊愈,由此可认为:( )
? A. 该疗法疗效好
? B. 该疗法疗效一般
? C. 因无对照,尚不能说明该疗法的疗效如何
? D. 因冶疗例数少,尚不能说明该疗法的疗效如何
45、在计算标准化率时,标准人口应选择:()
? A. 有代表性的、较稳定的、数量较大的人群
? B. 方便获得、与目标人群不同类的人群
? C. 前人研究过、与目标人群不相关的人群
?
D. 根据研究目的随机抽样获得的小样本人群
46、不受年龄构成的影响,能够反映整个人群死亡水平的指标是:()
?
A. 死因别死亡率
?
B. 粗死亡率
?
C. 标准化死亡率
?
D. 年龄别死亡率
47、描述血清抗体滴度资料的平均水平宜选用:()
?
A. 均数
?
B. 中位数
?
C. 几何均数
?
D. 标准差
48、抽样调查某市正常成年男性与女性各300人,测得其血红蛋白含量,欲比较男性与女性的血红蛋白含量有无差异(假设男性和女性的血红蛋白的方差相等),应采用:()
? A. 样本均数与总体均数比较的t检验
? B. 配对t检验
? C. 成组t检验
? D. 成组设计两样本比较的秩和检验
49、完全随机设计的方差分析组间变异源于:()
? A. 个体变异
? B. 随机变异
? C. 处理因素
? D. 随机变异和处理因素
50、某医生对患某病的10例成年男性患者的血清蛋白含量与血红蛋白含量资料进行分析,得到两变量的相关系数为r=0.916且p<0.001,下列说法正确的是:()? A. 两变量呈正相关关系
? B. 两变量呈负相关关系
? C. 两变量不存在相关关系
? D. 两变量间相关关系密切程度不高
51、下列分布中,均数等于方差的是:()
? A. X2
? B. u分布
? C. 二项分布
? D. Poisson分布52、已知男性的钩虫感染率高于女性,今欲比较甲,乙两乡居民的钩虫感染率,最合适的方法是:( )
?
A. 分性别进行比较
?
B. 两个率比较的X2检验
?
C. 不具可比性,不能比较
?
D. 对性别进行标准化后再比较
53、在同一正态总体中随机抽样,总体均数有90%的可能在:()
A.
X
S
X96
.1
±
B.
X
S
X64
.1
±
C. S
X96
.1
±
D. S
X64
.1
±
54、正态性检验,按α=0.10水准,认为总体不服从正态分布,此时若推断的错,其错误的概率为:()
?
A. 等于0.10
?
B. β,而β未知
?
C. 等于0.90
?
D. 1-β,且β未知
55、对于R×C行列表的X2检验,其自由度计算公式为:()
?
A. R-1
?
B. C-1
?
C. (R-1)(C-1)
? D. R×C-1
56、某研究欲比较正常人(n1=10)与单纯肥胖者(n2=8)血浆总皮质醇是否有差异,采用秩和检验。计算得T1=96.5,T2=74.5,查两样本比较的秩和检验用T界值表:当双侧α=0.1时,T界值范围为56~96;当双侧α=0.05时,T界值范围为53~99;当双侧α=0.01时,T界值范围为47~105。则P值为:()
? A. P>0.10
? B. 0.05 < P < 0.10
? C. P=0.05
? D. 0.01 < P < 0.05
57、下列符号中表示总体参数的是:()
? A. t
? B. π
? C. χ2
? D. x
58、下列关于均数的标准误的叙述错误的是:()
? A. 是样本均数的标准差
? B. 反映样本均数抽样误差大小
? C. 与成正比,与n成反比
? D. 其值越大,用样本均数估计总体均数的可靠性越好
59、采用正态近似法估计总体率的置信区间,要求:()
? A. n≥50
? B. P不接近与0
?
C. np或n(1-p)大于5
?
D. np与n(1-p)均大于5
60、为了反映某地区五年期间鼻咽癌病例的年龄分布,可采用___
?
A. 直方图
?
B. 普通线图
?
C. 半对数线图
?
D. 复式直条图
第二大题:多项选择题
1、当四格表的周边合计数不变时,若某个格子的实际频数有变化,则其理论频数说法不正确的是:
?
A. 增大
?
B减小
?
C. 不变
?
D. 不确定
?
E. 随该格实际频数的增减而增减
2、方差分析的条件是
?
A. 各样本相互独立
?
B各样本来自正态总体
?
C. 各处理组总体方差相等
?
D. 样本例数大于50
?
E. 各处理组样本例数应相等
3、频数表可用于
A. 揭示资料分布类型
B揭示资料分布特征
C. 发现可疑值
D. 计算某些统计指标
E. 参数估计
4、某医生对患某病的10例成年男性患者的血清蛋白含量与血红蛋白含量资料进行分析,得到两变量的相关系数为=0.916,且P<0.001,下列说法正确的是()
?
A. 两变量呈正相关关系
?
B两变量呈负相关关系
?
C. 两变量不存在相关关系
?
D. 两变量间相关关系密切
?
E. 两变量间相关关系较弱
5、两样本比较的t 检验的适用条件为( )
?
A. 资料须为数值变量资料
?
B资料服从正态分布
?
C. 两总体方差相等
?
D. 任何资料类型
?
E. 不确切数据资料
6、某研究调查了某地100名高血压患者的血胆固醇含量,经计算其均数为6.58mmol/L,标准差为1.23mmol/L,当样本含量增大到500人时,以下说法不正确的是:( )
?
A. 标准差会变小
?
B标准差会变大
?
C. 标准误会变小
?
D. 标准误会变大
?
E. 标准差与标准误均不变
7、X2检验可用于:()
?
A. 两个及两个以上样本均数的比较
?
B配对设计两个样本率的比较
?
C. 多个样本率或构成比的比较
?
D. 频数分布的拟合优度检验
?
E. 率的线性趋势检验
8、下列指标中可用于描述频数分布集中趋势的指标有:()
?
A. 全距
?
B. 标准误
?
C. 均数
?
D. 变异系数
?
E. 中位数
9、当两总体方差相同时,以下方法适用于两样本均数比较的是:()
?
A. t检验
?
B. t’检验
?
C. Z检验
?
D. 方差齐性检验
?
E. 方差分析
10、两样本均数比较时,已知n1、n2均小于30、总体方差不齐且呈极度偏态的资料宜用()
? A. t’检验
? B. t检验
? C. u检验
? D. 秩和检验
?
E. 没有合适的统计方法
11、假设某地35岁以上正常成年男性收缩压的总体均数为120.2mmHg,标准差为
11.2mmHg,从该地随机抽取20名35岁以上正常成年男性,其平均收缩压为112.8mmHg,又从该地随机抽取10名7岁正常男孩,测得其收缩压为90.5mmHg,标准差为10.4mmHg,则下列说法不正确的是:( )
?
A. 112.8mmHg与120.2mHg不同是由系统误差造成
?
B112.8mmHg与120.2mHg不同是由两总体均数不同造成
?
C. 90.5mmHg与112.8mmHg不同是由抽样误差造成
?
D. 90.5mmHg与120.2mHg不同是由抽样误差造成
?
E. 90.5mmHg与112.8mmHg不同是由两总体均数不同
12、下列属于相对比的指标是:()
?
A. 相对危险度RR
?
B比值比OR
?
C. 病死率
?
D. 变异系数
?
E. 性比例
13、某研究用甲、乙两种方法测量某市10处水源中氟含量(mg/L),采用Wilcoxon符号秩和检验比较两种方法测量结果有无差别,下列编秩方法错误的是:()
?
A. 差值从小到大编秩
?
B差值的绝对值从小到大编秩
?
C. 差值从大到小编秩
?
D. 差值的原始值从大到小统一编秩
?
E. 原始值从小到大分别编秩
14、若样本相关系数r=0,则下列说法不正确的是:( )
?
A. 两变量(x, y)不存在任何关系
?
B两变量存在相互关系的可能性很小
?
C. 两变量的关系尚不能确定
?
D. 两变量间必然存在某种曲线关系
?
E. 两变量间不存在直线关系,但不排除存在某种曲线关系
15、对于服从双变量正态分布的资料,如果直线相关分析算出的r值越大,则经回归分析
得的相应的b值,下列说法不正确的是()
?
A. 越大
?
B越小
?
C. 比r小
?
D. 比r大
?
E. 可能较大也可能较小
16、在多组均数的两两比较中,若不用q检验而用t检验,则下列不正确的是:( )
?
A. 结果更合理
?
B结果一样
?
C. 会把一些无差别的总体判断为有差别
?
D. 会把一些有差别的总体判断为无差别
?
E. 因条件不足,尚不能判断
17、关于t分布,下列叙述正确的是:()
?
A. t分布是以0为中心,左右对称的一簇单峰曲线
?
B自由度越小,曲线峰度越低,尾部越高
?
C. 当自由度趋近于无穷大时,t分布就是标准正态分布
?
D. 自由度相同时,t的绝对值越大,概率P值就越小
?
E. 自由度越大,相同概率值的t界值越大
18、下列指标,属于绝对数的是:()
?
A. 甲区的急性传染病人数为乙区的1.25倍
?
B甲区某年急性传染病的发病率为382/ 10万
?
C. 甲区占某市急性传染病的比重为18%
?
D. 某区某男身高为168厘米
?
E. 甲区某年急性传染病人数为2600人
19、下列属于非参数检验方法的是:()
?
A. t检验
?
B. H检验
?
C. Wilcoxon符号秩和检验
?
D. 方差分析
?
E. M检验
20、下列关于相关系数r的说法错误的是:( )
?
A. 根据|r|大小可将两变量关系分为低、中、高度相关
?
B根据两组的|r|可直接比较相关密切程度
?
C. 若r > 0.5,则x和y必存在线性相关
?
D. 得r值后尚须作假设检验才能确定x和y有无线性相关
?
E. 正态双变量资料可以根据对b的假设检验对r作出判断
第三大题:简答题
1、计算参考值范围的方法有那些。
答:正态分布法和百分位数法。(2分)
当指标服从正态分布时,用正态分布法;(1.5分)不服从正态分布时,用百分位数法。
(1.5分)
2、方差分析的基本思想及应用条件是什么?
答:基本思想:将全部观察值的总变异按设计类型分解成两个或多个组成部分,然后将各
部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。(3分)
应用条件:各样本是相互独立的随机样本,且服从正态分布,各样本的总体方差齐性。(2
分)
3、简述率的标准化需要注意的问题。
答:(1)标准化法的目的是为了通过选择同一参照标准,消除混杂因素的影响,使算得
的标准化率具有可比性。但标准化率并不代表真实水平,选择标准不同,计算出的标准化
率也不相同。因此标准化率是用于相互间的比较,实际水平应采用未标化率来反映。(2
分)
(2)样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率
是否相同,需作假设检验。(1分)
(3)注意标准化方法的选用。如对死亡率的年龄构成标准化,当已知被标化组的年龄别
死亡率时,宜采用直接法计算标准化率。但当被标化组各年龄段人口数太少,年龄别死亡
率波动较大时,宜采用间接法。(1分)
(4)各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜
分层比较各年龄组率。此外,对于因其它条件不同,而非内部构成不同引起的不可比性问
题,标准化法难以解决。(1分)
4、简述患病率和发病率的区别。
答:发病率表示在一定时期内,可能发生某病的一定人群中新病例出现的频率,其分子是一定期间内的新发病例数。(2分)
患病率指在某特定时间内总人口中某病新旧病例所占比例,适用于病程较长的疾病或发病时间不易明确的疾病的统计研究,按观察时间的不同可分为时点患病率和期间患病率。(1分)
时点患病率用于反映在调查或检查时点一定人群中某病的现患情况(包含该病的新、旧病例);(1分)
期间患病率可用于反映在观察期间内一定人群中存在或流行某病的频度,包括观察期间内的新病例数和现患病例数,但资料收集较为困难。(1分)
5、请举例说明什么是总体和样本。
答:总体:是根据研究目的确定的所有同质观察单位某种观察值的集合,通常有无限总体和有限总体。(2分)例:略。(1分)
样本:是从总体中抽取部分观察单位其实测值的集合。(1分)例:略。(1分)
6、在完全随机设计的方差分析中SS总、SS组间、SS组内各表示的含义?
答:
SS总是各观测值与总均值之差的平方和,即总的离均差平方和,表示总变异的大小(2分);
SS组间表示组间变异,指各处理组均值大小的不同,是有处理因素和随机误差造成的(2分);
SS组内表示组内变异,指同一处理组内部给观察值之间的变异,是由随机误差造成的。(1分)
7、简述非参数统计方法的应用条件。
答:(1)资料不服从正态分布、方差齐或总体分布类型未知(1分)
(2)等级资料(1分)
(3)个别数值偏大或某一端为确定数值(1分)
(4)在资料满足参数统计的要求时,应首选参数法,以免降低检验效能。(2分)
8、简述实验设计和调查设计的主要区别。
答:调查设计指在没有任何干预措施的条件下,客观的观察和记录研究对象的现状及其相关特征,(2分),影响因素较多,误差较难控制。(1分)
实验设计指研究者根据研究目的,主动加以干预措施,并观察其结果,回答研究假设所提出的问题,(1分)影响因素较少,较易控制误差。(1分)
9、简述小概率事件原理。
答:当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件。(2分)其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是小概率事件的原理,也是进行统计推断的基础。(3分)
10、参数统计和非参数统计的区别。答:
(1)参数检验是以特定的总体分布为前提,对未知总体参数做推断的假设检验方法;非参数检验不以特定的总体分布为前提,也不针对决定总体分布的参数做推断。(2分)(2)非参数检验不要求总体的分布类型,适用性广泛;在非参数检验中,一般不直接用样本观察值做分析,统计量的计算基于原数据在样本中的秩次,因此损失了部分样本信息。(2分)
(3)若对符合参数检验条件的资料用非参数检验,则检验效能低于参数检验。因此对于符合参数检验的资料,或经变量变换后符合参数检验的资料应首选参数检验;对不满足参数检验条件的资料,应选用非参数检验。(1分)
11、简述Pearson积距相关与Spearman秩相关的区别和联系。
答:
区别:(1)Pearson积矩相关适用于二元正态分布资料,Spearman秩相关适用不服从正态分布、总体分布未知、存在极端值或原始数据用等级表示的资料。(1分)
(2)Pearson积矩相关是基于原始数据进行统计分析,而Spearman秩相关是将原始数据进行秩变换后进行统计分析。Pearson积矩相关是参数检验方法,而Spearman秩相关不以特定的总体分布为前提,为非参数检验的方法。(2分)
联系:(1)两种相关系数的取值都介于-1和1之间,无单位,小于0 为负相关,大于0为正相关。(2)用原始数据的秩次来计算Pearson相关系数,得到的即为Spearman秩相关系数。(2分)
12、可信区间与医学参考值范围的区别。
答:(1)意义不同:可信区间:按一定的置信度(1-a )估计总体均数所在的范围;医学参考值范围:大多数“正常人:的某项解剖、生理、生化指标的波动范围。(2分)(2)计算公式不同:可信区间用的是标准误,而医学参考值范围用的是标准差。(2分)(3)用途不同:可信区间用于总体均数的估计和假设检验,医学参考值范围是用于判断观察对象的某项指标是否正常,为临床提供参考。(1分)
13、t检验中是否都应采用双侧检验?
答:t检验中是选择单侧检验还是双侧检验,需根据专业知识来确定。(3分)例如,根据专业知识能确定未知总体均数不会大于已知总体均数时,此时则用单侧检验,否则,采用双侧检验。(2分)
14、标准差和标准误的区别和联系是什么?
答:
区别:1)计算公式不同:标准差,
()
1
2
-
-
=
n
X
X
S标准误
n
S
S
X
=;(1分)
2)统计学意义不同:标准差越小,说明个体越集中,均数对数据的代表性好;标准误越小,说明抽样误差越小,用样本均数来估计总体参数的可能性越大;(1分)
3)用途不同:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。(1分)
联系:当样本量n 一定时,标准误随标准差的增加而增加,公式为n
S S X =
。(2分)
15、简述x 2检验的基本思想。
答:基本思想:判断实际频数与理论频数的差别是否由抽样误差所引起,x 2值的大小反映了实际频数与理论频数的吻合程度。(2分)在H 0成立的条件下,实际频数与理论频数相差不应该很大,若计算得到较大的x 2值,超过了事先设定的检验水准所对应的x 2值,则P <0.05,说明实际频数与理论频数的较大差别是由抽样误差所引起的可能性很小,有理由拒绝H 0 ,接受H 1 。
16、简述回归方程bx a y +=^
中a 、b 的含义? 答:
α :即截距,表示x=0时,^
y 的值。(2.5分)
b :即直线的斜率,表示自变量x 改变一个单位时,应变量y 平均变化b 个单位。(2.5分)
第四大题:判断分析题
1、某地抽样调查360名健康成年男子的红细胞数,均数为4.66×1012/L ,标准差为0.58×1012/L ,故该研究者得出该地健康成年男子的红细胞数的95%可信区间为(4.66±1.96×0.58) 1012/L 。请问该结论是否正确,并说明理由。 答:不正确.
可信区间用的是标准误,而95%医学参考值范围用的才是标准差,(1分)该题求的95%可信区间用的是标准差,混淆了标准差和标准误的区别,故该结论不正确。(1分) 2、研究某药治疗口腔扁平苔癣的疗效,经假设检验P<0.05,按=0.05水准拒绝H 0,认为该药效果优于对照药。但某医生怀疑检验效能是否足够大,你认为这种怀疑对吗?简述理由。
答:不正确。(2分)
检验效能,即1-是指两总体参数间确实存在差异,则,按照现有检验水准,检验出其差别的能力。(1分)当样本含量一定时,与成反比,与1-成正比,(1分)因为P<0.05已经检验出差异,在这种情况下只可能犯I 型错误,不用再考虑检验效能了。(1分)
3、在临床实验中,样本含量越大越好。该说法是否正确,请说明理由。 答:不正确。(2分)
样本含量越高,会增加研究的成本,而且会降低科学研究的可操作性,应选择适当的样本含量,既能满足科研的统计学要求,又能最大限度的控制成本和研究风险,提高研究效率。(2分)
4、在完全随机设计的方差分析中,变异分解为MS 总=MS 组间+MS 组内,该分解是否正确,请说明理由。
答:不正确。(2分)
完全随机设计资料只有一个研究因素,目的在于比较两个或多个处理组的总体均数是否不同。完全随机设计资料的总离均差平方和可以分解为MS 组间和MS 组内两部分,即SS 总=SS 组间+SS 组内。
5、“200例肝癌的病因与临床分析”研究中,男性120例,占60.0%,女性40例,占40%,因此认为男性肝癌的发病率高于女性。试述该结论是否正确,并说明理由。 答:不正确。(2分)
它犯了以构成比代替率的错误。(2分)
6、某班级全体男生32人,其平均身高为175.6cm ,女生26人其平均身高为162.0cm ,对其进行假设检验,测得P<0.05,可以认为男女身高不等。该分析是否正确?请说明理由。 答:不正确。(2分)
本研究的目的是全班同学不同性别间血压的比较,因该题已经知道了全班男女身高的平均身高值,即已知了总体均数,不是抽样研究,没有抽样误差,所以不需要假设检验,所以该分析不正确。(2分)
7、某研究者测得159名正常成年男性矿工的血红蛋白,红细胞的均数分别为:15g/dL 、520万/mm3,标准误分别为0.5g/dL 、12万/ mm3,由于0.5比起12来要小得多,因此有结论“红细胞数的变异大于血红蛋白的变异度”。此结论是否合理?请说明理由。 答:不正确。(2分)
标准误是表示抽样误差大小的,要比较两指标的变异程度的大小应用变异系数比较,所以改说法不正确。(2分)
8、在双变量正态分布的相关与回归分析中,|| 值越大,则 |b| 越大。该说法正确吗?请说明理由。
答:不正确。(2分)
因为在双变量正态分布资料中, 与b 同号,且其假设检验等价,但无能肯定 ||值越大,则|b| 越大。(2分)
9、某研究者欲比较甲乙两地高血压患病率,资料见下表:
是否正确?请说明理由。(4分)
答:不正确。(2分)
从资料可以看出,甲地各年龄组的高血压患病率均高于乙地,但由于甲乙两地调查对象的年龄构成不同,甲地的年轻调查对象的构成比更大,最终导致其合计患病率反而更低,应将两地患病率进行标准化后再比较。故该结论不正确。(2分)
10、将20名某病患者随机分成两组,分别用甲乙两种药物治疗,用药一个月后测得治疗前后血沉(mm/h)如下表。要分析甲乙两种药物的疗效有无差别,某医生分别将甲乙两种药物治疗后的血沉值进行两样本均数的t检验,得到的结论为甲乙两种药物的疗效无差别。该结论是否正确,请说明理由。(4分)
由于甲、乙组治疗前的数据不一样,只用治疗后的数据进行分析,只能说明两组治疗后的血沉不同,而不能说明甲乙两药的疗效有无差别。要比较甲乙两药疗效有无差别,应分别将甲乙两药各自治疗前后的血沉值作差值,比较两组差值的均数是否有差别。(2分)11、已知某病潜伏期服从偏态分布,某医生收集了37名男性患者的潜伏期资料,欲采用均数、标准差描述其集中位置和离散程度,该医生所选指标是否合理?请说明理由。答:不正确。(2分)
该资料为负偏态分布,应用中位数和四分数间距来表示其集中趋势和离散趋势。(1分)而均数和标准差是用于正态分布的资料,所以所选指标不正确。(1分)
12、某工厂保健站在调查中发现946名工人中,患慢性病的274人,其中女性219人,占80%,男性55人,占20%,由此得出结论,女工易患慢性病。该说法正确吗?请说出理由。(4分)
答:答:不正确。(2分)
犯了以构成比代替率的错误。(2分)
13、某地抽样调查360名健康成年男子的血红蛋白含量,均数为154.50g/L,标准差为7.10 g/L,则该地健康成年男子的血红蛋白含量的95%区间估计为(154.50±1.96×7.10)g/L。该方法是否正确?请说明理由。
答:不正确。(2分)
计算参考值范围用的是标准差,计算可信区间用标准误,该题计算血红蛋白含量的95%可信区间用的是标准差,所以该方法不正确。(2分)
14、某研究探讨体表面积与体重的关系,分别进行了直线相关与回归分析,得到r=0.78,b=-1.6。该分析结果是否正确?请说明理由。(4分)
答:不正确。(2分)
一般来说,体表面积和体重均服从正态分布。对同一双变量正态分布的资料进行直线相关与回归分析,r应该与b同号。但该题中得出r与b的符号相反,故该结论不正确。(2分)
15、某医生认为“成组设计的两样本比较时,t检验总比秩和检验好”,试述该结论是否正确,请说明理由.
答:不正确。(2分)
当资料不服从正态分布、方差齐或总体分布类型未知;等级资料;个别数值偏大或某一端为确定数值时,用秩和检验,在资料满足参数统计的要求时,而选t检验时,则会降低检验效能。(2分)
16、“196例胰腺癌的病因与临床分析”研究中,男性140例,占71.43%,女性56例,占28.57%,因此认为男性胰腺癌的发病率高于女性。试述该结论是否正确,并说明理由。答:不正确。(2分)
它犯了以构成比代替率的错误。(2分)
17、某医院为了解某药治疗高血压的疗效,实验组40高血压患者中有15例有效,对照组50人,有效10人,得出X2=9.753,P<0.05,因此认为激素疗法治疗肾上腺样瘤有效。试述该统计分析方法是否正确,并说明理由。
答:不正确。(2分)
因为n=36<40,应该用四格表的确切概率法进行检验。(2分)
18、为研究年龄(岁)与牙齿AKP酶反应活性的关系,某医生在其接诊的病人中随机抽取281例患者,其年龄(分为3个等级)和牙齿AKP酶反应活性分布见下表,经卡方检验,
得X 2=84.533,P <0.005,按0.05检验水准,拒绝H 0,可认为不同年龄患者的AKP 酶反应活性不同,两者之间有关系。以上分析正确吗?说明理由。
该案例是对同一份样本的两个分类变量之间的关联性进行分析,检验的计算方式不变,结果仍为84.533,但下结论时最好不要从“不同年龄的AKP 酶反应活性不同”演绎到“两变量有关系”,而应为“按=0.05水准,拒绝H 0,可认为年龄与AKP 酶反应活性之间有关”,此外,可结合列联系数说明其关联强度,
481.0281
533.84533
.8422=+=
+=
n
χχγ。(1分)
由于年龄与AKP 酶反应活性都是有序分类变量,可考虑进行Spearman 秩相关分析,得
487.0-=S γ,单侧P<0.001,可认为随着年龄的增加,AKP 酶反应活也降低。(1分) 19、某地抽样调查360名健康成年男子的血红蛋白含量,均数为154.50g/L ,标准差为7.10 g/L ,则该地健康成年男子的血红蛋白含量的95%区间估计为(154.50±1.96×7.10)g/L 。该方法是否正确?请说明理由。 答:不正确。(2分)
混淆了医学参考值范围与可信区间,可信区间用的是标准误,而医学参考值范围用的是标准差,该题他用的是标准差,所以不正确。(2分)
20、将100名脑血栓患者随机分成两组,分别采用纳洛酮和复方丹参治疗,比较两组患者起效时间,资料如表下所示。某研究者进行x 2检验,得x 2=10.762,P=0.013,故认为两组患者起效时间有差异。该结论是否正确?请说明理由。
答:不正确。(2分)
起效时间为单向有序的分类资料,卡方检验只能说明其构成不同。要比较两组患者起效时间的长短有无差别,应用秩和检验。(2分) 第五大题:计算分析题
1、将18名某病患者随机分成两组,分别用药物A 或药物B 治疗,观察治疗前后血色素变化,测得血色素差值(g/l)资料见下表,欲比较两药疗效有无差别。
表2 18
请回答:
(1)上题资料类型和设计类型。
(2) A 、B 两药的疗效有无差别?并写出基本分析步骤,不必计算。 答:(1)定量资料。(2分)成组设计两样本均数的比较。(2分) (2)建立检验假设,确定检验水准(2分) H 0:A 、B 两药的疗效有无差别 H 1:A 、B 两药的疗效有差别 a=0.05
计算检验统计量(4分)
确定P 值,作出统计推断(2分)
查t 界值表,得P>0.05,不拒绝H 0,差异无统计学意义,可以认为两药的疗效无差别。 2、某地用A、B、C三种方案治疗血红蛋白小于10克的婴幼儿贫血患者,每种方案治疗20名贫血患儿,治疗一个月后,记录下每名患儿血红蛋白的上升克数,问三种治疗方案对婴幼儿贫血的疗效是否相同?(假设满足参数检验的条件) 请回答:
(1) 写出具体的检验假设H 0和备择假设H 1
答:(1)H 0:三种治疗方案对婴幼儿贫血的疗效相同 H1:三种治疗方案对婴幼儿贫血的疗效不全相同 =0.05(2分) (2)(4分)
三种治疗方案对婴幼儿贫血的疗效不全相同。(4分)。若要知道两两之间是否不同,需用SNK 法进行两两比较,来得到两两比较的结果。(2分) 系统提示:如果您需要绘制表格,
可选择使用以下任意方式:
1、通过表格编辑工具,点击答题区域下的"插入表格"图标弹出表格编辑工具[推荐];
2、插入横线;点击答题区域下的"插入横线"图标插入横线;
3、通过"Shift"加"-"组合键输入横线。
3、某研究欲探讨64排螺旋CT 和高分辨率HRCT 在煤工尘肺肺气肿检出方面的差异,选择96
例I 期煤工尘肺患者,进行64排螺旋CT 和高分辨率HRCT 扫描检查,结果两种CT 均检出肺气肿73例,均未检出14例,螺旋CT 检出而高分辨率HRCT 未检出者2例。
请回答:
(1) 该研究设计属于何种类型?资料属于什么类型? (2) 将资料整理成合理的表格形式。
(3) 为达到研究目的,宜选用什么统计方法?并写出基本分析步骤,不必计算。 答:(1)配对设计; (2)分类资料. (2分) (2)(3分)
(3)宜选用配对卡方检验(1分)
建立检验假设,确定检验水准(1分) H 0: 两种方法的检出率有无差别 H 1: 两种方法的检出率有有差别 =0.05
计算检验统计量(3分)
因为b +c =7+2=9<40,故用校正的公式:
V=1
确定P 值,作出统计推断(1分)
查X 2界值表,得P >0.05,按=0.05水准,不拒绝H 0,差异无统计学意义,尚不能认为两种方法的检出率不同。
系统提示:如果您需要绘制表格,可选择使用以下任意方式:
1、通过表格编辑工具,点击答题区域下的"插入表格"图标弹出表格编辑工具[推荐];
2、插入横线;点击答题区域下的"插入横线"图标插入横线;
3、通过"Shift"加"-"组合键输入横线。
4、 经研究显示:汉族正常成年男性环指长度的均数为10.1cm ,某医生记录了某地区正常成年男性环指长度资料(cm )如下:
10.05 10.33 10.49 10.00 9.89 10.15 9.52 10.33 10.16 10.37 10.11 10.27 问该地区正常成年男性环指长度是否大于一般汉族成年男性? 答:建立检验假设,确定检验水准(1分) H 0:=10.1 H 1: >10.1 单侧 =0.05
计算检验统计量(7分)
2595.0,1392.10==S X
523.012
2595.010
.101392.10=-=-=
X S X t μ v=12-1=11
确定P 值,作出统计推断(2分)
查t 界值表,得p>0.25,按=0.05水准,不拒绝H 0 ,差异无统计学意义,尚不能认为该地区正常成年男性环指长度大于一般汉族成年男性。
5、 用TrFIA 法与MEIA 法共检测抗-HBc 302例,其中TrFIA 法检测阳性者236例;MEIA 法检测的阳性者234例;两法同为阳性者 226例。
请问:
(1) 该资料属何种类型? (2) 该资料属何种设计? (3) 请整理出相应表格。
(4) 两法检出率是否有差别?请写出基本步骤,不必计算。 答:答:(1)分类资料(2分) (2)配对设计(2分) (3)(3分)
建立检验假设,确定检验水准(1分) H 0: 两种方法的检出率有无差别 H 1: 两种方法的检出率有有差别 =0.05
因为b+c=8+10=18<40,故用校正的公式:
v=1
确定P 值,作出统计推断(1分)
查 X 2界值表,得P>0.05,按 =0.05 水准,不拒绝H 0,差异无统计学意义,尚不能认为两种方法的检出率不同。
系统提示:如果您需要绘制表格,可选择使用以下任意方式:
1、通过表格编辑工具,点击答题区域下的"插入表格"图标弹出表格编辑工具[推荐];
2、插入横线;点击答题区域下的"插入横线"图标插入横线;
3、通过"Shift"加"-"组合键输入横线。
6、某医生研究不同方案治疗缺铁性贫血的效果,将36名缺铁性贫血的患者随机分成三组,分别给予A 、B 、C 三种处理,测得一个月后患者红细胞的升高数(1012/L )资料见下表。(13分)
12
问:(1(2)问三种处理有无差别?请写出具体过程,不要求计算。
答:(1)定量资料;完全随机设计。(4分)
(2)建立检验假设,确定检验水准(1分)
H0: 两药疗效无差别
H1:两药疗效有差别
计算检验统计量(5分)
确定P值,作出统计推断(2分)
查t界值表,得P>0.05,按检验水准,不拒绝H0,差异无统计学意义,尚不能认
为两种药物的疗效有差别。
8、某医院用三种疗法治疗慢性喉炎,治疗结果见下表
(1
(2)三种疗法治疗慢性喉炎效果有无差别?
答:
7、将18名某病患者随机分成两组,分别用药物A或药物B治疗,观察治疗前后血色素
变化,测得血色素差值(g/l)资料见下表,欲比较两药疗效有无差别。
18
请回答:
(1)上题资料类型和设计类型。
(2) A、B两药的疗效有无差别?并写出基本分析步骤,不必计算。
答:
9、对96例I期煤工尘肺患者,分别采用螺旋CT和HRCT扫描检查肺气肿患病情况,结果如下表所示:
两种CT
答:建立检验假设,确定检验水准(1分)
H0:两种方法检查煤工尘肺肺气肿的检出率无差异
H1:两种方法检查煤工尘肺肺气肿的检出率有差异
α=0.05
计算检验统计量
因为b+c=9<40,宜采用配对四个表X2检验的校正公式,得:(1分)
(5分)
v=1(2分)
确定P值,作出统计推断(2分)
查X2界值表,得P>0.05,按α=0.05水准,不拒绝H0,差异无统计学意义,尚不能认为两种方法的检出率不同。
10、用甲、乙两种方法检测伤寒杆菌,收集到100份样本,结果见下表。
问:(1
(2)该研究是哪种设计类型?
(3)两种方法的检出率有无差别?写出计算步骤及结果。
答:
答:(1)分类资料(2分)
(2)配对设计(2分)
(3)建立检验假设,确定检验水准(2分)
H0: 两种方法的检出率有无差别
H1: 两种方法的检出率有有差别
α=0.05
计算检验统计量(4分)
因为b+c=18+16=34<40,故用校正的公式:
v=1
确定P值,作出统计推断(2分)
查x2界值表,得P>0.05,按α=0.05
水准,不拒绝H0,差异无统计学意义,尚不能认为两种方法的检出率不同。
11、测得铅作业与非铅作业的血铅值(ug/100g),见下表,问铅作业的血铅值是否高于非铅作业工人?(11分)
H0:两总体分布位置相同
H1:两总体分布位置不同
α=0.05
计算检验统计量T(7分)
将两样本数据由小到大统一编秩,见下表。由于两个相同的观察值18,原秩次为10和11,
T。
确定
按n2-n1=3,查T界值表,P<0.05,按α=0.05水准,拒绝H0,接受H1,可认为铅作业工
人的血铅值与非铅作业的血铅值有差别。
12、用两种方法测定10名工人尿汞值(mg/ml)如下表:
两种方法测定尿汞结果
(1
(2)请选用适当的统计方法,评价不同方法测定尿汞含量有无差别?写出必要的步骤,
不必计算。
答:
(1)定量资料;配对设计(2分)
(2)建立检验假设,确定检验水准(2分)
H0: 两种方法测定结果无差别
H1:两种方法测定结果有差别
α=0.05
计算检验统计量(6分)
确定P值,作出统计推断(2分)
一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n
一、名词解释 1.概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。 2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 3.医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95% 4.总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。 4.总体:根据研究目的所确定的同质观察单位的全体。 5.线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 二、填空题 1.统计资料的类型分:计量资料、计数资料、等级资料。 2.统计工作的步骤分为:统计设计、收集资料、整理资料、分析资料。 3.统计表的结构为:标题、标目、线条、数字。 4.可信区间的两个要素是:准确度、精密度。 5.方差分析的应用条件为:①各组样本是相互独立的随机样本 ②来自正态总体③各组总体方差相等,即方差齐性。 6.描述正态分布曲线形态的指标是σ,描述t分布曲线形态的指标是ν。 7.从集中趋势、离散趋势两个方面来描述计量资料的分布特 征。 三、单项选择题(请把正确答案写在下面的表格里,每题2分,共20分) 1.将90名高血压病人随机等分成三组后分别用 A、B 和 C 方 法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是 C A 作三个差值样本比较的 t 检验 B 作三个差值样本比较的方差分析 C 作配伍组设计资料的方差分析 D 作两两比较的 t 检验 2.某地1952和1998年三种死因别死亡率绘制成统计图,宜用 B A 直条图 B 百分条图 C 圆图 D 直方图 3.下列哪个变量为标准正态变量 B A s xμ - B σ μ - x C x s xμ - D x x σ μ - 4.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 B A 均数 B 几何均数 C 标准差 D中位数 5.配对设计的目的 D A 提高测量精度 B操作方便 C为了可以使用t检验D提高组间可比性 6.测定尿铅含量有甲乙两种方法。现用甲乙两法检测10份相同样品,要比较两法测得的结果有无差别,宜用 A A 配对设计t检验 B 成组设计的t检验 C均数的u检验 D 方差分析 7.应变量Y的离均差平方和划分,可出现 A A SS剩=SS回 B SS总=SS剩 C SS总=SS回 D 以上均可 8.相关系数r与决定系数2r在含义上是有区别的,下面表述中最正确的是 C A r值的大小反映了两个变量之间是否有密切的关系 B r值接近于零,表明两变量之间没有任何关系
医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。
(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数
预防医学复习题(统计部分) 复习重点(及简答题) 1. 医学统计学的基本概念 如:总体与样本的联系区别 2. 资料的分类 如:请列举资料的类型并举例说明 3. 定量资料统计描述的指标(集中与离散趋势) 如:定量统计描述指标有哪些? 如:正态分布与偏态分布资料统计描述方法有何区别 4. 定性资料统计描述的指标 5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律 如:正态分布、标准正态分布与t分布的区别联系 6. 小概率事件在医学统计学的应用(P值的含义) 如:P值的含义是什么,对统计结论有何意义 7. 假设检验的基本原理与步骤 8. 四种主要统计假设检验方法及其应用场合 9. 统计表的绘制 选择题 1.样本是总体中: A、任意一部分 B、典型部分 C、有意义的部分 D、有代表性的部分 E、有价值的部分 2、参数是指: A、参与个体数 B、研究个体数 C、总体的统计指标 D、样本的总和 E、样本的统计指标 3、抽样的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 4、脉搏数(次/分)是: A、观察单位 B、数值变量 C、名义变量 D.等级变量 E.研究个体 5、疗效是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 6、统计学常将P≤0.05或P≤0.01的事件称 A、必然事件 B、不可能事件 C、随机事件 D、小概率事件 E、偶然事件7.统计中所说的总体是指:
A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体 8.概率P=0,则表示 A某事件必然发生B某事件必然不发生C某事件发生的可能性很小 D某事件发生的可能性很大E以上均不对 9.总体应该由 A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成 10. 在统计学中,参数的含义是 A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量 11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料 B.计量资料 C.总体 D.个体 E.样本 12.统计学中的小概率事件,下面说法正确的是: A.反复多次观察,绝对不发生的事件 B.在一次观察中,可以认为不会发生的事件 C.发生概率小于0.1的事件 D.发生概率小于0.001的事件 E.发生概率小于0.1的事件 13、统计上所说的样本是指: A、按照研究者要求抽取总体中有意义的部分 B、随意抽取总体中任意部分 C、有意识的抽取总体中有典型部分 D、按照随机原则抽取总体中有代表性部分 E、总体中的每一个个体 14、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。 A、计算 B、计数 C、计量 D、等级 E、都对 15、红细胞数是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 16、某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为: A.所有成年男子 B.该市所有成年男子 C.该市所有健康成年男子 D.120名该市成年男子 E.120名该市健康成年男子 17、某地区抽样调查1000名成年人的血压值,此资料属于: A、集中型资料 B、数值变量资料 C、无序分类资料 D、有序分类资料 E、离散型资料 18、抽样调查的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 19、测量身高、体重等指标的原始资料叫: A计数资料 B计量资料 C等级资料 D分类资料E有序分类资料 20、某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗数8 23 6 3 1
第一章健康管理概论 健康管理是以现代健康概念(生理、心理和社会适应能力)和新的医学模式(生理、心理、社会)以及中医治未病为指导,通过采用现代医学和现代管理学的理论、技术、方法和手段,对个体或群体整体健康状况及其影响健康的危险因素进行全面检测、评估、有效干预与连续跟踪服务的医学行为及过程。 其目的是以最小投入获取最大健康效益。 健康管理的八大目标: 1.完善健康和福利 2.减少健康危险因素 3.预防疾病高危人群患病 4.易化疾病的早期诊断 5.增加临床效用、效率 6.避免可预防的疾病相关并发症的发生 7.消除或减少无效或不必要的医疗服务 8.对疾病结局作出度量并提供持续的评估和改进 健康管理的特点: 标准化足量化个体化系统化 健康管理的三个基本步骤: 1.了解和掌握健康,开展健康信息收集和健康检查 2.关心和评价健康,开展健康风险评价和健康评估 3.干预和促进健康,开展健康风险干预和健康促进 健康风险评估是手段,健康干预是关键,健康促进是目的 健康管理的五个服务流程: 1.健康调查与健康体检 2.健康评估 3.个人健康咨询 4.个人健康管理后续服务 5.专项的健康和疾病管理服务 健康管理的六个基本策略: 1.生活方式管理 2.需求管理 3.疾病管理 4.灾难性病伤管理 5.残疾管理 6.综合群体健康管理 生活方式管理的特点: 1.以个体为中心,强调个体的健康责任和作用
2.以预防为主,有效整合三级预防 生活方式的四大干预技术: 教育激励训练营销 影响需求管理的四大主要因素: 1.患病率 2.感知到的需要 3.消费者选择偏好 4.健康因素以外的动机(残疾补贴、请病假的能力等) 需求管理的策略: 1.小时电话就诊和健康咨询 2.转诊服务 3.基于互联网的卫生信息数据库 4.健康课堂 5.服务预约 疾病管理的三个特点: 1.目标人群是患有特定疾病的个体 2.不以单个病例和(或)其单次就诊事件为中心,而关注个体或群体连续性的健康状况与 生活质量 3.医疗卫生服务以及干预措施的综合协调至关重要 灾难性病伤管理的五大特点: 1.转诊及时 2.综合考虑各方面因素,制订出适宜的医疗服务计划 3.具备一支包含多种医学专科及综合业务能力的服务队伍,能够有效应对可能出现的多种 医疗服务需要 4.最大程度地帮助病人进行自我管理 5.尽可能使患者及其家人满意 残疾管理的八大目标: 1.防止残疾恶化 2.注重功能性能力 3.设定实际康复和返工的期望值 4.详细说明限制事项和可行事项 5.评估医学和社会心理学因素 6.与病人和雇主进行有效沟通 7.有需要时要考虑复职情况 8.实行循环管理 《健康中国2030规划纲要》 1.强调预防为主,防患未然
考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是
《医学统计学》复习提纲 第二章 统计描述 公式:几何均数 (1)直接法: n n X X X G ...21= 或 )lg (lg )lg ...lg lg ( lg 1211 n X n X X X G n ∑--=+++= (2)加权法: )lg (lg ....lg ...lg lg (lg 12122111 ∑ ∑--=++++++=f X f f f f X f X f X f G k k k 中位数(median ) (1) 直接法: n 为奇数 , 2 ) 1(+=n X M n 为偶数,)(21 12 2 ++= n n X X M (2)频数表法:用于频数表资料。 ∑-+ =)2 (L M f n f i L M 标准差(standard deviation ): n X ∑-= 2 ) (μσ 1 ) (2 --= ∑n X X S 离均差平方和 2 ) (∑-X X 常用SS 或l XX 表示。∑∑∑- =-= =N X X X X l SS XX 2 22 )() ( 直接法: 1 )(2 2 --= ∑∑n n X X S 加权法: 1 )(2 2 -- =∑∑ ∑∑f f fX fX S 1. 常用的相对数指标有哪些?它们的意义和计算上有何不同? 2. 为什么不能以构成比代率?请联系实际加以说明。 率和构成比所说明的问题不同,绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。 3. 应用相对数时应注意哪些问题? 4.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。 医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。 制定参考值范围的一般步骤: (1)定义“正常人”,不同的指标“正常人”的定义也不同。 (2)选定足够数量的正常人作为研究对象。
描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99
医学统计复习资料 一、名词解释 [1].总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 [2].样本:从总体中随机抽取部分观察单位,其实测值的集合。 [3].计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。 [4].计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 [5].等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大 小或属性程度。 [6].随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。 [7].概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P (A),P (A)越大,说明A事件发生的可能性越大。0< P (A)< 1。频率:在相同的条件下,独 立重复做n次试验,事件A出现了 m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时 P (A) = m/n 。 [8].平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。 [9].算术均数(arithmetic mean )描述一组数据在数量上的平均水平。总体均数用卩表示,样本均数用X表示。 [10].几何均数(geometric mean )用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 [11].中位数(median ) Md将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。 [12].方差(varianee ):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。 [13].标准差(standard deviation )是方差的正平方根,使用的量纲与原量纲相同,适用于近似正 态分布的资料,大样本、小样本均可,最为常用。 [14].变异系数(coefficient of variation )用于观察指标单位不同或均数相差较大时两组资料变异 程度的比较。用CV表示。计算:标准差/均数*100%。 [15].正态分布:正态分布又称高斯分布,是一种很重要的连续型分布,应用很广。若指标 X的频率 分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。(曲线下面积和分布规律) [16].标准误及X s :通常将样本统计量的标准差称为标准误。许多样本均数的标准差X s称为均数 的标准误(standard error of mean ,SEM ),它反映了样本均数间的离散程度,也反映了样本均 数与总体均数的差异,说明均数抽样误差的大小。 [17].可信区间:按预先给定的概率确定的包含未知总体参数的可能围。该围称为总体参数的可信区 间(con fide nee in terval , Cl)。它的确切含义是:可信区间包含总体参数的可能性是1- a ,而
医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。
医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数
预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1
医学统计学考试重点 The latest revision on November 22, 2020
一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 真实情况拒绝H 不拒绝H
H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)
限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个 观 察单位都有同等的机会被选入到样本中),从总 一、名词解释 1.概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。 2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 3.医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95% 4.总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。 4.总体:根据研究目的所确定的同质观察单位的全体。 5.线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 二、填空题1.统计资料的类型分: 2.统计工作的步骤分为资料。 3.统计表的结构为:标 4.可信区间的两个要素 5.方差分析的应用条件来自正态总体③各组总 6.描述正态分布曲线形标是ν。 7.从集中趋势、离散趋 三、单项选择题(请把共20分) 1.将90名高血压病人 治疗,以服药前后血
限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample )。样 本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 2.随机抽样:随机抽样(random sampling )是指按照随机化的原则(总体中每一个 观 察单位都有同等的机会被选入到样本中),从总 是否相同,正确的是 C A 作三个差值样本比较的 t 检验 B 作三个差值样本比较的方差分析 C 作配伍组设计资料的方差分析 D 作两两比较的 t 检验 2.某地1952和1998年三种死因别死亡率绘制成统计图,宜用 B A 直条图 B 百分条图 C 圆图 D 直方图 3.下列哪个变量为标准正态变量 B A s x μ- B σ μ-x C x s x μ- D x x σμ- 4.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 B A 均数 B 几何均数 C 标准差 D 中位数 5.配对设计的目的 D A 提高测量精度 B 操作方便 C 为了可以使用t 检验 D 提 高组间可比性 6.测定尿铅含量有甲乙 品,要比较两法测得的 A 配对设计t 检验 方差分析 7.应变量Y 的离均差平 A SS 剩=SS 回 B 上均可 8.相关系数r 与决定系数 确的是 C A r 值的大小反映了两 B r 值接近于零,表明 C 2 r 值接近于零,表明
误差:观测值与真实值、样本计量与总体参数之间的差别。 相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。 相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。 统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。 统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 同质:指根据研究目的所确定的观察单位其性质应大致相同。 变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。 定量数据:也称计量资料。变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。 有序数据:也称半定量数据或等级资料。变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。 总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。 参数:描述总体特征的指标称为参数。 统计量:描述样本特征的指标称为统计量。 概率:描述某事件发生可能性大小的度量。 小概率事件:习惯上将P≤0.05的事件称为小概率事件。 平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。 率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。 构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。 线性相关的概念:研究两个变量之间是否具有直线相关关系。 相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。 研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。 处理因素:根据研究目而欲施研究对象的干预措施。 处理水平:处理因素在实验中所处的状态称为因素的水平(level),亦称处理水平。 对照:指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。随机化:是指每个受试对象有相同的概率或机会被分配到不同的处理组。 重复:是指在相同实验条件下重复进行多次观察。 统计学的基本内容:统计设计,数据整理,统计描述,统计判断 数据类型:定量数据,定性数据,有序数据 误差的类型:系统误差,随机测量误差,抽样误差 配对样本t检验配对设计:同源配对,异源配对,自身配对 方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。 非参数检验的适用范围:①总体分布类型未知或非正态分布数据;②有序或半定量资料;③数据两端无确定的数值。 标准差与标准误的区别与联系:区别:标准差:意义,描述个体观察值变异程度的大小,标准差越小,均数对一组观察值的代表性越好。应用,与X拔结合,用以描述个体观察值的