文档库 最新最全的文档下载
当前位置:文档库 › 医学统计学__问答题

医学统计学__问答题

医学统计学__问答题
医学统计学__问答题

1、标准正态分布(u分布)与t分布有何异同?

相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)

不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。

2、标准差与标准误有何区别和联系?

?区别:

1.含义不同:⑴s描述个体变量值(x)之间的变异度大小,s越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。⑵标准误是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。

2.与n的关系不同:n增大时,⑴s σ(恒定)。⑵标准误减少并趋于0(不存在抽样误差)。

3.用途不同: ⑴s:表示x的变异度大小,计算cv,估计正常值范围,计算标准误等⑵:参数估计和假设检验。

?联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。

3、应用相对数时的注意事项有哪些?

1、不要把构成比和率相混淆

2、使用相对数时,分母不能过小,分母过小时相对数不稳定

3、要注意资料的可比性,相比较的资料应是同质的,除了要比较的处理因素外,其他条件

应基本相同。

4、要注意使用率的标准化

5、比较两样本率或构成比时。应考虑存在抽样误差,对于两样本之间的差异应作统计学检

验。

四、计算分析题:(20分)

用甲、乙两种培养基培养结核杆菌45份,得资料如下表,问甲、乙两种培养基的培养效果有无差异?

要求:详细写出检验步骤。

甲乙两种培养基培养结核杆菌的结果

乙的结果

甲的结果

合计+ -

+ 121628

- 41317

合计162945注:χ20.05,1=3.84

1、建立假设并确定检验水平

H0:B=C,即甲、乙两种培养基的培养效果无差异

H1:B≠C,即甲、乙两种培养基的培养效果有差异

α=0.05

2、 计算检验统计量:

222(||1)(|164|1) 6.05164

b c b c χ----===++ 3、 确定P 值,做出推断结论

6.05>3.84,故P<0.05,按α=0.05,差别有统计学意义,拒绝H 0假设,接受H 1假设,可以认为甲乙两种培养基的培养结果的差别有统计学意义。

第一章 医学统计中的基本概念

2、抽样中要求每一个样本应该具有哪三性?

从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。

(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。

(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。

(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。

3、什么是两个样本之间的可比性?

可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。

实习一 统计研究工作的基本步骤

1、什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别? 医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科 统计学:是研究数据的收集、整理、分析与推断的科学。 卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。 生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。

2、医学统计的资料主要来源于那些方面?有何要求?

医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。

这些资料的手机过程中,必须进行质量抗旨,包括它的统一性、确切性、可重复性。这些原始数据的精读和偏性应有明确的范围。

3、医学统计学的资料类型有哪些?

(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。

(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。

(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。

等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。

等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。

4、常见的三类误差是什么?应采取什么措施和方法加以控制?常见的三类误差是:

(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。

(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。

(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。

实习二单变量资料的统计描述

1、试述频数表的要素及用途。

要素:组段,频距。

用途:

①描述资料的分布特征和分布类型。频数分布有两个重要特征:集中趋势和离散趋势。大部分观察值向某一数值集中的趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐。频数由中央位置向两侧逐渐减少,称离散趋势,是个体差异所致,可用一系列的变异指标来反映。

②便于进一步计算有关指标或进行统计分析。当数据较多且需手工计算时,常先编制频数表,再进行统计计算。

③发现特大、特小的可疑值。如果频数表的一端或两端出现连续几个组段的频数为零后,又出现少数几个特大值或特小值,使人怀疑其是否准确,需进一步检查和核对并做相应处理。

④当样本含量比较大时,可用各组段的平率作为概率的估计值。

2、描述单变量资料的统计指标分哪两大类,分别是什么指标?

分类:

①描述数据分布集中趋势的指标:算术均数、几何均数、中位数。

②描述数据分布离散程度的指标:极差、四分位数间距、方差、标准差、变异系数。

3、试述平均数、标准差、变异系数的含义及用途?

4、标准正态分布曲线下面积有何分布规律?

所有的正态分布曲线,在υ左右的相同倍数的标准差范围内的面积相同。并且,在υ±σ范围内的面积约为68.3%;在υ±1.96σ范围内的面积约为95%;在υ±2.58σ范围内面积约为99%。

5、同一资料的标准差是否一定小于均数?

均数和标准差是两类不同性质的统计指标.标准差用于描述数据的变异程度,变异程度大,则

该值大,变异程度小,则该值小.标准差可大于均数,也可小于均数。

实习三单变量资料的统计推断

1、标准差与标准误有何区别和联系?

?区别:

1.含义不同:⑴s描述个体变量值(x)之间的变异度大小,s越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。⑵标准误是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。

2.与n的关系不同:n增大时,⑴s σ(恒定)。⑵标准误减少并趋于0(不存在抽样误差)。

3.用途不同: ⑴s:表示x的变异度大小,计算cv,估计正常值范围,计算标准误等⑵:参数估计和假设检验。

?联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。2、简述Ⅰ型错误和Ⅱ型错误的区别和联系。·区别:

Ⅰ型错误(弃真):拒绝实际成立的H0,型错误的概率记为α。(1-a)即置信度:重复抽样时,样本区间包含总体参数(μ)的百分数。当p≤α而拒绝H0时,只能犯Ⅰ型错误,不可能犯Ⅱ型错误。

Ⅱ型错误(存伪):不拒绝实际不成立的H0,Ⅱ型错误的概率记为β。(1-β)即把握度(或检验效能:两总体确有差别,被检出有差别的能力。当p≥α而拒绝H0时,只能犯Ⅱ型错误,不可能犯Ⅰ型错误。

·联系:对同一资料,α与β反方向变化,若要同时减小α与β,唯一的办法是增加样本含量。

3、可信区间与参考值范围的不同点。

应注意:可信区间与参考值范围的意义、计算公式和用途均不同。

1.从意义和用途来看

95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围。可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限。

2.从计算公式看:

若指标服从正态分布,95%参考值范围的公式是:±1.96s。

总体均数95%可信区间的公式是:。

前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。

4、在统计推断中,如何区别单侧检验和双侧检验?

如果将拒绝性概率平分于理论抽样分布的两侧,称为双侧检验。例如选定显著性水平α= 0.05,双侧检验就是将α概率所规定的拒绝区域平分为两部分而置于概率分布的两边,每边占有=0.025。双侧检验只强调差异是否显著而不强调方向性。

如果将拒绝性概率置于理论抽样分布的一侧(左侧或右侧),称为单侧检验(右侧检验或左侧检验)。单侧检验强调差异的方向性。

在具体的假设检验中,选择双侧检验或单侧检验可分为以下三种情况:

第一种:H0:μ=μ0:μ≠μ0双侧

第二种:H0:μ≥μ0 :μ<μ0单侧(左侧)

第三种:H0:μ≤μ0:μ>μ0 单侧(右侧)

5、t检验、z检验的公式有那些类型,在应用上有何异同?

t检验:当样本例数n较小时,要求样本取自正态总体。

t检验的类型:单样本t检验,独立t检验,配对t检验

z检验:样本例数较大,或n虽小而总体标准差已知。

6、假设检验和总体均数区间估计有何联系?

假设检验:是对总体做出某种假定,然后根据样本信息推断总体是否成立的一类统计学方法总称。假设检验有三个基本步骤:①建立假设和确定检验水准;②选择检验方法和计算检验统计量;③确定P值和做出统计推断结论。

总体均数的估计:1、点估计:样本统计量直接作为总体指标的估计值。它未考虑抽样误差的大小。

2、区间估计:按预先给定的概率(1-α)确定的包含未知总体参数的可能范围。

实习四方差分析

1、方差分析的基本思想是什么?

方差分析(analysis of variance,ANOV A )的基本思想就是根据资料的设计类型,即变异的不同来源,将全部观察值总的离均差平方和(SS)和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助 F 分布作出统计推断,判断各因素对各组均数有无影响。

2、t检验和F检验的使用条件和应用范围有何异同?

t检验适用于两个样本均数的比较,F检验适用于多个样本的比较。

t检验的应用条件:要求各样本来自相互独立的正态总体且各总体方差齐。

方差分析的应用条件(1)各样本是相互独立的随机样本,且来自正态分布总体。(2)各样本的总体方差相等,即方差齐性。

实习五计数资料的统计推断与描述

1、率的标准化的意义及基本思想。

当比较的两组资料内部各小组率明显不同,且各小组观测例数的构成比也明显不同时,直接比较两个合计率是不合理的。因为期内部构成比不同,往往影响合计率的大小,需要统一的内部构成进行调整后计算标准化率,使其具有可比性,这种方法称为率的标准化。

率的标准化的基本思想:要比较两个总率时,发现两组资料的内部构成(如年龄、性别构成等)存在明显不同,而且影响到了总率的结果,这时就不宜再直接比较总率,而应考虑采用

标准化法。标准化法的基本思想,就是采用统一的标准(统一的内部构成)计算出消除内部构成不同影响后的标准化率(调整率),然后再进行比较。

2、常用相对数指标有哪些?它们在计算和意义上有何不同?

率(强度相对数,频率相对数)、构成比、相对比

应用相对数时应注意的问题:⑴计算相对数的分母一般不宜过小。⑵分析时不能以构成比代替率。⑶不能用构成比的动态分析代替率的动态分析。⑷对观察单位数不等的几个率,不能直接相加求其总率。⑸在比较相对数时应注意可比性。⑹对样本率(或构成比)的比较应随机抽样,并做假设检验。

3、卡方检验的使用范围和各个公式的适用条件是什么?

卡方检验用于:推断两个及两个以上总体率或构成比是否有差别,两个分类变量间有无相关关系,多个率的趋势检验,以及两个率的等效检验等。此外,也用于频数分布的拟合优度检验。

对不同的设计类型的资料,检验的应用条件不同:

(1) 完全随机设计两样本率的比较

1) 当n>40,且T≥5时,用非连续性校正值;

若所得P≈α,则改用四格表的确切概率法。

2) 当n≥40,且有1≤T<5时,用连续性校正值。

3) n<40,或有T<1时,不能用检验,应当用四格表的确切概率法。

(2) 配对设计四格表

1) 当b+c≥40,

2) 当b+c<40,需作连续性校正,

(3) 行列表资料

1) 不宜有1/5以上格子的理论频数小于5,或有1个格子的理论频数小于1;

2) 单向有序行列表,在比较各处理组的效应有无差别时,应该用秩和检验或Ridit 检验;

3) 多个样本率(或构成比)比较的检验时,结论为拒绝无效假设时,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。若想进一步了解哪两者的差别有统计学意义,可用分割法。

4、率的标准误的意义和用途。

意义:由于抽样的原因所造成的样本率与总体率的不一致就是率的抽样误差。率的抽样误差的大小是用率的标准误来表示。

用途:①表示抽样误差的大小,说明样本率的代表性、可靠性。②对总体率的可信区间进行估计。

实习八统计表与统计图

1、统计表及统计图的制表原则和要求。

统计表:

(1) 统计表的制表原则

1) 应重点突出,即一张表一般只包括一个中心内容,内容较多时可以用多个表格表达不同指标和内容。

2) 统计表要层次清楚,即标目的安排及分组符合逻辑,便于分析比较。主谓分明,通常主语放在表的左边,作为横标目;谓语放在右边,作为纵标目。由左向右读,构成完整的一句话。但若统计表的主语项目少而谓语项目多或主语项目多而谓语只有一项,亦可将纵标目作主语、横标目作谓语,阅读时从上至下。

3) 统计表应简单明了,一切文字、数字和线条都应尽量从简。

(2) 制表要求:统计表通常由标题、标目、线条、数字4部分组成。表中数字区不插入文字,也不列备注项。必须说明者标“*”号等,在表下方说明。

1) 标题:应高度概括表的主要内容,一般包括研究的时间、地点和研究内容,左侧加表号,置于表的上方。

2) 标目:有横标目和纵标目,分别说明表格每行和每列数字的意义。横标目位于表头的左侧,代表研究的对象;纵标目位于表头右侧,表达研究对象的指标。注意标明指标的单位。

3) 线条:力求简洁,多采用三条线,即顶线、底线、纵标目下横线。部分表格可再用短横线将“合计”分隔开,或用短横线将两重纵标目分割开。其它竖线和斜线一概省去。

4) 数字:用阿拉伯数字表示。同一指标小数点位数一致,位次对齐。表内不留空项,无数字用“—”表示,缺失数字用“”表示,数值为0者记为“0”。

统计图:①根据资料性质和分析目的正确选用适当的统计图。②除圆图外,一般用直角坐标系的第一象限的位置表示图域(制图空间),或者用长方形的框架表示。③绘制图形应注意准确、美观,给人以清晰的印象。

2、常见的统计图有哪几种?它们的使用条件各是什么?

常用的统计图有直条图、直方图、百分比条图和圆图、线图、散点图、统计地图、箱式图等。·直条图:适用于比较、分析独立的或离散变量的多个组或多个类别的统计指标。指标既可以是绝对数,也可以是相对数。

·直方图:主要应用于频数分布资料,描述连续变量的频数分布。

百分比条图和圆图:表示事物内部各构成部分所占的比重,适合描述分类变量的各类别所占的构成比。其中,百分比条图特别适合作多个构成比的比较。

·线图:适合于描述某统计量随另一连续性数值变量的变化而变化的趋势,常用于描述统计量随时间变化而变化的趋势。普通线图描述的是绝对变化趋势,半对数线图描述的是相对变化趋势,特别适宜作不同指标或相同指标不同组别的变化速度的比较。

·散点图:以直角坐标上点的密集程度和趋势来表示两个变量间的相关关系。

·统计地图:以不同的颜色和花纹表示统计量的值在地理分布上的变化,适宜描述研究指标的地理分布。

·箱式图:通过使用5个统计量(数据分布的中心位置、分布、偏度、变异范围和异常值)来反映原始数据的分布特征。特别适合多组数据分布的比较。

3、普通线图和半对数线图的主要区别是什么?

从形式上看,二者的不同点在于纵坐标的尺度不同,普通线图的纵坐标为算术尺度,而半对数线图的纵坐标为对数尺度。从用途上看,普通线图描述的是统计量的绝对变化趋势,半对数线图描述的是相对变化趋势,特别适宜作不同指标或相同指标不同组别的变化速度的比较。

一定要有足够量的观察单位数。

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学名词解释及问答题

1、总体(population):是根据研究目的确定的同质研究对象的全体。 2、样本(sample):从总体中抽取的一部分有代表性的个体。 3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。 4、变异(variation):指同质个体的某项指标之间的差异。 5、参数(parameter):反映总体特征的指标称为参数。 6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。 7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。 8、概率(probability):某事件发生的可能性大小。 9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。 10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。 11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。 12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。 13、方差(variance):是各个数据与平均数之差的平方的平均数。 14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。 16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。 17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。 18、统计推断(statistical inference):是根据已知的样本信息来推断未知的总体,是统计分析的目的,包括参数估计和假设检验。 19、Ⅰ型错误(type Ⅰ error):拒绝了实际上成立的H0,这类弃真错误,发生的概率为α,为已知。 20、Ⅱ型错误(type Ⅱ error):不拒绝实际上不成立的H0,这类存伪错误,发生的概率为β,未知。 21、检验效能(power of test):又称把握度,为1-β,其意义是两总体确有差别,按α水准能发现它们有差别的能力。 22、可信区间(confidence interval):指总体参数可能所在的范围。 23、率(rate):说明某现象发生的频率或强度。 24、构成比(constituent ratio):表示某事物内部各组成部分所占的比重或分布,常以百分数表示。 25、相对比(relative ratio):表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。 26、标准化率(standardized rate):亦称调整率,是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。 27、参数检验(parametric test):一类依赖于总体分布的具体形式的统计推断方法。 28、非参数检验(non parametric test):一类不依赖总体分布类型的检验,在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的统计方法。

医学统计学试卷-2

《医学统计学》期末试卷(考查) 姓 名: 学 号: 班 级: ---------------------------------------- 说明:本试卷总计100分,全试卷共3页,完成答卷时间2小时。 ---------------------------------------- 一、判断题(本大题共10题,每题1分,共10分,对的打“√”,错的打“×”) 1、 参数(parameter )是根据总体分布的特征而计算的总体数值,如:总体均数用μ表示。( ) 2、 将一组观察值按大小顺序排列,位次居中的数值即算术均数,统计符号为X 。( ) 3、 标准差可以反映抽样误差的大小。( ) 4、 假设检验有两类错误,其中,拒绝了实际上是成立的0H ,为第一类错误。( ) 5、 两样本均数比较,经t 检验差别有统计学意义时,P 越小,说明两总体均数差别越大。( ) 6、 方差分析后,各总体均数不等,要想分析多个试验组与对照组均数比较,需用SNK-q 检验。( ) 7、 拉丁方设计可用来进行因素间的交互作用分析。( ) 8、 正交表48(42)L ? ,表示最多可观察5个因素,其中1个因素为4水平,4个因素为2水平。( ) 9、 分类资料常用率表示某一事物内部各组成部分所占的比重或分布。( ) 10、有序分类资料不是等级资料( )。 二、填空题(本大题共10题,每题1分,共10分) 1、四分位数间距与 可用来描述偏态分布资料的分布特征。 2、当均数相差很大或单位不同时,比较多个样本资料的离散趋势指标应选 。 3、总体服从正态分布的数值资料,常用 与 来描述其集中趋势与离散趋势。 4、标准正态分布的均数和标准差分别为 。 5、t 曲线是以 为中心,左右对称的一簇曲线。 6、已知一个样本来自正态分布的总体,样本均数为x ,样本含量为n ,总体标准差为σ,试估计总体均数的99%可信区间: 。 7、完全随机化设计的方差分析,根据方差分析的基本思想,可将总变异分解为两部分:

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

医学统计学名词解释问答题

医学统计学 1、应用相对数时应注意的事项 ①计算相对数时分母不能太小; ②分析时不能以构成比代替率; ③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均; ④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近; ⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。 2、正态分布的特点及其应用 性质:①两头低中间高,略呈钟形; ②只有一个高峰,在X=μ,总体中位数亦为μ; ③以均数为中心,左右对称; ④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动; σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高; ⑤对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u 服从于均数为0,方差为1的正态分布,即标准正态分布。 应用:①概括估计变量值的频数分布; ②制定参考值范围; ③质量控制; ④是许多统计方法的理论基础。 3、确定参考值范围的一般原则和步骤、方法 一般原则和步骤:①抽取足够例数的正常人样本作为观察对象; ②对选定的正常人进行准确而统一的测定,以控制系统误差; ③判断是否需要分组测定; ④决定取单侧范围值还是双侧范围值; ⑤选定适当的百分范围; ⑥选用适当的计算方法来确定或估计界值。 方法:①正态分布法:②百分位数法(偏态分布) 4、总体均数的可信区间与参考值范围的区别 概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。 参考值范围是绝大多数正常人的某指标范围。所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。 计算公式:可信区间① ② ③ 参考值范围①正态分布 ②偏态分布 用途:可信区间用于总体均数的区间估计 参考值范围用于表示绝大多数观察对象某项指标的分布范围

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

【缩印整理版】医学统计学名词解释及问答题

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。 总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。 抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。 标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数 区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。 参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常 置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法(标准误)、二项分布法。置信区间估计总体参数所在范围 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信区间包含总体参数的可 能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。 参数统计(parametric statistics) 非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。 变异(variation):对于同质的各观察单位,其某变量值之间的差异 同质(homogeneity):研究对象具有的相同的状况或属性等共性。 回归系数有单位,而相关系数无单位 β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。 线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。 参数(parameter):描述总体特征的统计指标。 统计量(statistic):描述样本特征的统计指标。实验设计的基本原则 对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组 重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。作用是估计变异大小和降低变异 随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误(假阳性错误)真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。其发生的概率用α表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误(假阴性错误)真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。其发生的概率用β表示。由于其取值取决于H1 ,因此在假设检验中无法确定。 变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。数值越大,说明数据越离散,反之越集中。极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation 平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode) 单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。最常用的方法是等距抽样 分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差,要求层内误差最小,层间误 差最大。 整群抽样先将总体分成若干“群”,从中随机抽取 几个群,抽取群内的所有观察单位组成调查样本。 “群”的确定与研究目的无关。为减少抽样误差, 需多抽几个“群”。 方差分析:又称变异数分析或 F检验,适用于对多 个平均值进行总体的假设检验,以检验实验所得的 多个平均值是否来自相同总体。 析因设计(factorial design)实验:凡同时配置两个 或两个以上处理因素,这些因素的各水平又具有完 全组合的实验,统称为析因设计(factorial design) 实验。 随机区组设计(randomized block design)是事先 将全部受试对象按某种可能与实验因素有关的特征 分为若干个区组(block),使每一区组内的受试对 象例数与处理因素的分组数相等,使每个实验组从 每一区组得到一例受试对象。 单向方差分析(one way analysis of variance)是指 处理因素只有一个。这个处理因素包含有多个离散 的水平,分析在不同处理水平上应变量的平均值是 否来自相同总体。 (2)计数资料:将观察单位按某种属性或类别分组, 所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。 其观察值是定性的,表现为互不相容的类别或属性。 如调查某地某时的男、女性人口数;治疗一批患者, 其治疗效果为有效、无效的人数;调查一批少数民 族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性 的不同程度分组,所得各组的观察单位数,称为等 级资料(ordinal data)。等级资料又称有序变量。如 患者的治疗结果可分为治愈、好转、有效、无效或 死亡,各种结果既是分类结果,又有顺序和等级差 别,但这种差别却不能准确测量;一批肾病患者尿 蛋白含量的测定结果分为+、++、+++等。 随机变量(random variable)是指取指不能事先确 定的观察结果。随机变量的具体内容虽然是各式各 样的,但共同的特点是不能用一个常数来表示,而 且,理论上讲,每个变量的取值服从特定的概率分 布。 变异系数(coefficient of variation)用于观察指标单 位不同或均数相差较大时两组资料变异程度的比 较。用CV 表示。计算:标准差/均数*100% 直线回归(linear regression)建立一个描述应变量 依自变量变化而变化的直线方程, 并要求各点与该直线纵向距离的平方和为最小。直 线回归是回归分析中最基本、最简单的一种,故又 称简单回归(simple regression)。 回归系数(regression coefficient )即直线的斜率 (slope),在直线回归方程中用b 表示,b 的统计意 义为X每增(减)一个单位时,Y平均改变b 个单 位。 相关系数r:用以描述两个随机变量之间线性相关 关系的密切程度与相关方向的统计指标。 秩次:变量值按照从小到大顺序所编的秩序号称为 秩次(rank)。 秩和:各组秩次的合计称为秩和(rank sum),是非 参数检验的基本统计量。 方差(variance):方差表示一组数据的平均离散情 况,由离均差的平方和除以样本个数得到。 检验效能:1- β称为检验效能(power of test),它是 指当两总体确有差别,按规定的检验水准a 所能发 现该差异的能力。 百分位数(percentile)是将n 个观察值从小到大依 次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是 确定医学参考值范围 随机误差(random error)又称偶然误差,是指排 除了系统误差后尚存的误差。它受多种因素的影响, 使观察值不按方向性和系统性而随机的变化。误差 变量一般服从正态分布。随机误差可以通过统计处 理来估计。 一、统计表有哪些要素构成的?制表的注意事项有 哪些? 一般来说,统计表由标题、标目、线条和数字、备 注五部分组成。但备注并不是必需的内容,可以根 据需要出现。 1简明扼要,重点突出:最好一张表突出一个中心, 不易太多中心,如果需要说明多个中心,可分成多 张统计表。 2合理安排主语和谓语的位置:对于表中任意一行, 从左至右,通过简短的连接词,可连成成一句通顺 的句子。 3表中数据要认真核对,保证准确可靠 二、为什么不宜用t 检验对多组均数进行比较? 如果用t检验进行多个样本均数的两两比较,则会 增加犯I 类错误的概率。 经检验得到拒绝H0 ,认为两组之间有差别的结论 可能犯I类错误的概率为α,不犯I类错误的概率为 1- α.每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数,上例α=0.05, k=3,则均不犯错误 的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I 类错误的概率为1-(1- α)k 三、方差分析的基本思想是什么? 按实验设计的类型,将全部观察值间的变异分解成 两个或多个组成部分,然后将各部分的变异与随机 误差进行比较(每个部分的变异可由某因素的作用 来解释),以判断各部分的变异是否具有统计学意 义,从而推断不同样本所代表的总体均数是否相同。 五、简述直线相关与回归的区别与联系 区别:1.回归说明依存关系,直线回归用于说明两 变量间数量依存变化的关系,描述y如何依赖于x 而变化;相关说明相关关系,直线相关用于说明两 变量间的直线相关关系,此时两变量的关系是平等 的 2.r与b有区别:r说明具有直线关系的两个 变量间相关的密切程度与相关方向; b表示x每改 变一个单位,y平均增(减)多少个单位; 3.资料要求不同:直线回归要求应变量 y是来自正态总体的随机变量,而x可以是来自正 态总体的随机变量,也可以是严密控制、精确测量 的变量,相关分析则要求x,y是来自双变量正态分 布总体的随机变量。 4.取值范围:-∞

医学统计学重点图表总结

描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99

医学统计学01护理学(本科)期末考试试卷A卷

山东中医药大学 专业 年级(本科) 《医学统计学01》期末考试试卷(A 卷) 姓 名: 学 号: 班 级: 考试时间:2010.6 补(重)考:(是、否) 题号 一 二 三 四 五 六 七 八 总分 核分人 得分 ---------------------------------------- 说明:本试卷总计100分,全试卷共3页,完成答卷时间90分钟。 ---------------------------------------- 一、单项选择题(本大题共5题,每题2分,共10分) 1、某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下: 年龄(岁) 10~ 20~ 30~ 40~ 50~ 60~ 人数 6 40 50 85 20 1 为了形象表达该资料,适合选用:() A 、线图 B 条图 C 直方图 D 圆图 2、成组设计的两样本比较的秩和检验,其检验统计量是( )。 A 、 以例数较小者为 B 、以例数较大者为 C 、以秩和较小者为 D 、以秩和较大者为。 3、当组数等于 2 时,对于同一资料,方差分析与 t 检验的关系是____ 。 A .完全等价且 F=t B.方差分析结果更准确 C.t 检验结果更准确 D.完全等价且 t 2=F 4、Poisson 分布独有的特征是______。 A. 离散型分布 B. 参数是总体均数 C. 方差等于均数 D. 当样本较小时是偏倚分布 5、甲、乙两个医院某传染病各型治愈率 病 型 患者数 治愈率(%) 甲 乙 甲 乙 普通型 300 100 60.0 65.0 重 型 100 300 40.0 45.0 暴发型 100 100 20.0 25.0 合 计 500 500 48.0 45.0 由于各型疾病的人数在两个医院的内部构成不同,从内部看,乙医院各型治愈率都高于甲医院,但根据栏的结果恰好相反,纠正这种矛盾现象的统计方法是:() A 、重新计算,多保留几位小数 B 、对率进行标准化 C 、对各医院分别求平均 D 、增大样本含量,重新计算 得分 阅卷人 (签全名)

医学统计学名词解释及问答题

1、 总^(population):就是根据研究目得确泄得同质研究对象得全体。 2、 样本(sample):从总体中抽取得一部分有代表性得个体。 3、 同质(homogeneity):就是指所研究得观察对象具有某些相同得性质或特征。 4、 变异(variation):指同质个体得某项指标之间得差异。 5、 参数(parameter):反映总体特征得指标称为参数。 6、 统计量(statistic):通过样本资料il ?算出来得相应指标称为统计量。 7、 抽样误差(sampling error):由随机抽样造成得样本指标与总体指标之间、样本指标与样本指标 Z 间得差异。 8、 概率(probability):某事件发生得可能性大小。 9、 正态分布(normal distribution):高帐位于均数处冲间高两边低,左右完全对称地下降,但永远不与 横轴相交得钟形曲线。 10、 平均数(average):就是描述一组同质变量值得平均水平或集中趋势得指标。 11、 中位数(median):将一组数据由小到大排列,位于中间位置得观测值。 12、 医学参考值范@(medical reference range):X 称正常值范饥医学上常将包括绝大多数正常人得 某项指标得波动范围称为该指标得正常值范鬧。 13、 方差他I 伽CC):就是徉个数据与平均数之差得平方得平均数。 14、 标准差(standard deviation):就是各数据偏离平均数得距离得平均数,它就是离均差平方与平均 后得方根,用0表示。 15、 标准i^tstandard error):样本均数得标准差,等于原变量总体标准差除以例数得平方根,用以说明 均数抽样误差得大小。 16、 均数得抽样误差(sampling error of mean):由个体差异与抽样所导致得样本均数与样本均数之 间,样本均数与总体均数之间得差异。 17、 假设检验(hypothesistesting):先对总体做出某种假设,然后根据样本信息来推断其就是否成立 得一类统计方法得总称。 18、 统计推断(statistical inference):就是根据已知得样本信息来推断未知得总体,就是统计分析得目 得,包括参数估计与假设检验。 19、 I 型错误(type I error):拒绝了实际上成立得Hu.这类弃真错误,发生得槪率为Q,为已知。 20、 II 型错误(type II error):不拒绝实际上不成立得Ho,这类存伪错误,发生得概率为B ,未知。 21、 检验效能(power of test):又称把握度,为意义就是两总体确有差别,按a 水准能发现它们 有差别得能力。 可信区间(confidence interval):指总体参数可能所在得范围。 率(血⑹:说明某现象发生得频率或强度。 构成比(constituent ratio):^示某事物内韶^$组成部分所占得比重或分布,常以百分数表示。 相对比(relative ratio):表示两个有关事物指标之比,常以百分数与倍数表示,用以说明一个指标 就是另一个指标得几倍或百分之几。 26、 标准化率(standardized 臥C):亦称调整率,就是采用统一得标准对内部构成不同得各组频率进行 调整与对比得方法。 27、 参数检验(paramchic test):—类依赖于总体分布得具体形式得统计推断方法。 28、 非参数检验(non parametric test):-类不依赖总体分布类型得检验,在应用中可以不考虑被研究 对象为何种分布以及分布就是否已知,检验假设中没有包括总体参数得统计方法。 22 、 23、 24

医学统计学重点要点

医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

医学统计学期末考试模拟题(三)

《医学统计学》期末模拟考试题(三)一.是非题(每题1分,共20分)1.评价某人的某项指标是否正常,所用的范围是。()t2.配对资料若用成组检验处理,就降低了统计效率。() 3.因为两类错误的存在,所以不能凭假设检验的结果下结论。() 4.随机区组设计的区组变异和误差两部分相当于完全随机设计方差分析的组内变异。()P5.抗体滴度资料经对数转换后可做方差分析,若方差分析得<0.05,则可认为实测数据的各总体算术均数不全相等。() 6.五个百分率的差别的假设检验,>,可认为各组总体率都不相同。() ZZZ4.在两样本均数比较的检验中,若≥,则在α=0.05水平上可认为两总体均数不等。0.05()P5.在t检验中,若拒绝H, 值越小,则说明两总体均数差别越大。()06.对三个地区 血型构成(A、B、O、AB型),作抽样调查后比较,若有一个 理论频数小于5大于1且n>40,必须作校正检验。() 7.如果两个变量的变动方向一致,同时呈上升或下降趋势,则二者是正相关关系。() 8.Ⅱ期临床试验是指采用随机盲法对照实验,评价新药的有效性及安全性,推荐临床给药剂量。()9.临床试验中,为了避免人为主观因素的影响,保证结果的真实性,通常不让受试者及其家属知道他参与这项试验。()10.假定变量X与Y的相关系数r是0.8,P<0.05;变量M与N的相关系数r为-0.9,P<0.05,1122则X与Y的相关密切程度较高。与Y的相关系数r是0.8,P<0.05;变量M与N

的相关系11数r为-0.9,P<0.05,则X与Y的相关密切程度较 高。()2211.临床试验必须符合《赫尔辛基宣言》和国际医 学科学组织委员会颁布的《人体生物医学研究国际道德指南》 的道德原则。() 12.当直线相关系数r=0时,说明变量之 间不存在任何相关关系。=0时,说明变量之间不存在任何相 关关系。() 13.偏回归系数表示在除X以外的自变量固定 不变的条件下,X每改变一个单位的平均变ii化。以外的自变 量固定不变的条件下,X每改变一个单位的平均变化。()i 14.单盲法是让病人知道自己在实验组或对照组,但不知道用 什么处理。() 15.重复原则是指少选择样本例数。()16.越小,所需样本含量越大。() 17.在相同条件下完全 随机设计比随机区组设计更节约样本含量。() 18.配对符号 秩和检验中,有差值绝对值相等时,可不计算平均秩次。()19.非参数统计的检验效能总是低于参数检验。() nTnTT20.两样本比较的秩和检验,现=15,=153,=10,=126,则 检验统计量=126。()1122二.选择题(每题1分,共20分)1.一种新药可以控制某病,延长寿命,但不能治愈其病,如果 某地采用该药则该地。a.该病发病率将增加 b.该病 发病率将减少c.该病患病率将增加 d.该病患病率将减少e.以上都不对2.用触诊和X摄片对100名妇女作乳癌检查, 触诊有40名阳性,X摄片有70名阴性,两种方法均阳性者10 名,两种方法检查均为阴性的人数是。 a.20 b.30

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

相关文档
相关文档 最新文档