当前位置：文档库 › 医学统计学__问答题

医学统计学__问答题

1、标准正态分布（u分布）与t分布有何异同？

相同点：集中位置都为0，都是单峰分布，是对称分布，标准正态分布是t分布的特例（自由度是无限大时）不同点：t分布是一簇分布曲线，t 分布的曲线的形状是随自由度的变化而变化，标准正态分布的曲线的形状不变，是固定不变的，因为它的形状参数为1。

3、简述直线回归与直线相关的区别。

1资料要求上不同：直线回归分析适用于应变量是服从正态分布的随机变量，自变量是选定变量；直线相关分析适用于服从双变量正态分布的资料。

2 两种系数的意义不同：回归系数是表明两个变量之间数量上的依存关系，回归系数越大回归直线越陡峭，表示应变量随自变量变化越快；相关系数是表明两个变量之间相关的方向和紧密程度的，相关系数越大，两个变量的关联程度越大。

第一章医学统计中的基本概念

2、抽样中要求每一个样本应该具有哪三性？

从总体中抽取样本，其样本应具有“代表性”、“随机性”和“可靠性”。

（1）代表性: 就是要求样本中的每一个个体必须符合总体的规定。

（2）随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。

（3）可靠性: 即实验的结果要具有可重复性，即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多，可靠性会越大，但是例数增加，人力、物力都会发生困难，所以应以“足够”为准。需要作“样本例数估计”。

3、什么是两个样本之间的可比性？

可比性是指处理组（临床设计中称为治疗组）与对照组之间，除处理因素不同外，其他可能影响实验结果的因素要求基本齐同，也称为齐同对比原则。

实习一统计研究工作的基本步骤

1、什么叫医学统计学？医学统计学与统计学、卫生统计学、生物统计学有何联系与区别？

医学统计学：是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科

统计学：是研究数据的收集、整理、分析与推断的科学。

卫生统计学：是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。

生物统计学：是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。

2、医学统计的资料主要来源于那些方面？有何要求？

医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的的数据；现场调查资料主要来源于大规模的流行病调查获取的资料；医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等；报表有卫生工作基本情况年报表、传染年（月、日）报表、疫情旬（年、月、日）报表等；报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。

这些资料的手机过程中，必须进行质量抗旨，包括它的统一性、确切性、可重复性。这些原始数据的精读和偏性应有明确的范围。

3、医学统计学的资料类型有哪些？

（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重(kg)、红细胞计数(1012/L)、脉搏（次/分）、血压（KPa）等。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数

资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。

（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。

等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。

等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。

4、常见的三类误差是什么？应采取什么措施和方法加以控制？

常见的三类误差是：

（1）系统误差：在收集资料过程中，由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因，可造成观察结果倾向性的偏大或偏小，这叫系统误差。要尽量查明其原因，必须克服。

（2）随机测量误差：在收集原始资料过程中，即使仪器初始状态及标准试剂已经校正，但是，由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如，实验操作员操作技术不稳定，不同实验操作员之间的操作差异，电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制，至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施，从而达到控制的目的。

（3）抽样误差：即使在消除了系统误差，并把随机测量误差控制在允许范围内，样本均数（或其它统计量）与总体均数（或其它参数）之间仍可能有差异。这种差异是由抽样引起的，故这种误差叫做抽样误差，要用统计方法进行正确分析。

实习二单变量资料的统计描述

1、试述频数表的要素及用途。

要素：组段，频距。

用途：

①描述资料的分布特征和分布类型。频数分布有两个重要特征：集中趋势和离散趋势。大部分观察值向某一数值集中的趋势称为集中趋势，常用平均数指标来表示，各观察值之间大小参差不齐。频数由中央位置向两侧逐渐减少，称离散趋势，是个体差异所致，可用一系列的变异指标来反映。

②便于进一步计算有关指标或进行统计分析。当数据较多且需手工计算时，常先编制频数表，再进行统计计算。

③发现特大、特小的可疑值。如果频数表的一端或两端出现连续几个组段的频数为零后，又出现少数几个特大值或特小值，使人怀疑其是否准确，需进一步检查和核对并做相应处理。

④当样本含量比较大时，可用各组段的平率作为概率的估计值。

2、描述单变量资料的统计指标分哪两大类，分别是什么指标？

分类：

①描述数据分布集中趋势的指标：算术均数、几何均数、中位数。

②描述数据分布离散程度的指标：极差、四分位数间距、方差、标准差、变异系数。

3、试述平均数、标准差、变异系数的含义及用途？

4、标准正态分布曲线下面积有何分布规律？

所有的正态分布曲线，在υ左右的相同倍数的标准差范围内的面积相同。并且，在υ±σ范围内的面积约为68.3%；在υ±1.96σ范围内的面积约为95%；在υ±2.58σ范围内面积约为99%。

5、同一资料的标准差是否一定小于均数？

均数和标准差是两类不同性质的统计指标.标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度

小,则该值小.标准差可大于均数,也可小于均数。

实习三单变量资料的统计推断

1、标准差与标准误有何区别和联系？

?区别：

1.含义不同:⑴s描述个体变量值（x）之间的变异度大小，s越大，变量值（x）越分散；反之变量值越集中，均数的代表性越强。⑵标准误是描述样本均数之间的变异度大小，标准误越大，样本均数与总体均数间差异越大，抽样误差越大；反之，样本均数越接近总体均数，抽样误差越小。

2.与n的关系不同：n增大时，⑴s σ（恒定）。⑵标准误减少并趋于0（不存在抽样误差）。

3.用途不同: ⑴s:表示x的变异度大小，计算cv，估计正常值范围，计算标准误等⑵:参数估计和假设检验。

?联系：二者均为变异度指标，样本均数的标准差即为标准误，标准差与标准误成正比。

2、简述Ⅰ型错误和Ⅱ型错误的区别和联系。

·区别：

Ⅰ型错误（弃真）：拒绝实际成立的H0，型错误的概率记为α。（1－a）即置信度:重复抽样时，样本区间包含总体参数（μ）的百分数。当p≤α而拒绝H0时，只能犯Ⅰ型错误，不可能犯Ⅱ型错误。

Ⅱ型错误（存伪）：不拒绝实际不成立的H0，Ⅱ型错误的概率记为β。（1－β）即把握度（或检验效能：两总体确有差别，被检出有差别的能力。当p≥α而拒绝H0时，只能犯Ⅱ型错误，不可能犯Ⅰ型错误。·联系：对同一资料，α与β反方向变化，若要同时减小α与β，唯一的办法是增加样本含量。

3、可信区间与参考值范围的不同点。

应注意：可信区间与参考值范围的意义、计算公式和用途均不同。

1.从意义和用途来看

95％参考值范围是指同质总体内包括95％个体值的估计范围，而总体均数95％可信区间是指按95％可信度估计的总体均数的所在范围。可信区间用于估计总体参数，总体参数只有一个。参考值范围用于估计变量值的分布范围，变量值可能很多甚至无限。

2.从计算公式看：

若指标服从正态分布，95％参考值范围的公式是：±1.96s。

总体均数95％可信区间的公式是：。

前者用标准差，后者用标准误。前者用1.96，后者用α为0.05，自由度为v的t界值。

4、在统计推断中，如何区别单侧检验和双侧检验？

如果将拒绝性概率平分于理论抽样分布的两侧，称为双侧检验。例如选定显著性水平α= 0.05，双侧检验就是将α概率所规定的拒绝区域平分为两部分而置于概率分布的两边，每边占有=0.025。双侧检验只强调差异是否显著而不强调方向性。

如果将拒绝性概率置于理论抽样分布的一侧（左侧或右侧），称为单侧检验（右侧检验或左侧检验）。单侧检验强调差异的方向性。

在具体的假设检验中，选择双侧检验或单侧检验可分为以下三种情况：

第一种：H0：μ=μ0：μ≠μ0双侧

第二种：H0：μ≥μ0 ：μ＜μ0单侧（左侧）

第三种：H0：μ≤μ0：μ＞μ0 单侧（右侧）

5、t检验、z检验的公式有那些类型，在应用上有何异同？

t检验：当样本例数n较小时，要求样本取自正态总体。

t检验的类型：单样本t检验，独立t检验，配对t检验

z检验：样本例数较大，或n虽小而总体标准差已知。

6、假设检验和总体均数区间估计有何联系？

假设检验：是对总体做出某种假定，然后根据样本信息推断总体是否成立的一类统计学方法总称。假设检验有三个基本步骤：①建立假设和确定检验水准；②选择检验方法和计算检验统计量；③确定P值和做出统计推断结论。

总体均数的估计：1、点估计：样本统计量直接作为总体指标的估计值。它未考虑抽样误差的大小。

2、区间估计：按预先给定的概率(1-α)确定的包含未知总体参数的可能范围。

实习四方差分析

1、方差分析的基本思想是什么？

方差分析（analysis of variance，ANOV A ）的基本思想就是根据资料的设计类型，即变异的不同来源将全部观察值总的离均差平方和（sum of squares of deviations from mean，SS）和自由度分解为两个或多个部分，除随机误差外，其余每个部分的变异可由某个因素的作用（或某几个因素的交互作用）加以解释，如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小，借助F 分布作出统计推断，判断各因素对各组均数有无影响。

2、t检验和F检验的使用条件和应用范围有何异同？

t检验适用于两个样本均数的比较，F检验适用于多个样本的比较。

t检验的应用条件：要求各样本来自相互独立的正态总体且各总体方差齐。

方差分析的应用条件（1）各样本是相互独立的随机样本，且来自正态分布总体。（2）各样本的总体方差相等，即方差齐性。

实习五计数资料的统计推断与描述

1、率的标准化的意义及基本思想。

当比较的两组资料内部各小组率明显不同，且各小组观测例数的构成比也明显不同时，直接比较两个合计率是不合理的。因为期内部构成比不同，往往影响合计率的大小，需要统一的内部构成进行调整后计算标准化率，使其具有可比性，这种方法称为率的标准化。

率的标准化的基本思想：要比较两个总率时，发现两组资料的内部构成（如年龄、性别构成等）存在明显不同，而且影响到了总率的结果，这时就不宜再直接比较总率，而应考虑采用标准化法。标准化法的基本思想，就是采用统一的标准（统一的内部构成）计算出消除内部构成不同影响后的标准化率（调整率），然后再进行比较。

2、常用相对数指标有哪些？它们在计算和意义上有何不同？

率（强度相对数，频率相对数）、构成比、相对比

应用相对数时应注意的问题：⑴计算相对数的分母一般不宜过小。⑵分析时不能以构成比代替率。⑶不能用构成比的动态分析代替率的动态分析。⑷对观察单位数不等的几个率，不能直接相加求其总率。⑸在比较相对数时应注意可比性。⑹对样本率（或构成比）的比较应随机抽样，并做假设检验。

3、卡方检验的使用范围和各个公式的适用条件是什么？

卡方检验用于：推断两个及两个以上总体率或构成比是否有差别，两个分类变量间有无相关关系，多个率的趋势检验，以及两个率的等效检验等。此外，也用于频数分布的拟合优度检验。

对不同的设计类型的资料，检验的应用条件不同：

(1) 完全随机设计两样本率的比较

1) 当n＞40，且T≥5时，用非连续性校正值；

若所得P≈α，则改用四格表的确切概率法。

2) 当n≥40，且有1≤T＜5时，用连续性校正值。

3) n＜40，或有T＜1时，不能用检验，应当用四格表的确切概率法。

(2) 配对设计四格表

1) 当b+c≥40，

2) 当b+c<40，需作连续性校正，

(3) 行列表资料

1) 不宜有1/5以上格子的理论频数小于5，或有1个格子的理论频数小于1；

2) 单向有序行列表，在比较各处理组的效应有无差别时，应该用秩和检验或Ridit检验；

3) 多个样本率（或构成比）比较的检验时，结论为拒绝无效假设时，只能认为各总体率（或总体构成比）之间总的说来有差别，但不能说明它们彼此之间都有差别，或某两者间有差别。若想进一步了解哪两者的差别有统计学意义，可用分割法。

4、率的标准误的意义和用途。

意义：由于抽样的原因所造成的样本率与总体率的不一致就是率的抽样误差。率的抽样误差的大小是用率的标准误来表示。

用途：①表示抽样误差的大小，说明样本率的代表性、可靠性。②对总体率的可信区间进行估计。

实习六非参数资料的统计分析

1、非参数统计方法的概念及适用范围。

概念：样本所来自的总体分布难以用某种函数式来表达，还有一些资料的总体分布的函数式是未知的，只知道总体分布是连续型的或离散型的，解决这类问题的一种不依赖总体分布的具体形式的统计方法。由于这类方法不受总体参数的限制，故称非参数统计法，或称为不拘分布的统计分析方法，又称为无分布型式假定的统计分析方法。它检验的是分布，而不是参数。非参数统计不需对总体分布(总体参数)作出特殊假设。

适用范围：（1）等级资料。（2）偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换，或虽经变量变换仍未达到正态或近似正态分布时，宜用非参数检验。（3）各组离散程度相差悬殊，即方差明显不齐，且不能变换达到齐性。（4）个别数据偏离过大，或资料为单侧或双侧没有上限或下限值。（5）分布类型不明。（6）初步分析。有些医学资料由于统计工作量大，可采用非参数统计方法进行初步分析，挑选其中有意义者再进一步分析(包括参数统计内容)。（7）对于一些特殊情况，如从几个总体所获得的数据，往往难以对其原有总体分布作出估计，在这种情况下可用非参数统计方法。

2、非参数检验的优缺点。

优点：①非参数统计方法要求的假定条件比较少，因而它的适用范围比较广泛。②多数非参数统计方法要求的运算比较简单，可以迅速完成计算取得结果，因而比较节约时间。③大多数非参数统计方法在直观上比较容易理解，不需要太多的数学基础知识和统计学知识。④大多数非参数统计方法可用来分析如象由等级构成的数据资料，而对计量水准较低的数据资料，参数统计方法却不适用。⑤当推论多达3个以上时，非参数统计方法尤具优越性。

缺点：①由于方法简单，用的计量水准较低，因此，如果能与参数统计方法同时使用时，就不如参数统计方法敏感。若为追求简单而使用非参数统计方法，其检验功效就要差些。这就是说，在给定的显著性水平下进行检验时，非参数统计方法与参数统计方法相比，第Ⅱ类错误的概率β要大些。②对于大样本，如不采用适当的近似，计算可能变得十分复杂。

注意: 凡符合或经过变换后符合参数检验条件的资料，最好用参数检验。当资料不具备参数检验的条件时，非参数检验是一种有效的分析方法。

实习七直线相关与回归分析

1、相关与回归的联系和区别。

区别：

意义：相关反映两变量的相互关系，即在两个变量中，任何一个的变化都会引起另一个的变化，是一种双向变化的关系。回归是反映两个变量的依存关系，一个变量的改变会引起另一个变量的变化，是一种单向的关系。

应用：研究两个变量的相互关系用相关分析。研究两个变量的依存关系用回归分析。

研究性质：相关是对两个变量之间的关系进行描述，看两个变量是否有关，关系是否密切，关系的性质是什么，是正相关还是负相关。回归是对两个变量做定量描述，研究两个变量的数量关系，已知一个变量值可以预测出另一个变量值，可以得到定量结果。

相关系数r与回归系数b ：r与b的绝对值反映的意义不同。r的绝对值越大，散点图中的点越趋向于一条直线，表明两变量的关系越密切，相关程度越高。b的绝对值越大，回归直线越陡，说明当X变化一个单位时，Y的平均变化就越大。反之也是一样。

联系：r与b值可相互换算；r与b正负号一致；r与b的假设检验等价；回归可解释相关。相关系数的平方r2(又称决定系数)是回归平方和与总的离均差平方和之比，故回归平方和是引入相关变量后总平方和减少的部分。

2、直线相关、秩相关的区别与联系。

区别：(1)资料要求不同：直线相关要求x、y是来自双变量正态总体的随机变量；秩相关适用于不服从双变量正态分布或总体分布类型未知以及用等级表示的原始数据。(2)相关意义不同：直线相关表示两变量的直线相关关系存在，秩相关表示两变量的相关关系。

联系:相关系数的取值范围相同；秩相关将原始数据进行秩变换，以秩次计算直线相关系数。

实习八统计表与统计图

1、统计表及统计图的制表原则和要求。

统计表：

(1) 统计表的制表原则

1) 应重点突出，即一张表一般只包括一个中心内容，内容较多时可以用多个表格表达不同指标和内容。

2) 统计表要层次清楚，即标目的安排及分组符合逻辑，便于分析比较。主谓分明，通常主语放在表的左边，作为横标目；谓语放在右边，作为纵标目。由左向右读，构成完整的一句话。但若统计表的主语项目少而谓语项目多或主语项目多而谓语只有一项，亦可将纵标目作主语、横标目作谓语，阅读时从上至下。

3) 统计表应简单明了，一切文字、数字和线条都应尽量从简。

(2) 制表要求：统计表通常由标题、标目、线条、数字4部分组成。表中数字区不插入文字，也不列备注项。必须说明者标“*”号等，在表下方说明。

1) 标题：应高度概括表的主要内容，一般包括研究的时间、地点和研究内容，左侧加表号，置于表的上方。

2) 标目：有横标目和纵标目，分别说明表格每行和每列数字的意义。横标目位于表头的左侧，代表研究的对象；纵标目位于表头右侧，表达研究对象的指标。注意标明指标的单位。

3) 线条：力求简洁，多采用三条线，即顶线、底线、纵标目下横线。部分表格可再用短横线将“合计”分隔开，或用短横线将两重纵标目分割开。其它竖线和斜线一概省去。

4) 数字：用阿拉伯数字表示。同一指标小数点位数一致，位次对齐。表内不留空项，无数字用“—”表示，缺失数字用“”表示，数值为0者记为“0”。

统计图：①根据资料性质和分析目的正确选用适当的统计图。②除圆图外，一般用直角坐标系的第一象限的位置表示图域（制图空间），或者用长方形的框架表示。③绘制图形应注意准确、美观，给人以清晰的印象。

2、常见的统计图有哪几种？它们的使用条件各是什么？

常用的统计图有直条图、直方图、百分比条图和圆图、线图、散点图、统计地图、箱式图等。

·直条图：适用于比较、分析独立的或离散变量的多个组或多个类别的统计指标。指标既可以是绝对数，也可以是相对数。

·直方图：主要应用于频数分布资料，描述连续变量的频数分布。

百分比条图和圆图：表示事物内部各构成部分所占的比重，适合描述分类变量的各类别所占的构成比。其中，百分比条图特别适合作多个构成比的比较。

·线图：适合于描述某统计量随另一连续性数值变量的变化而变化的趋势，常用于描述统计量随时间变化

而变化的趋势。普通线图描述的是绝对变化趋势，半对数线图描述的是相对变化趋势，特别适宜作不同指标或相同指标不同组别的变化速度的比较。

·散点图：以直角坐标上点的密集程度和趋势来表示两个变量间的相关关系。

·统计地图：以不同的颜色和花纹表示统计量的值在地理分布上的变化，适宜描述研究指标的地理分布。·箱式图：通过使用5个统计量（数据分布的中心位置、分布、偏度、变异范围和异常值）来反映原始数据的分布特征。特别适合多组数据分布的比较。

3、普通线图和半对数线图的主要区别是什么？

从形式上看，二者的不同点在于纵坐标的尺度不同，普通线图的纵坐标为算术尺度，而半对数线图的纵坐标为对数尺度。从用途上看，普通线图描述的是统计量的绝对变化趋势，半对数线图描述的是相对变化趋势，特别适宜作不同指标或相同指标不同组别的变化速度的比较。

实习九调查设计与实验设计

1、四种基本抽样方法的概念、优缺点和应用条件是什么？

(1) 单纯随机抽样：是在总体中以完全随机的方法抽取一部分观察单位组成样本，其整个抽样过程，都体现了随机化的原则。

单纯随机抽样的优点：简单直观，是最基本的概率抽样方法，也是其他概率抽样方法的基础。

单纯随机抽样的缺点：当总体例数较多时，编号麻烦，实际工作中难以实施；样本分散，组织困难。

单纯随机抽样方法多用于总体例数较少的情况。

(2) 系统抽样：是将总体的观察单位，按一定顺序号平均分成n个部分，每一部分抽取第k号观察单位组成样本，这里的k是随机确定的，其体现了系统抽样中的随机性。

系统抽样的优点是：1) 易于理解，简便易行；2) 容易得到一个按比例分配的样本；3) 一般情况下样本的观察单位在总体中分布均匀，其抽样误差小于单纯随机抽样。

系统抽样的缺点是如果总体中观察单位按顺序有周期趋势或单调递增（减）趋势时，采用系统抽样可能产生明显的系统误差。

系统抽样方法多用于观察单位具有现成且与试验无关的自然编号，同时观察单位在总体中分布均匀。

(3) 整群抽样：是先将总体按照某种与主要研究指标无关的特征划分为K个“群”，每个群包含若干观察单位，然后再随机抽取k个“群”，由抽取的各个群的全部观察单位组成样本。其随机性主要体现在“群”的抽取过程。

整群抽样的优点是便于组织调查、易于质量控制和节省调查成本。

整群抽样的缺点是当样本含量一定时，因为样本观察单位并非广泛散布于总体中，整群抽样的抽样误差一般大于单纯随机抽样。

整群抽样较为常用，尤其当“群”间的个体变异较小时。

(4) 分层抽样：是先按对主要研究指标影响较大的某种特征，将总体分为若干类别（统计上称之为“层”），再从每一层内随机抽取一定数量的观察单位，合起来组成样本。其随机性体现在层内的抽样过程。

分层抽样的优点是：1) 由于分层后增加了层内的同质性，观察指标变异减小，各层的抽样误差减小。

2) 分层抽样便于对不同层采用不同的抽样方法。3) 分层抽样便于对各层独立进行分析。

分层抽样的缺点是：层间变异较大，抽样误差较小；如果分层特征选择不当，层内变异较大，层间变异较小，抽样误差仍然较大，分层抽样就失去了意义。

一般情况下，当样本含量一定，几种方法抽样误差大小的排序为：分层抽样≤系统抽样≤单纯随机抽样≤整群抽样。

2、何谓调查研究和实验研究？各自的特点是什么？

调查研究：是指研究者通过客观地观察、描述调查对象来搜集资料，未加任何的干预措施。

实验研究：是指研究者根据研究假设主动地对研究对象加以干预措施，并观察总结其结果，回答研究假设所提出的问题。

3、何谓实验效应，对实验效应指标的要求是什么？

实验效应：指处理作用于实验对象的反应，一般是通过某些观察指标，定量或定性地反映实验效应。

选择观察指标的基本原则：

指标的选择必须与研究目的密切关联

客观性尽可能选择客观指标，避免一些笼统的、不确切的指标。

准确性选用的指标应尽量精确。

灵敏性和特异性实验效应指标应当同时兼顾其灵敏性和特异性，尽量使灵敏性和特异性都高。

4、实验研究中为什么要设立对照，常见的对照有几种，各自有何特点？

设立对照组的目的是衬托处理因素的效应。

对照原则：所设立的对照组必须与实验组达到均衡可比。除干预措施外，组间其他影响结果的非处理因素等尽可能相同。对所研究疾病的易感度及发病机会相等。检测和观察方法及诊断标准必须一致。

自身对照对照与实验在同一受试者身上进行，如用药前后作为对比。

空白对照对照组不施加任何处理因素。

安慰剂对照主要目的是为了平衡对照组病人心理因素的影响。

实验对照（阳性对照）对照组不施加处理因素，但施加某种实验因素。

标准对照不设立专门的对照组，而是用现有标准值或正常值做对照。

历史对照

5、实验设计为什么要遵循重复原则，影响重复性的因素有哪些？

重复原则包含重现性和观察单位数量两方面的含义。

可靠的实验结果应能在相同的条件下重现；

可靠的实验结论也不能凭一次实验或3～5例结果获得，一定要有足够量的观察单位数。

1、总体（population）：是根据研究目的确定的同质研究对象的全体。

2、样本（sample）：从总体中抽取的一部分有代表性的个体。

3、同质（homogeneity）：是指所研究的观察对象具有某些相同的性质或特征。

4、变异（variation）：指同质个体的某项指标之间的差异。

5、参数（parameter）：反映总体特征的指标称为参数。

6、统计量（statistic）：通过样本资料计算出来的相应指标称为统计量。

7、抽样误差（sampling error）：由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。

8、概率（probability）：某事件发生的可能性大小。

9、正态分布（normal distribution）：高峰位于均数处，中间高两边低，左右完全对称地下降，但永远不与横轴相交的钟形曲线。

10、平均数（average）：是描述一组同质变量值的平均水平或集中趋势的指标。 11、中位数（median）：将一组数据由小到大排列，位于中间位置的观测值。 12、医学参考值范围（medical reference range）：又称正常值范围，医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。

13、方差（variance）：是各个数据与平均数之差的平方的平均数。

14、标准差（standard deviation）：是各数据偏离平均数的距离的平均数，它是离均差平方和平均后的方根，用σ表示。

15、标准误（standard error）：样本均数的标准差，等于原变量总体标准差除以例数的平方根，用以说明均数抽样误差的大小。

16、均数的抽样误差（sampling error of mean）：由个体差异和抽样所导致的样本均数与样本均数之间，样本均数与总体均数之间的差异。

17、假设检验（hypothesis testing）：先对总体做出某种假设，然后根据样本信息来推断其是否成立的一类统计方法的总称。

18、统计推断（statistical inference）：是根据已知的样本信息来推断未知的总体，是统计分析的目的，包括参数估计和假设检验。 19、Ⅰ型错误（type Ⅰ error）：拒绝了实际上成立的H0，这类弃真错误，发生的概率为α，为已知。

20、Ⅱ型错误（type Ⅱ error）：不拒绝实际上不成立的H0，这类存伪错误，发生的概率为β，未知。

21、检验效能（power of test）：又称把握度，为1-β，其意义是两总体确有差别，按α水准能发现它们有差别的能力。

22、可信区间（confidence interval）：指总体参数可能所在的范围。 23、率（rate）：说明某现象发生的频率或强度。

24、构成比（constituent ratio）：表示某事物内部各组成部分所占的比重或分布，常以百分数表示。 25、相对比（relative ratio）：表示两个有关事物指标之比，常以百分数和倍数表示，用以说明一个指标是另一个指标的几倍或百分之几。 26、标准化率（standardized rate）：亦称调整率，是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。

27、参数检验（parametric test）：一类依赖于总体分布的具体形式的统计推断方法。 28、非参数检验

（non parametric test）：一类不依赖总体分布类型的检验，在应用中可以不考虑被研究对象为何种分布以及分布是否已知，检验假设中没有包括总体参数的统计方法。

历史老照片不能说的秘密慈禧军阀明末清初文革晚清

29、自变量（independent variable）：如果没有一个变量依赖于其他变量变化而变化的关系时，一般把测量比较简单的变量作为自变量。

30、因变量（dependent variable）：测量比较复杂的变量称为因变量或应变量。 31、相关分析

（correlation analysis）：分析两个或多个变量间相互关系的统计分析方法。 32、线性回归分析

（linear regression analysis）：用直线回归方程或数学模型描述变量间数量关系的统计方法。

33、相关系数（coefficient of correlation）：描述两个变量间线性相关关系密切程度与方向的统计指标。

34、回归系数（regression coefficient）：即回归直线的斜率，表示自变量x每改变一个单位时，应变量y平均变化b个单位，B为回归系数。

35、决定系数（determinant coefficient）：r2

，表示由x与y的直线关系导致的y的变异SS回,在总变异SS总所占比重，即回归效果的好坏，决定系数越接近1，回归效果越好。 36、最小二乘法（least square method）：以各实测点到直线的纵向距离的平方和最小来确定回归直线。

37、统计表（statistical table）：将统计分析的事物及其指标用表格的形式列出来，直观地反映事物的数量关系及其趋势的一种表现形式。

38、统计图（statistical chart）：用点的位置，线段的升降，直条的长短和面积大小等表达统计数据的一种形式。

39、单纯随机抽样（simple random sampling）：是从总体中以完全随机的方法抽取一部分观察对象组成样本，是最简单的抽样方法。

40、整群抽样（cluster sampling）：先将总体划分为N个群，每个群包含若干个观察对象，再随机抽取n个群（n

42、分层抽样（stratified sampling）：按影响观察值变异较大的某种特征将总体分成若干层，再从每层内随机抽取一定数量的观察单位组成样本。 43、配对设计（paired design）：是将受试对象按一定条件配成对子，再随机分配每对中的两个受试对象到不同的处理组，或者比较受试者实验前后的变量值改变情况。 44、盲

法（blind-method）：在随机对比试验中，为避免出现偏倚，使研究者或研究对象不明确干预措施的分配的方法。 45、对照（control）：处理因素与非处理因素的差异的科学对比，鉴别处理因素与非处理因素的效应差异。

46、随机区组设计（randomized block design）：又称配伍设计，是将几个条件基本相同的受试对象划成一个区组，区组中观察对象的数量取决于对比组的组数。将区组中的受试对象采用随机方法，分配到不同的对比组中。

47、随机对照试验（random-control trail）：又称完全随机设计，属于单因素研究设计，是将受试对象按照随机分配的原则分配到实验组和对照组中，然后给予不同的处理因素，对各组的效应进行同期平行观察，比较各组观察指标有无差异。 48、实验研究（experimental study）：是指研究者根据研究目的人为地对受试对象施加处理因素，控制混杂因素，观察、总结处理因素的效果的一种研究方法。

1、什么是卫生统计学？应用统计学的基本原理与方法，研究医学卫生及其有关领域数据信息的搜

集、整理、分析、表达和解释的一门学科。 2、统计学的基本步骤有哪些？①良好的研究设计；②有计划地搜集资料；③合理地整理资料；④正

确地分析资料。 3、抽样误差产生的原因有哪些？可以避免抽样误差吗？抽样误差的的根源在于个体变异，在抽样研

究中是不可避免的。 4、何为概率及小概率事件？概率P是指某事件发生的可能性大小。P≤0.05的随机事件称为小概率事件，其原理是在一次实验中不大可能发生的。

5、描述数值变量资料集中趋势的指标有哪些？其适用范围有何异同？均数、几何均数、中位数。均

数适用于计量资料正态分布或近似正态分布资料；几何均数适用于对数正态分布或近似对数正态分布资料，也可用于等比资料，但一般不能有观察值为0，也不能同时包含正负观察值。中位数用于描述极偏态资料，有特大特小值资料，有不确定数据资料和分布不明的资料。 6、描述数值变量资料离散趋势的指标有哪些？其适用范围有何异同？极差、四分位数间距、方差和

标准差、变异系数。极差和四分位数间距用于描述偏态分布资料、一端或两端没有确定值的资料。方差和标准差用于描述正态分布资料的离散程度。变异系数描述的是相对离散程度，用于单位不

同，或虽单位相同但均数相差较大的资料变异程度的比较。

7、中位数与百分位数在意义上，计算和应用上有何区别于联系？中位数是将一组数据由小到大排

列，位于中间位置的观测值。百分位数也是一种位置指标，样本的第x百分位数记作Px，它表示将全部观察值x1、x2…xn，由小到大排列后位于第x百分位置的数值。中位数M是一个特殊的百分位数，即第50百分位数P50。

8、标准差与标准误的区别与联系：1.区别：①标准差衡量观察值的离散趋势（变异程度），越大表

示观察值越分散，样本均数的代表性越差；反之，样本均数的代表性就越好；样本越大，标准差

趋于稳定。标准差主要用于医学参考值范围的估计。②标准误代表样本均数的变异程度，表示抽样误差的大小，标准误越大，抽样误差越大，样本均数越离散，用样本均数估计总体均数的可靠性越差，反之样本均数的可靠性就好。标准误主要用于总体均数可信区间的估计和假设检验。2.联系：都是变异指标，反应离散趋势；标准误的大小可以由标准差的大小来估计，

=/n，

与成正比，与n成反比；对于同一份资料，标准差越大，标准误也越大。

9、可信区间与参考值范围有何不同？从意义上：①可信区间按是预先给定的概率1-α确定总体均

数μ的可能范围，95%可信区间是按95%可信度估计总体均数所在的范围，此时估计正确率为95%，即有95%可能性包含了总体均数，说明总体均数的可能范围。②参考值范围是绝大多数正常人的某项指标的波动范围，95%参考值范围指同质总体中包含95%个体值的估计范围，说明个体值的波动范围。从计算上：①可信区间：正态分布，σ未知，n<100时，双侧sx,tvx；σ

未知，n≥100时，双侧sx

zx；σ已知，双侧

。

②参考值范围：正态分布，双侧Sz

，

单侧sz x或sxz

；偏态分布，双侧Px2

/～Px2/100单侧Px或P

100。从应用上：①可信区间

用于总体均数区间估计，评价未知总体均数所在范围；②参考值范围可判断某项指标是否正常，评价个体指标是否正常。

10、假设检验与区间估计有何区别与联系？①可信区间用于推断总体参数所在范围，假设检验用于推

断总体参数是否不同；②可信区间也可回答假设检验的问题，但可信区间不能提供确切的P值范

围，只能给出在α水准上有无统计学意义；③可信区间还可提示差别有无实际意义，假设检验有统计意义但无实际意义的资料，实际工作中可能不重要；④验证假设时，可选择假设检验，只对总体参数做估计时，可选用区间估计，两者结合可对问题进行更全面的说明。

11、假设检验的注意事项：①要有严密的抽样研究设计；②选择假设检验方法应符合相应条件；③有

统计学意义不等于有实际意义；④结论不能绝对化。 12、常用相对数指标有哪些，意义和计算有何不同，为什么不能以比代率？有率、构成比和相对比。

率是说明某现象发生的频率与强度，为频率指标，率=（某现象实际发生的观察单位数∕可能发生该现象的观察单位总数）×比例基数。构成比表示事物内部各组成部分所占的比重或分布，常以百分数表示，构成比=（事物内部某一组成部分的观察单位数∕该事物各构成部分的观察单位总数）×100%。相对比表示两个有关事物指标之比，常以百分数和倍数表示，相对比=（甲指标∕乙指标）（或×100%）。 13、应用相对

数时应注意哪些问题？①计算相对数时分母应该有足够数量即例数不能太少；②计算合

计率或平均率时不能把n个率相加除以n，应将绝对数相加后再计算相对数；③正确区分构成比与率，分析时不能以构成比代替率；④相对数的比较时应注意可比性；⑤样本率或构成比在比较时应做假设检验。

14、率的标准化应注意哪些问题？①标准化法只适用于内部构成不同影响到总率比较的情况；②由于

选择的标准不同，算出的标准化率也不同，但比较的结论一致；③标准化后的标准化率，已经不

再反映当时当地的实际水平，它只表示两组相互比较的资料间的相对水平；④样本标准化率也存在抽样误差，也需要进行假设检验。

15、统计表的制表原则与基本要求是什么？原则：重点突出，简单明了；主谓分明，层次清楚；结构

完整，有自明性。5项基本要求：标题、标目、线条、数字、备注。

16、常用统计图有哪些，它们的适用条件是什么？常用的统计图有：条图、圆图、百分条图、直方图、线图、半对数线图、散点图、箱式图和统计地图。①条图主要用于多个组别和多个类别的统计指

标的比较，其纵轴必须从0开始；②圆图和百分条图用于描述或比较单个或多个构成比，圆图以圆的面积为100%，而条图以直条的面积为100%；③直方图描述连续性数值变量的频数分布；④箱式图描述不同类别之间某个连续型数值变量分布特征的比较，也用于发现异常值；⑤统计地图描述某现象的数量在地域上的分布；⑥普通线图描述某指标随某个连续型数值变量变化而变化的幅度（绝对变化趋势）；⑦半对数线图描述某指标随某个连续型数值变量变化而变化的幅度（相对变化趋势）；⑧散点图描述两个连续型数值变量之间的相互关系。

17、行×列表χ2检验注意事项有哪些？1.行×列表χ2检验允许有1/5的基本格子理论频数小于5大

于1，但不能有理论频数小于1；2. 如果有1/5以上的基本格子理论频数小于5大于1，或有1个格子理论频数小于1，采用以下方法：①增加样本含量；②将理论频数太小的行和列与性质相近的邻行和邻列实际频数合并；③删除理论频数太小的格子对应的行或列；④Fisher精确概率。 18、秩和检验的适用条件？①非正态，方差不齐的资料；②有特大、特小值的资料；③有不确定数据

的资料；④分布不明的资料；⑤等级资料。

19、应用相关分析与直线回归时应注意哪些问题？①要有实际意义，不能把毫不相关的事物进行分

析；②相关关系不一定是因果关系，可能是伴随关系；③相关和回归分析都必须进行假设检验；④回归方程一般只适用于自变量x的实测值范围内，不能随意外推；⑤一般先绘制散点图，有线

性趋势时再进行。

20、直线相关与回归的区别与联系有哪些？区别：①相关关系说明两变量间的相互关系，回归说明两

变量的从属关系；②相关表明两变量的方向和密切程度，回归则用函数方程表达应变量随自变量

变化的数量关系；③相关分析要求两变量均是随机变量，并服从双变量正态分布，回归分析只要求应变量y服从正态分布；④单位不同，相关系数无单位，回归系数b有单位；⑤范围不同。相关系数-1≤r≤1，回归系数-∞﹤b﹤+∞。联系：①对于同一组数据，相关系数与回归系数的正负号一致；②同一资料r与b的假设检验等价，且有tr=tb=F

，可以用r的假设检验代替b的

假设检验；③可以用回归解释相关，FSS

总

回

，r2

为决定系数，表示y的变化中由x变

化所引起的比重

频数分布表的用途

1、作为陈述资料的形式，可以代替原始资料，便于进一步资料

描述资料的分布特征和分布类型。

频数分布有两个重要特征：集中趋势和离散趋势。大部分观察值向某一数值集中的趋势称为集中趋势，常用平均数指标来表示，各观察值之间大小参差不齐。频数由中央位置向两侧逐渐减少，称离散趋势，是个体差异所致，可用一系列的变异指标来反映。

2、便于进一步计算有关指标或进行统计分析。当数据较多且需手工计算时，常先编制频数表，再进行统计计算。

3、发现特大、特小的可疑值。

如果频数表的一端或两端出现连续几个组段的频数为零后，又出现少数几个特大值或特小值，使人怀疑其是否准确，需进一步检查和核对并做相应处理。

4、当样本容量比较大时，可各组段的频率作为频率的估计值

据此绘制频数分布图。

医学参考值范围的制定方法

1选择足够数量的正常人作为参照样本 2对选定的参考样本进行准确的测定 3决定取单侧范围还是双侧范围 4选择适当的百分范围 5估计参考值范围的界限

T检验注意事项

?假设检验结论正确的前提，要有严密的抽样设计随机、均衡、可比

?选用的检验方法必须符合其适用条件(注意：t检验的前提是资料服从正态分布) ?单侧检验和双侧检验的选择?假设检验的结论不能绝对化

?正确理解P值的统计意义，正确理解P值与差别有无统计学意义，P越小，不是说明实际差别越大，而是说越有理由拒绝H0 ，越有理由说明两者有差异，差别有无统计学意义和有无专业上的实际意义并不完全相同?假设检验和可信区间的区别

应用相对数时应注意的问题：一、构成比和率的应用不能混淆

率和构成比所说明的问题不同，构成比可以说明某事物内部各组成部分的比重或分布，而率是说明某现象发生的频率或强度的，所以不能以构成比代替率。二、计算相对数时分母不宜太小三、注意指标的可比性

可比性指所比较指标，除研究因素外，其他影响因素应基本相同或相近，即在相同条件下进行对比。通常应注意：1.观察对象同质，研究方法相同，观察时间相等，以及地区、民族、性别、年龄、病情及病程等客观条件均基本一致。2.某个对研究结果有影响的因素，在各组的内部构成是否相同。若因混杂因素干扰，使各对比组构成分布不同时，可采用标准化，平衡内部构成不同的影响后，再进行总率的比较。

四、要考虑存在抽样误差，不能仅凭数字表面想差的大小做结论

3、R*C列联表资料的Χ2检验应注意的事项。

医学统计学研究生期末考试版.doc

一、名词解释（考10对） 1.总体;样本总体：根据研究目的确定的、同质的全部观察单位某一指标（或某些因素及结果）的测量值总体。根据总体集合所包括元素是否有限，分为有限与无限总体。总体具有特定的分布特征及参数；样本：以某方式按预先规定的概率从总体中随机抽取的、具有足够数量的、能够代表总体分布特征的一部分观察单位某指标数据的集合。根据研究目的从总体中抽取部分有代表性的样本，用样本统计量推断总体参数。 2.标准差;标准误标准差：是描述单个测量值对其均数的离散程度。标准差越大，数据的离散程度就越大，均数的代表性越差；标准差越小，均数的代表性越好。标准误：样本统计量的标准差称为标准误，它反映样本统计量的抽样误差的大小，也反映样本统计量对总体参数的离散程度。标准误大，表示样本统计量对总体参数的代表性差；标 3、s x 96.1±；x v s t x ?±)(2/α s x 96.1±：表示从正态总体中抽样，样本含量较大时，观测值双侧95%的波动范围 x v s t x ?±)(2/α：从正态总体中抽样，样本含量较大(小)时，按照预先给定的概率a 确定的总体均值的（1—a ）的可信区间。 4.计量资料（数值变量资料）；计数资料(分类变量资料) 计量资料：通过度量的方法，测量每个观察单位的某项指标的量的大小而得到的一系列数据资料，其特点是多有度量单位或多为连续性资料。计数资料：指将全体观察单位按某种属性分组，然后再分别清点各组观察单位的个数而得

到的数据资料，其特点是没有度量单位或多为非连续性资料 5.点估计；区间估计点估计：直接利用样本统计量的一个数值来估计总体参数，比如基于一份随机样本，用x 估计u，用p估计π，用S估计σ。点估计方法简单，但未考虑抽样误差，故难以反映估计值对其真值的代表性。区间估计：将样本统计量和标准误结合起来，按预先给定的概率（1—a）所确定的一个包含未知总体参数的范围，该范围为总体参数的置信区间（CI）。预先给定的概率（1—a）称为可信度或置信度，常取95%或99%。 6.回顾性研究；前瞻性研究回顾性研究：即病例—对照研究，是由果到因，即先选定病例组和对照组，然后分别回顾两组过去的暴露情况，比较其差异，探索与发病相关的可能因素。回顾性研究的优点是对于患病率非常低的研究人群可获得较高的效果，研究周期较短和可以探索多个因素与患病的关联；其缺点是不能估计患病率和死亡率，容易产生回忆性偏倚和选择性偏倚。前瞻性研究：即队列研究，是由因寻果，是将选定的人群按暴露状况分成暴露组和对照组，暴露组接触某个因素而对照组不接触某个因素，其他所有条件两组基本相同。经过一定时间随访，比较暴露组和对照组在随访期间的发病率，如果两组发病率不同，则归因于该暴露因素。前瞻性研究的优点是可以估计发病率，暴露测量可以做到无偏倚，结论比较可靠。其缺点是研究效率比较低，研究周期比较长导致在研究期间可能出现失访及各种混杂因素影响。 7、完全随机设计；随机区组设计完全随机设计：又称为单因素设计或成组设计，是将同质的研究对象随机地分配到各处理组中进行实验观察，或从不同总体中随机抽样进行对比研究。随机区组设计：又称配伍组设计，是在实验设计中用一个非研究因素的变量进行分层，每个层的观察对象数相等，并对每个层进行随机分组。两种实验设计方案均为单因素实验设计。区别是：①两者观察对象随机分配方式不同；②统计分析方法不同；③误差内涵及大小不同；④检验效能不同。 8.独立性数据与重复性数据独立性：对一群观察指标独立测定一次，形成一个群体数据，观察值间互相独立，不相互影响。重复性:一个观察对象，同一或不同时间测定产生的数据。 9.α值；P值 α值:检验水准（显著性水准），即在假设检验中预先规定的判断小概率事件的概率尺度，通常为0.01或0.05，代表在原假设成立的前提下，拒接原假设所犯I类错误的概率。 P值:从已知总体中（或假设总体中）抽得统计量达到当前统计量这么大及比这绝对值还 H可能犯I 大的总概率，若以当前统计量为拒绝域临界点，在规定α前提下，实际欲拒绝

研究生医学统计学试题

试卷编号：卷课程名称：医学统计学适用专业：科学学位专业：班级姓名：学号：学院 (系 )：考试日期：题号一二三四五六七八九十总分统分题分30152530100签名得分考生注意事项： 1、本试卷共6 页，请查看试卷中是否有缺页或破损。如有立即举手报告以便更换。 2、考试结束后，考生不得将试卷、答题纸和草稿纸带出考场。一、最佳选择题(每题 2 分，共 30 分) 得评阅把每题的答案填入下表中： 123456789101112131415 A B C D B B A C C C B B C D B 1、描述一组正态分布资料的集中趋势，以指标为好。 A. 算术平均数； B. 几何平均数； C. 中位数； D. 变异系数 2、比较成人身高和儿童身高的离散趋势，宜用。 A. 标准差； B. 变异系数； C. 方差； D. 离均差平方和 3、对于正态分布资料，X +1.96S，所对应的面积占总面积的。 A. 95% ； B. 99% ； C. 47.5%； D. 49.5% 4、下列说法哪个是错误的？中位数适用于描述资料。 A. 最小组段无下限； B. 最大组段无上限； C. 偏态分布； D. 正态分布 5、大，表示用该样本均数估计总体均数的可靠性小。 A. S X； B. S； C.CV； D. Q U—Q L 6、某地 1992年随机抽取 100名健康女性，算得其血清总蛋白含量的均数为74g/L ，标准差为 4g/L ，则其 95%的可信区间为。

7、两样本均数比较的t 检验，分别取以下检验水准，以所取第二类错误最大。 A. α =0.01； B. α=0.05； C. α =0.10； D.α=0.20 8、两样本均数比较的t 检验结果， P<0.05 ，可认为。 A. 两样本均数不等； B. 两样本均数相等； C. 两总体均数不等； D. 两总体均数相等 9、完全随机设计的方差分析结果，P≤ 0.05，可认为。 A. 各样本均数不等或不全等； B. 各样本均数都不相等； C. 各总体均数不等或不全等； D. 各总体均数都不相等 10、某地某年肝炎发病人数占总人数的5%，这是该地该年肝炎的。 A. 年发病率； B. 年患病率； C. 患病构成比； D. 患者平均数 11、已知甲县人口较乙县年青，今欲比较两县死亡率的高低，适当的比较方法是。 A.将两县的总死亡率直接比较； B.对年龄进行标准化后，再比较两县总死亡率； C.将两县的总死亡率进行 t 检验后再比较； D.将两县的总死亡率进行χ2检验后再比较 12、下面哪一点不是Poisson 分布的性质。 A. λ =σ2； B. 当λ≥ 20 时，近似正态分布； C. 可加性； D. 相互影响性 13、χ2检验中理论数T 的计算式为。 A. n r (1 n c ) ； B. (1 n r ) n c； C. n r n c； D. n r n c N N N N 14、已知两组计量资料方差不齐，可用检验。 A. t 检验； B. U 检验； C. F 检验； D. 秩和检验 15、对一组既做相关分析又做回归分析的资料，有。 A. b=r ； B. t b=t r； C. b=a； D. r=1

医学统计学名词解释及问答题

1、总体（population）：是根据研究目的确定的同质研究对象的全体。 2、样本（sample）：从总体中抽取的一部分有代表性的个体。 3、同质（homogeneity）：是指所研究的观察对象具有某些相同的性质或特征。 4、变异（variation）：指同质个体的某项指标之间的差异。 5、参数（parameter）：反映总体特征的指标称为参数。 6、统计量（statistic）：通过样本资料计算出来的相应指标称为统计量。 7、抽样误差（sampling error）：由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。 8、概率（probability）：某事件发生的可能性大小。 9、正态分布（normal distribution）：高峰位于均数处，中间高两边低，左右完全对称地下降，但永远不与横轴相交的钟形曲线。 10、平均数（average）：是描述一组同质变量值的平均水平或集中趋势的指标。 11、中位数（median）：将一组数据由小到大排列，位于中间位置的观测值。 12、医学参考值范围（medical reference range）：又称正常值范围，医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。 13、方差（variance）：是各个数据与平均数之差的平方的平均数。 14、标准差（standard deviation）：是各数据偏离平均数的距离的平均数，它是离均差平方和平均后的方根，用σ表示。 15、标准误（standard error）：样本均数的标准差，等于原变量总体标准差除以例数的平方根，用以说明均数抽样误差的大小。 16、均数的抽样误差（sampling error of mean）：由个体差异和抽样所导致的样本均数与样本均数之间，样本均数与总体均数之间的差异。 17、假设检验（hypothesis testing）：先对总体做出某种假设，然后根据样本信息来推断其是否成立的一类统计方法的总称。 18、统计推断（statistical inference）：是根据已知的样本信息来推断未知的总体，是统计分析的目的，包括参数估计和假设检验。 19、Ⅰ型错误（type Ⅰ error）：拒绝了实际上成立的H0，这类弃真错误，发生的概率为α，为已知。 20、Ⅱ型错误（type Ⅱ error）：不拒绝实际上不成立的H0，这类存伪错误，发生的概率为β，未知。 21、检验效能（power of test）：又称把握度，为1-β，其意义是两总体确有差别，按α水准能发现它们有差别的能力。 22、可信区间（confidence interval）：指总体参数可能所在的范围。 23、率（rate）：说明某现象发生的频率或强度。 24、构成比（constituent ratio）：表示某事物内部各组成部分所占的比重或分布，常以百分数表示。 25、相对比（relative ratio）：表示两个有关事物指标之比，常以百分数和倍数表示，用以说明一个指标是另一个指标的几倍或百分之几。 26、标准化率（standardized rate）：亦称调整率，是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。 27、参数检验（parametric test）：一类依赖于总体分布的具体形式的统计推断方法。 28、非参数检验（non parametric test）：一类不依赖总体分布类型的检验，在应用中可以不考虑被研究对象为何种分布以及分布是否已知，检验假设中没有包括总体参数的统计方法。

研究生医学统计学上机试题

医学科研中的统计学方法上机试题时间：2014-12-15 共4题，共100分 1．某医院病理科研究人体两肾的重量，20例男性尸解时的左、右肾的称重记录见下表，问左、右肾重量有无不同？表1：20例男性尸解时左、右肾的称重记录编号左肾（克）右肾（克） 1 170 150 2 155 145 3 140 105 4 11 5 100 5 235 222 6 125 115 7 130 120 8 145 105 9 105 125 10 145 135 11 155 150 12 110 125 13 140 150 14 145 140 15 120 90 16 130 120 17 105 100 18 95 100 19 100 90 20 105 125 2. 在评价某药物耐受性及安全性的I期临床试验中，对符合纳入标准的40名健康自愿者随机分为4组，每组10名，各组注射剂量分别为0.5U、1U、2U、3U，观察48小时后部分凝血活酶时间（s）。试比较任意两两剂量间的部分凝血活酶时间有无差别？

表2 各剂量组48小时部分凝血活酶时间（s） 0.5 U 1 U 2 U 3 U 36.8 40.0 32.9 33.0 34.4 35.5 37.9 30.7 34.3 36.7 30.5 35.3 35.7 39.3 31.1 32.3 33.2 40.1 34.7 37.4 31.1 36.8 37.6 39.1 34.3 33.4 40.2 33.5 29.8 38.3 38.1 36.6 35.4 38.4 32.4 32.0 31.2 39.8 35.6 33.8 3. 某神经内科医师观察291例脑梗塞病人，其中102例病人用西医疗法，其它189 例病人采用西医疗法加中医疗法，观察一年后，单纯用西医疗法组的病人死亡13例，采用中西医疗法组的病人死亡9例，请分析两组病人的死亡率差异是否有统计学意义？ 4. 某省卫生防疫站对八个城市进行肺癌死亡回顾调查，并对大气中苯并（a）芘进行监测，结果如下，试检验两者有无相关？表4 八个城市的肺癌标化死亡率和大气中苯并（a）芘浓度城市编号肺癌标化死亡率（1/10万）苯并（a）芘（μg/100m3） 1 5.600.05 2 18.50 1.17 3 16.23 1.05 4 11.400.10 5 13.800.75 6 8.130.50 7 18.000.65 8 12.10 1.20

医学统计学名词解释问答题

医学统计学 1、应用相对数时应注意的事项 ①计算相对数时分母不能太小； ②分析时不能以构成比代替率； ③当各分组的观察单位数不等时，总率（平均率）的计算不能直接将各分组的率相加求其平均； ④对比时应注意资料的可比性：两个率要在相同的条件下进行，即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致，其他影响因素在各组的内部构成应相近； ⑤进行假设检验时，要遵循随机抽样原则，以进行差别的显著性检验。 2、正态分布的特点及其应用性质：①两头低中间高，略呈钟形； ②只有一个高峰，在X=μ，总体中位数亦为μ； ③以均数为中心，左右对称； ④μ为位置参数，当σ恒定时，μ越大，曲线沿横轴越向右移动； σ为变异度参数，当μ恒定时，σ越大，表示数据越分散，曲线越矮胖，反之，曲线越瘦高； ⑤对于任何服从正态分布N（μ，σ2）的随机变量X作的线性变换，都会变换成u 服从于均数为0，方差为1的正态分布，即标准正态分布。应用：①概括估计变量值的频数分布； ②制定参考值范围； ③质量控制； ④是许多统计方法的理论基础。 3、确定参考值范围的一般原则和步骤、方法一般原则和步骤：①抽取足够例数的正常人样本作为观察对象； ②对选定的正常人进行准确而统一的测定，以控制系统误差； ③判断是否需要分组测定； ④决定取单侧范围值还是双侧范围值； ⑤选定适当的百分范围； ⑥选用适当的计算方法来确定或估计界值。方法：①正态分布法：②百分位数法（偏态分布） 4、总体均数的可信区间与参考值范围的区别概念：可信区间是按预先给定的概率来确定的未知参数μ的可能范围。参考值范围是绝大多数正常人的某指标范围。所谓正常人，是指排除了影响所研究指标的疾病和有关因素的人；所谓绝大多数，是指范围，习惯上指正常人的95%。计算公式：可信区间① ② ③ 参考值范围①正态分布 ②偏态分布用途：可信区间用于总体均数的区间估计参考值范围用于表示绝大多数观察对象某项指标的分布范围

医学统计学研究生题库汇编

医学统计学复习练习题库研究生教材使用一、最佳选择题 1．卫生统计工作的步骤为 A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2．统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3．统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4．抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6．描述一组偏态分布资料的变异度，宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距

E.方差 7．用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8．比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9．频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10．正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11．正态分布曲线下右侧5％对应的分位点为 A.μ+1.96σ B.μ-1.96σ C.μ+2.58σ D.μ+1.64σ E.μ-2.58σ 12．下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13．某种人群（如成年男子）的某个生理指标（如收缩压）或生化指标（如血糖水平）的正常值范围一般指 A.该指标在所有人中的波动范围 B.该指标在所有正常人中的波动范围 C.该指标在绝大部分正常人中的波动范围 D.该指标在少部分正常人中的波动范围 E.该指标在一个人不同时间的波动范围 14．下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. x s x μ- 2．统计分析的主要内容有

【缩印整理版】医学统计学名词解释及问答题

统计学（Statistics）：运用概率论、数理统计的原理与方法，研究数据的搜集；分析；解释；表达的科学。总体（population）：大同小异的研究对象全体。更确切的说，总体是指根据研究目的确定的、同质的全部研究单位的观测值。样本（sample）：来自总体的部分个体，更确切的说，应该是部分个体的观察值。样本应该具有代表性，能反映总体的特征。利用样本信息可以对总体特征进行推断。抽样误差（sampling error）在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异，以及多个样本统计量之间的差异。可用标准误描述其大小。标准误(Standard Error) 样本统计量的标准差，反映样本统计量的离散程度，也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比，与样本例数的平方根呈反比，故欲降低抽样误差，可增加样本例数区间估计（interval estimation）：将样本统计量与标准误结合起来，确定一个具有较大置信度的包含总体参数的范围，该范围称为置信区间（confidence interval，CI），又称可信区间。参考值范围描述绝大多数正常人的某项指标所在范围；正态分布法（标准差）、百分位数法，参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法（标准误）、二项分布法。置信区间估计总体参数所在范围可信区间：按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间（confidence interval，CI）。它的确切含义是：可信区间包含总体参数的可能性是1- α ，而不是总体参数落在该范围的可能性为1-α 。参数统计（parametric statistics）非参数统计（nonparametric statistics）是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。变异（variation）：对于同质的各观察单位，其某变量值之间的差异同质（homogeneity）：研究对象具有的相同的状况或属性等共性。回归系数有单位，而相关系数无单位 β为回归直线的斜率(slope)参数，又称回归系数(regression coefficient)。线性相关系数（linear correlation coefficient）：又称Pearson积差相关系数（Pearson product moment coefficient），是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。参数（parameter）：描述总体特征的统计指标。统计量（statistic）：描述样本特征的统计指标。实验设计的基本原则对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时，要同时设立对照组重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复；观察多个受试对象（样本量）；同一受试对象重复观察。作用是估计变异大小和降低变异随机化(randomization) 采用随机的方式，使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误（假阳性错误）真实情况为H0是成立的，但检验结果为H0不成立，这样的错误称为I类错误。其发生的概率用α表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误（假阴性错误）真实情况为H1是成立的，但检验结果为H1不成立，这样的错误称为II类错误。其发生的概率用β表示。由于其取值取决于H1 ，因此在假设检验中无法确定。变异指标是用于描述一组观察值围绕中心位置散布的范围，即描述离散趋势的统计指标。数值越大，说明数据越离散，反之越集中。极差 (range)；四分位数间距(quartile range)；方差(variance)；标准差(standard deviation)；变异系数(coefficient of variation 平均数指标用于描述一组同质观察值的集中趋势，反映一组观察值的平均水平。算术均数（arithmetic mean）；几何均数（geometric mean）；中位数（median）；众数（mode）单纯抽样将调查总体的全部观察单位编号，从而形成抽样框架，在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。按照某种顺序给总体中的个体编号，然后随机地抽取一个号码作为第一个调查个体，其他的调查个体则按照某种确定的规则“系统”地抽取。最常用的方法是等距抽样分层抽样先将总体中全部个体按某种特征分成若干“层”，再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差，要求层内误差最小，层间误差最大。整群抽样先将总体分成若干“群”，从中随机抽取几个群，抽取群内的所有观察单位组成调查样本。 “群”的确定与研究目的无关。为减少抽样误差，需多抽几个“群”。方差分析：又称变异数分析或 F检验，适用于对多个平均值进行总体的假设检验，以检验实验所得的多个平均值是否来自相同总体。析因设计（factorial design）实验：凡同时配置两个或两个以上处理因素，这些因素的各水平又具有完全组合的实验，统称为析因设计（factorial design）实验。随机区组设计（randomized block design）是事先将全部受试对象按某种可能与实验因素有关的特征分为若干个区组（block），使每一区组内的受试对象例数与处理因素的分组数相等，使每个实验组从每一区组得到一例受试对象。单向方差分析（one way analysis of variance）是指处理因素只有一个。这个处理因素包含有多个离散的水平，分析在不同处理水平上应变量的平均值是否来自相同总体。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。随机变量（random variable）是指取指不能事先确定的观察结果。随机变量的具体内容虽然是各式各样的，但共同的特点是不能用一个常数来表示，而且，理论上讲，每个变量的取值服从特定的概率分布。变异系数（coefficient of variation）用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV 表示。计算：标准差/均数*100% 直线回归（linear regression）建立一个描述应变量依自变量变化而变化的直线方程，并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种，故又称简单回归（simple regression）。回归系数（regression coefficient ）即直线的斜率 (slope)，在直线回归方程中用b 表示，b 的统计意义为X每增（减）一个单位时，Y平均改变b 个单位。相关系数r：用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。秩次：变量值按照从小到大顺序所编的秩序号称为秩次（rank）。秩和：各组秩次的合计称为秩和（rank sum），是非参数检验的基本统计量。方差（variance）：方差表示一组数据的平均离散情况，由离均差的平方和除以样本个数得到。检验效能：1- β称为检验效能（power of test），它是指当两总体确有差别，按规定的检验水准a 所能发现该差异的能力。百分位数（percentile）是将n 个观察值从小到大依次排列，再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围随机误差（random error）又称偶然误差，是指排除了系统误差后尚存的误差。它受多种因素的影响，使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。一、统计表有哪些要素构成的？制表的注意事项有哪些？一般来说，统计表由标题、标目、线条和数字、备注五部分组成。但备注并不是必需的内容，可以根据需要出现。 1简明扼要，重点突出：最好一张表突出一个中心，不易太多中心，如果需要说明多个中心，可分成多张统计表。 2合理安排主语和谓语的位置：对于表中任意一行，从左至右，通过简短的连接词，可连成成一句通顺的句子。 3表中数据要认真核对，保证准确可靠二、为什么不宜用t 检验对多组均数进行比较？如果用t检验进行多个样本均数的两两比较，则会增加犯I 类错误的概率。经检验得到拒绝H0 ，认为两组之间有差别的结论可能犯I类错误的概率为α，不犯I类错误的概率为 1- α.每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数，上例α=0.05, k=3，则均不犯错误的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I 类错误的概率为1-(1- α)k 三、方差分析的基本思想是什么？按实验设计的类型，将全部观察值间的变异分解成两个或多个组成部分，然后将各部分的变异与随机误差进行比较（每个部分的变异可由某因素的作用来解释），以判断各部分的变异是否具有统计学意义，从而推断不同样本所代表的总体均数是否相同。五、简述直线相关与回归的区别与联系区别：1．回归说明依存关系，直线回归用于说明两变量间数量依存变化的关系，描述y如何依赖于x 而变化；相关说明相关关系，直线相关用于说明两变量间的直线相关关系，此时两变量的关系是平等的 2．r与b有区别：r说明具有直线关系的两个变量间相关的密切程度与相关方向； b表示x每改变一个单位，y平均增（减）多少个单位； 3．资料要求不同：直线回归要求应变量 y是来自正态总体的随机变量，而x可以是来自正态总体的随机变量，也可以是严密控制、精确测量的变量，相关分析则要求x，y是来自双变量正态分布总体的随机变量。 4.取值范围：-∞

研究生医学统计学试题

《医学统计学》试题注：满分300分。最终成绩=总得分/3；

说明 1、试题意在考察研究生对《医学统计学》理论知识和SPSS统计软件的学习掌握情况。 2、研究生在答题过程中严禁抄袭、复印。如发现答案雷同者，该科目成绩将判为“不及格”，后果由学生自负。 3、答题时，不写具体的操作过程（如“选择Analyze→General linear Models→Univariate…，弹出Univariate对话框”）。 4、答题时，首先应明确交代某题所用的具体统计方法。 5、答题时，只将答题有关的SPSS输出结果粘贴到答案中，并且对结果要做出必要的解释；对答题无关的输出结果不要粘贴到答案中。如果对结果不做任何解释，或将跟答题无关的输出结果粘贴到答案中，将对成绩有严重影响。 6、试题（卷）的答案要求A4纸双面打印。

1、（20分）从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇（mmol/L）的测量结果如下表1，①求其均数，中位数，标准差，标准误，最大值，最小值，极差、第2.5、25、75、97.5百分位数（10分）；②编制（改进）频数分布表、绘制直方图（各5分）。表1 某年某单位101名正常成年的血清总胆固醇（mmol/L） 2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26 2、（10分）为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同，某人随机抽取了10份乳酸饮料制品，分别用脂肪酸水解法和哥特里－罗紫法测定其结果如表2第(1)~(3)栏。问两法测定结果是否不同？（写出统计方法并粘贴结果5分；写出统计量、p及对结果进行合理解释5分）。表2 两种方法对乳酸饮料中脂肪含量的测定结果(%) 编号(1) 哥特里－罗紫法 (2) 脂肪酸水解法 (3) 1 0.840 0.580 2 0.591 0.509 3 0.67 4 0.500 4 0.632 0.316 5 0.687 0.337 6 0.978 0.517 7 0.750 0.454 8 0.730 0.512 9 1.200 0.997 10 0.870 0.506 3、（10分）大量研究显示汉族足月正常产男性新生儿临产前双顶径(BPD)均数为9.3cm。某医生记录了某山区12名汉族足月正常产男性新生儿临产前双顶径（BPD）资料如下：9.95、9.33、9.49、9.00、10.09、9.15、9.52、9.33、9.16、9.37、9.11、9.27。试问该地区男性新生儿临产前双顶径（BPD）是否大于一般新生儿（写出统计方法并粘贴结果5分；写出统计量、p及对结果进行合理解释5分）。 4、（15分）为研究国产四类新药阿卡波糖胶囊的降血糖效果，某医院用40名II型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹胶囊)，分别测得试验开始前和8周后的空腹血糖，算得空腹血糖下降值见表3。①请对两组数据做正态性检验（5分）；②能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果不同（写出统计方法并粘贴结果5分、写出统计量、p及对结果进行合理解释5分）？

医学统计学名词解释及问答题

1、总^(population)：就是根据研究目得确泄得同质研究对象得全体。 2、样本(sample):从总体中抽取得一部分有代表性得个体。 3、同质(homogeneity):就是指所研究得观察对象具有某些相同得性质或特征。 4、变异(variation):指同质个体得某项指标之间得差异。 5、参数(parameter):反映总体特征得指标称为参数。 6、统计量(statistic):通过样本资料il ?算出来得相应指标称为统计量。 7、抽样误差(sampling error):由随机抽样造成得样本指标与总体指标之间、样本指标与样本指标 Z 间得差异。 8、概率(probability):某事件发生得可能性大小。 9、正态分布(normal distribution):高帐位于均数处冲间高两边低,左右完全对称地下降，但永远不与横轴相交得钟形曲线。 10、平均数(average):就是描述一组同质变量值得平均水平或集中趋势得指标。 11、中位数(median):将一组数据由小到大排列，位于中间位置得观测值。 12、医学参考值范@(medical reference range):X 称正常值范饥医学上常将包括绝大多数正常人得某项指标得波动范围称为该指标得正常值范鬧。 13、方差他I 伽CC):就是徉个数据与平均数之差得平方得平均数。 14、标准差(standard deviation):就是各数据偏离平均数得距离得平均数，它就是离均差平方与平均后得方根，用0表示。 15、标准i^tstandard error):样本均数得标准差,等于原变量总体标准差除以例数得平方根，用以说明均数抽样误差得大小。 16、均数得抽样误差(sampling error of mean):由个体差异与抽样所导致得样本均数与样本均数之间,样本均数与总体均数之间得差异。 17、假设检验(hypothesistesting):先对总体做出某种假设，然后根据样本信息来推断其就是否成立得一类统计方法得总称。 18、统计推断(statistical inference):就是根据已知得样本信息来推断未知得总体，就是统计分析得目得,包括参数估计与假设检验。 19、 I 型错误(type I error)：拒绝了实际上成立得Hu.这类弃真错误，发生得槪率为Q,为已知。 20、 II 型错误(type II error):不拒绝实际上不成立得Ho,这类存伪错误，发生得概率为B ，未知。 21、检验效能(power of test):又称把握度，为意义就是两总体确有差别，按a 水准能发现它们有差别得能力。可信区间(confidence interval):指总体参数可能所在得范围。率(血⑹:说明某现象发生得频率或强度。构成比(constituent ratio):^示某事物内韶^$组成部分所占得比重或分布,常以百分数表示。相对比(relative ratio):表示两个有关事物指标之比，常以百分数与倍数表示，用以说明一个指标就是另一个指标得几倍或百分之几。 26、标准化率(standardized 臥C):亦称调整率，就是采用统一得标准对内部构成不同得各组频率进行调整与对比得方法。 27、参数检验(paramchic test)：—类依赖于总体分布得具体形式得统计推断方法。 28、非参数检验(non parametric test)：-类不依赖总体分布类型得检验,在应用中可以不考虑被研究对象为何种分布以及分布就是否已知，检验假设中没有包括总体参数得统计方法。 22 、 23、 24

医学统计学题库

第一章绪论习题一、选择题 1．统计工作和统计研究的全过程可分为以下步骤:（D ） A . 调查、录入数据、分析资料、撰写论文 B . 实验、录入数据、分析资料、撰写论文 C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中，习惯上把（B ）的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3～8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下：0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是（ A ）。 4.分别用两种不同成分的培养基（A 与B ）培养鼠疫杆菌，重复实验单元数均为5个，记录48小时各实验单元上生长的活菌数如下，A ：48、84、90、123、171；B ：90、116、124、225、84。该资料的类型是（C ）。 5.空腹血糖测量值，属于（ C ）资料。 6.用某种新疗法治疗某病患者41人，治疗结果如下：治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是（B ）。 7.某血库提供6094例ABO 血型分布资料如下：O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是（D ）。 8. 100名18岁男生的身高数据属于（C ）。二、问答题 1．举例说明总体与样本的概念. 答：统计学家用总体这个术语表示大同小异的对象全体，通常称为目标总体，而资料常来源于目标总体的一个较小总体，称为研究总体。实际中由于研究总体的个体众多，甚至无限多，因此科学的办法是从中抽取一部分具有代表性的个体，称为样本。例如，关于吸烟与肺癌的研究以英国成年男子为总体目标，1951年英国全部注册医生作为研究总体，按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2．举例说明同质与变异的概念答:同质与变异是两个相对的概念。对于总体来说，同质是指该总体的共同特征，即该总体区别于其他总体的特征；变异是指该总体内部的差异，即个体的特异性。例如，某地同性别同年龄的小学生具有同质性，其身高、体重等存在变异。 3．简要阐述统计设计与统计分析的关系答：统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的，统计设计在前，然而一定的统计设计必然考虑其统计分析方法，因而统计分析又寓于统计设计之中；统计分析是在统计设计的基础上，根据设计的不同特点，选择相应的统计分析方法对资料进行分析

医学统计学问答题

1、标准正态分布（u分布）与t分布有何异同？相同点：集中位置都为0，都是单峰分布，是对称分布，标准正态分布是t分布的特例（自由度是无限大时）不同点：t分布是一簇分布曲线，t 分布的曲线的形状是随自由度的变化而变化，标准正态分布的曲线的形状不变，是固定不变的，因为它的形状参数为1。 3、简述直线回归与直线相关的区别。 1资料要求上不同：直线回归分析适用于应变量是服从正态分布的随机变量，自变量是选定变量；直线相关分析适用于服从双变量正态分布的资料。 2 两种系数的意义不同：回归系数是表明两个变量之间数量上的依存关系，回归系数越大回归直线越陡峭，表示应变量随自变量变化越快；相关系数是表明两个变量之间相关的方向和紧密程度的，相关系数越大，两个变量的关联程度越大。第一章医学统计中的基本概念 2、抽样中要求每一个样本应该具有哪三性？从总体中抽取样本，其样本应具有“代表性”、“随机性”和“可靠性”。（1）代表性: 就是要求样本中的每一个个体必须符合总体的规定。（2）随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。（3）可靠性: 即实验的结果要具有可重复性，即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多，可靠性会越大，但是例数增加，人力、物力都会发生困难，所以应以“足够”为准。需要作“样本例数估计”。 3、什么是两个样本之间的可比性？可比性是指处理组（临床设计中称为治疗组）与对照组之间，除处理因素不同外，其他可能影响实验结果的因素要求基本齐同，也称为齐同对比原则。实习一统计研究工作的基本步骤 1、什么叫医学统计学？医学统计学与统计学、卫生统计学、生物统计学有何联系与区别？医学统计学：是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科统计学：是研究数据的收集、整理、分析与推断的科学。卫生统计学：是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。生物统计学：是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。 2、医学统计的资料主要来源于那些方面？有何要求？医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的的数据；现场调查资料主要来源于大规模的流行病调查获取的资料；医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等；报表有卫生工作基本情况年报表、传染年（月、日）报表、疫情旬（年、月、日）报表等；报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。这些资料的手机过程中，必须进行质量抗旨，包括它的统一性、确切性、可重复性。这些原始数据的精读和偏性应有明确的范围。 3、医学统计学的资料类型有哪些？（1）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重(kg)、红细胞计数(1012/L)、脉搏（次/分）、血压（KPa）等。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数

医学统计学__问答题

医学统计学 研究生期末考试版.doc

研究生医学统计学试题

医学统计学名词解释及问答题

研究生医学统计学上机试题

医学统计学名词解释问答题

医学统计学研究生题库汇编

【缩印整理版】医学统计学名词解释及问答题

研究生医学统计学试题

医学统计学名词解释及问答题

医学统计学题库

医学统计学 问答题

医学统计学研究生期末考试版.doc

医学统计学问答题