文档库 最新最全的文档下载
当前位置:文档库 › 【孙振球第三版】医学统计学复习重点(第一至第十章)

【孙振球第三版】医学统计学复习重点(第一至第十章)

【孙振球第三版】医学统计学复习重点(第一至第十章)
【孙振球第三版】医学统计学复习重点(第一至第十章)

一、名词解释:

1、总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。

2、有限总体:是指空间、时间范围限制的总体。

3、无限总体:是指没有空间、时间限制的总体。

4、样本:从总体中随机抽取部分观察单位,其实测值的集合。

5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。

6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。

7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。

8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。

9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。

10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。

11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。检验水平,就是预先规定的允许犯I型错误概率的最大值。I型错误概率大小也用α表示,α可取单尾亦可取双尾。12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。

14、率:强度相对数,说明某现象发生的频率或强度。

15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。

16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。

17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。

18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。

20、相关系数:又称Pearson积差相关系数,以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位,其值为-1≤r≤1。相关系数的检验假设常用t检验。

21、回归系数:即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。

22、随机划原则:是指在实验分组时,每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。

23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。

24、无序分类变量资料:计数资料,又称定性资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。

(2)多分类:各类间互不相容。

25、期望寿命:指同时出生的一代人活满x岁以后尚能生存的年数(即岁数)。

26、检验效能:表达式为1-β,以往称把握度。其意义为当两总体确有差异,按规定检验水准所能发现该差异的能力。

27、观察单位:亦称个体,是统计研究中的基本单位。它可以是一个人、一只动物,也可以是特指的一群人;可以是一个器官,甚至一个细胞。

28、样本含量:样本中包含观察单位数称为该样本的样本含量。

29、变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,成为变量。

30、变量值:对变量的观测值称为变量值或观察值。

31、误差:泛指实测值与真实值之差,按产生原因和性质可粗分为(1)随机误差;(2)非随机误差①系统误差②非系统误差。32、系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。

33、非系统误差:在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除,否则将影响研究结果的准确性。

34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。在重复多次后,出现结果的比例称之为频率。

35、概率:概率是描述随机事件发生可能性大小的一个度量。

36、医学参考值:是直指包括绝大多数正常人的人体形态、功能和代谢产物等个各种生理指标常数,也称正常值。由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故医学参考值范围作为判定正常和异常的参考标准。

37、正态分布:正态分布又称高斯分布,是一种很重要的连续型分布,应用很广。若指标X的频率分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。

38、偏态分布:指集中位置偏向一侧,频数分布不对称。(1)正偏态分布:集中位置偏向数值小的一侧。(2)负偏态分布:集中位置偏向数值大的一侧。

39抽样:在医学研究中,为节省人力、物力、财礼和时间,一般都采取从总体中抽取样本,根据样本信息来推断总体特征的方法,即抽样研究的方法来实现,这种从总体种随机抽取部分观察单位的过程称为抽样。为保证样本的代表性,抽样时必须遵循随机化原则。

二、填空题

1、医学统计工作的基本步骤:设计、搜集资料、整理资料、分析资料。

2、医学统计资料的主要来源的四个方面:统计报表、经常性工作记录、专题调查、统计年鉴和数据库专集。

3、正态分布的规律的应用:估计频数分布情况、质量控制、统计处理方法的理论基础、估计医学参考值范围。

4、计量资料统计描述的方法:频数分布表、频数分布图、统计指标。

5、CV(变异系数):常用于度衡量单位不同和均数相悬殊的多组资料变异度的比较。

6、统计推断是从总体中随机抽样本,由样本信息推断总体特征的过程,包括参数估计和假设检验两方面内容。参数估计包括点估计和区间估计。

7、可信区见估计的优劣取决于两要素:(1)可信度1-α(准确度),即区间包含总体均数μ的理论概率大小,可信度愈接近1愈好。(2)区间宽度β(精密度),即区间的长度,区间愈窄愈好。

8、变量变换的方法有:对数变换、平方跟变换、倒数变换、平方根反正弦变换。

9、常用的相对数:率、构成比、相对比。

10、动态数列常用指标有:绝对增长量、发展速度与增长速度、平均发展速度、平均增长速度。

11、二项式分布的参数是n和π。n,n次独立重复实验数目;π,每次实验的“阳性”概率。

12、二项式分布在n很大,而π很小,且nπ=λ为常数时,二项式分布近似Poisson分布。

13、总体均数λ与总体方差σ2相等是Poisson分布的重要特征。

14、Poisson分布具备可加性。

15、当λ(总体率)增大时,Poisson分布渐近正态分布。16、四格表中四格子基本数值为两对实测的实际频数和理论频数。

17、R*C表的卡方检验,若表格中有一个方向按多个等级分类时,则称之为单向有序行列表,当等级数大于3时,如检验各处理组各等级下的构成比有无差别时采用Χ2检验,如检验各处理组各等级下的程度上有无差别时采用非参数检验。

18、配对比较秩和检验,以正秩或负秩的和(T)为检验统计量,其中T越小则P的值小于相应的检验水平。

19、正态分布的两个参数μ和σ2,前者决定分布的位置,后者决定分布的形态(形状、变异度)。

20、四格表Χ2的校正条件为n≥40而且1<T<5。

21、R*C表资料Χ2检验,如果有T<1,应该采取的措施有:(1)增加样本含量,使理论频数增大;(2)根据专业知识考虑能否删除理论频数太小的行或列,能否将理论频数太小的行或列与性质相近的行或列合并。(3)改用双向无序R*C表资料的Fisher确切概率法。

22、Poisson分布中,总体的方差与均数的关系是λ=σ2,当均数较大时,Poisson分布趋近于正态分布。

23、要分析某个资料是否属于二项分布,可用频数分布的拟合优度的Χ2检验。

24、r是相关系数,表示具有直线关系的两变量间相关密切程度和相关方向。

25、变异系数的应用条件是均数相差较大、观察指标单位不同。

26、Χ2表示理论频数与实际频数的符合程度。

27、常用相对数的指标有强度相对数字(率)、结构相对数(构成比)、相对比(比)。

28、常用的描述构成比的统计图有圆图和百分比条图。

29、方差分析的应用条件为相互独立的随机样本、来自正态总体、方差齐性。

30、实验设计的基本原则随即机原则、对照原则、重复原则。

31、常用的几种统计图有直条图、圆图和百分比条图、线图、直方图、统计地图、其它特殊分析图。

32、写出四种变量变换的方法:倒数变换、平方根变换、平方反正弦变换、对数变换。

33、在F检验中如有各比较组方差不齐时应用变量变换、近似t 检验、Wilcoxon秩和检验的方法。

34、四格表资料Χ2适用条件:(1)n≥40且T≥5时用Χ2检验的基本公式,当P≈α时,改用四格资料表的Fisher的确切概率法;(2)n≥40且1<T<5时用,用四格资料表Χ2检验的校正公式,或改用四格资料表的Fisher的确切概率法;(3)n<40,或T<1时,改用四格资料表的Fisher的确切概率法。

35、当总体率λ很小时,当n很大时,二项分布可用泊松分布来近似。

36、率的标准化的计算方法有直接标准化方法和间接标准化方法。

37、Χ2检验的用途:(1)推断两个总体率或构成比之间有无差别;(2)多个总体率或构成比之间有无差别;(3)两分类变量间有无

关联性;(4)多个样本间的多重比较;(5)频数分布拟合优度的Χ2检验。

38、拟合优度检验常用判定实际分布是否符合正态分布、二项分布、Poisson分布和负二项分布。

39、实验设计的三个基本要素为:实验单位、处理因素、实验效应。

40、变异系数常用于观察单位指标不同和均数相差较大的多组资料变异度的比较。

41、所有检验统计量是在H0的条件下计算出来的。

42、标准化的目的是为了消除构成比不同对合计率的影响,使比较组间具有可比性。

43、统计推断包括:参数估计(区间估计、点值估计)、假设检验。

44、医学参考值的制定方法包括:正态分布法、百分位数法。

45、Poisson分布的性质:(1)可加性、(2)总体均数λ与总体方差α2相等、(3)当n很大而π很小且nπ=λ时二项分布近似Poisson分布、(4)当λ增大时,Poisson分布渐近正态分布。

46、集中趋势的描述指标:算术均数、集几何均数、中位数和百分位数。

47、离散趋势的描述指标;极差、四分位数间距、方差与标准差、变异系数。

第二章计量资料的统计描述

1、集中趋势、离散趋势的统计描述指标以及区别。

答:一、集中趋势的描述指标:统计学用平均数这一指标来描述一组变量值的集中位置或平均水平。(1)算术均数:简称均数字,可用于反映一组呈对称分布的位置在数量上的平均水平。(2)几何均数:可用于反映一组经对数转换后呈对称分布的变量在数量上的平均水平,在医学研究中常适用于免疫学的指标。(3)中位数:是将n个变量值从小到大排列,位置居中间的那个数。<分为奇偶两种情况。(4)百分位数:是一种位置指标,用P X来表示。

二、描述数据变异大小的常用指标有极差、四分位数间距、方差、标准差和变异系数。(1)级差:级差即是一组变量最大的值与最小值之差。(2)四分位数间距:四分位数间距是把全部变量值分为四部分的分位数,即第1四分位数、第2四分位数、第3四分。四分位数间距,是由第三四分位数,和第1四分位数向减而得。(3)方差:也叫均方差,反映一组数据的平均离散水平。(4)标准差:是方差的正平方根,其量纲与原变量值相同(5)变异系数:记为CV,多用于观察指标单位不同时,或均数相差较大时的比较。它实质上是一个相对变异指标,无单位。

三、两者的区别。A、集中趋势的描述:(1)算数均数:适用于对称分布资料;(2)几何均数:适合于作对数变换后对称分布资料;(3)中位数和百分位数:①适用于任何分布的资料;②中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;③中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。不同质的资料应考虑分别计算平均数。B、离散趋势的描述:(1)极差不稳定,不灵敏。(2)标准差的基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、平均地描述了变量值的离散程度。在同质的前提下,标准差大表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;反之,标准差小表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。(3)变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。

2、中位数和标准差的作用。

答:(1)标准差:是方差的正平方根,其量纲与原变量值相同。标准差是统计分析中最常用的变异指标,适用于近似正态分布的资料,大样本、小样本均可用。四份位数间距适用于偏态分布资料,四分位半间距相当于偏态分布资料的“标准差”。(2)中位数:是将n个变量值从小到大排列,位置居中间的那个数。分为奇偶两种情况。中位数适用于任何分布资料,有不确定值的资料。常用于描述偏态分布资料的集中趋势,反映位次居中的观察值的平均水平。在对称分布的资料中,中位数和算术平均数在理论上是相同的。适用于当一组变量值呈偏态分布,或资料的分布情况不清楚,或变量值一端(或两端)无确定数值(开口型资料),均可用中位数表示其集中趋势。

3、正态分布、标准正态分布及对数正态分布的联系和区别。

答:(1)正态分布:原始值不需转换;属于对称分布类型;用μ表示集中趋势的指标;均数与中位数的关系是μ=M(中位数)。(2)标准正态分布:作u转换;属于对称分布类型;集中趋势μ=0;均数与中位数的关系是μ=M。(3)对数正态分布:作对数转换;属于正偏太分布;集中趋势用G(几何均数表示);均数与中位数的关系是μ>M。

第三章总体均数的估计与检验假设

1、举例说明标准差与标准误的区别与联系。

答:标准差是描述个体值变异程度的指标,为方差算术平方根,该变变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,反映了样本均数与总体均数的差异,说明了均数的抽样误差。具体举例略。

2、u分布和t分布有何不同。

答:t分布为抽样分布;u分布为标准正态分布,为理论分布。t 分布比标准正态分布的峰值低,且尾部翘得更高。随自由度的增大,t分布逐渐趋近标准正态分布。

3、均数的可心信区间与参考值范围有何不同。

答:(1)均数的可信区间按预先给定的概率所确定的未知参数的可能范围。用于估计总体的均数。(2)参考值范围是“正常人”的解剖、生理、生化某项指标的波动范围。用于判断观察对象的某项指标正常于否。

4、t检验的应用条件。

答:(1)单样本的t检验要求资料服从正态分布。(2)配对t检验要求差值服从正态分布。(3)两样本的t检验要求两组数据服均从正态分布,切两样本的方差相等,尤其对小样本。5、假设检验的结论不能绝对化。答:通过假设检验作出的检验推断具有概率性,有可能发生两类错误。拒绝H O时犯I型错误,接受H O时间犯II型错误。6、假设检验和区间估计的区别。答:假设检验用于推断质的不同的两个总体或多个总体参数是否不等。可信区间估计是用于说明量的大小,推断总体参数的范围。可信区间可以回答假设检验的问题。在判断两个或多个总体参数是否不相等时,假设检验与区间估计是完全等价的。

第四章多个样本均数比较的方差分析

1、方差分析的基本思想和应用条件。

答:基本思想:是根据实验设计的类型,将全部测量值总的离均差平方和及自由度分解为两个或多个部分,除随机误差作用外。每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过比较不同变异的来源的均方,借助F分布作出统计推断从而推论各种研究因素对实验结果的影响。

应用条件:①各样本是相互独立的随机样本,均服从正态分布。

②相互比较的各样本的总体方差相等。具有方差齐性。

2、随机区组设计与完全随机设计在设计和变异分解上有何不同。答:随机区组设计:随机分配的次数越多,每次随机分配都对同一区组内的受试对象进行,且歌处理组受试对象数量相同,区组内均衡。四种变异处理组间变异、区组间变异、误差变异、总变异。完全随机设计:采用完全随机化分组方法,将全部试验对象分配到g个处理组(水平组),各组接受不同的处理。三种变异组间变异、组内变异、总变异。

第五章计数资料的统计描述

1、举例说明为什么不能以构成比代替率。

答:(1)率=某时期内发生某现象的观察单位数字/同时期可能发生某现象的观察单位总数。用来说明某现象发生的频率或强度。(2)构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位总数。用来说明各构成部分在总体中所占的比重或分布。举例略。

2、应用标准化率进行比较时的注意问题。

答:(1)只适用于两组内部构成不同,并有可能影响两组分组的情况。(2)比较几个标准化率时采用统一标准口。(3)标准化后的标准化率,已不再反映当时当地的实际水平,它只表示相互比较的资料的相对水平。(4)两样本标准化率是样本值,存在抽样误差。3、相对数的动态指标及作用。答:即动态数列的分析指标:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。(1)绝对增长量:某相对数在一定时期的增长的绝对值;(2)发展速度与增长速度:某相对数在一定时期的速度变化;(3)平均发展速度:各环节比发展速度的几何均数。说明某相对数在一个较长时期中平均发展变化的程度。

第六章几种离散型变量的分布及其应用

1、二项分布的应用。

答:(1)每次试验之发生两种互斥可能结果,互斥结果的概率和等于1;(2)每次产生某种结果的概率固定不变;(3)重复试验是独立的。

2、Poisson分布的性质。

答:(1)总体均数λ与总体方差σ2相等;(2)当n很大时候,而π很小时候,πn=λ为常数,Poisson分布是二项分布的极限分布;(3)当λ增大,Poisson分布渐近正态分布。当λ≥20时,做正态分布资料处理。(4)具可加性质。

3、二项分布、Poisson分布和正态分布的联系。

答:(1)当n很大时,而π很小的时,且πn=λ为常数,Poisson 分布是二项分布的极限分布;(2)当n较大,而π不接近0也不接近1时候,二项分布近似正态分布。(3)当λ增大时,Poisson 分布渐进正态分布,一般λ≥20时,做正态分布资料处理。

第七章Χ2检验

1、Χ2检验的用途。

答(1)用于推断个总体率或构成比之间有无差别;(2)推断多个总体或构成比之间有无差别;(3)多个样本率比较的Χ2分割;(4)两个分类变量间有无关联性;(5)频数分布的拟合优度检验。2、两样本率的u检验和Χ2检验有何区别。

答:两样本率进行比较时,若对同一样本资料同时进行u检验和Χ2检验,在不教正的情况下,Χ2=u2;u检验通常用于大样本,Χ2检验用于小样本。3、R*C列联表资料的Χ2检验应注意的事项。答:(1)R*C列联表中的理论频数不能小于1,或1<T<5的格子数不宜超过格子总数的1/5;(2)多个样本率比较,若所的到的统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说任两个总体率有差别,需进一步做多个样本率的比较,做多个样本率的多重比较。(3)对有序的R*C列联表资料不宜用Χ2检验。

4、R*C列联表资料的分类及其检验方法的选择。

答:(1)分类:双向无序、单向无序、双向有序属性相同、双向有序属性不同。(2)检验方法的选择:①双向无序R*C列联表资料。研究多个样本率或构成比的比较,用行*列表的Χ2检验;研究两分类变量间有无关联性以及关系密切程度,可用行*列表的Χ2检验以及Pearson列联表系数进行分析。②单向无序R*C列联表资料。若R*C表中的分组变量是有序的,而指标变量是无序的,用行*列表的Χ2检验分析其构成情况。若R*C表的分组变量是无序的,指标变量是有序的,用秩转换的非参数检验分析。③双向有序属性相同R*C列联表资料。用一致性检验分析两种检测两方法的一致性。④双向有序属性不同R*C列联表资料。若研究目的

为分析两有序分类变量间是否存在相关关系,用宜等级相关分析或Pearson积矩相关分析;若研究目的为分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验;若研究目的为分析不同年龄组患者疗效间有无差别时,可视其为单向有序R*C列联表资料,选用秩转换的非参数检验分析。

第八章秩转换的非参数检验

1、非参数检验,与参数检验的区别。

答:非参数检验对总体分布不作严格的假定,不受总体分布的限制,又称任意分布检验。它直接对总体分布(或分布位置)作假设检验。总体分布为已知的数学形式,对其总体参数作假设检验则为参数检验。

2、秩转换的非参数检验,适用情况。

答:秩转换的非参数检验是先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量。其特点是假设检验的结果对总体的分布形状差别不敏感,只对总体的分布位置差别敏感。适用于:①不满足正态或(和)方差齐性的小样本资料;②分布不知是否正态的小样本资料;③一端或两端是不确切数值的资料;

④等级资料。

3、两组或多组等级资料的比较,为何不用Χ2检验而用秩转换的非参数检验。

答:Χ2检验只能推断两个或多个总体的等级构成比的差别。选用秩转换的非参数检验,可推断两个或多个总体的等级强度差别。

第九章双变量回归与相关

1、何为“最小二乘”原则。

答:在直线回归方程中,将实际测量值与假定回归线上估计值的纵向距离称之为残差,通常情况下取各点残差的平方和的最小直线为所求得的回归直线。即所谓的“最小二乘原则”。

2直线回归分析中的注意问题(即直线回归的应用条件)。

答:(1)两变量的选择一定要有专业背景,直线回归要求至少对于每个X相应的Y要服从正态分布,X可以是服从正态分布的随机变量也可以能精确测量和严格控制的非随机变量。(2)分析前应绘制散点图,检查数据是否满基本假设。(3)对结果应有正确的解释。

3、直线回一归与直线相关的区别与联系。

答:联系:(1)对于既可以做回归分析又可做相关的同一组数据,计算出的b与r的正负号一致;(2)相关系数与回归系数的假设检验等价。对同一样本t b=t r。(3)同一组数据的相关系数和回归系数可以相互换算。(4)用回归解释相关:由于决定系数r2=SS回/SS总,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则r2越接近1,说明相关的效果越好。

区别:(1)资料上:相关要求X、Y服从双变量正态分布,这种资料进行回归称II型回归;回归要求Y在给定某个X值服从正态分布,X是可以精确测量和严格控制的变量,称I型回归。(2)应用上:双变量间相互关系用用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,用以说明Y如何依赖于X而变化。

(3)意义上:说明具有直线关系的两变量间相互关系的方向与密切程度;b表示X每变化一个单位所导致的Y的平均变化量(4)单位:r没单位,b有单位。

(5)取值范围不同

(6)计算公式不同

第十章统计图和统计表

1、统计表的制表原则与要求。

答:原则:(1)重点突出,一张表只表达一个中心内容;(2)统计表描述要完整,有起描述的对象(主语)和内容(宾语),通常主语放在表的左边作横标目,宾语放在右边作纵标目。(3)统计表应简单明了,文字数字、线条尽量从简。要求:(1)标题:概括表的主要内容,包括研究时间、地点、内容等放在在表的正上方。(2)标目:分别用横标目和纵标目说明表的每行和每列数字的意义。注单位。(3)线条:至少要用三线条,表格的顶线和底线将表格与文章的其它部分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。(4)数字:………..

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

健康管理师考试重点归纳总结

第一章健康管理概论 健康管理是以现代健康概念(生理、心理和社会适应能力)和新的医学模式(生理、心理、社会)以及中医治未病为指导,通过采用现代医学和现代管理学的理论、技术、方法和手段,对个体或群体整体健康状况及其影响健康的危险因素进行全面检测、评估、有效干预与连续跟踪服务的医学行为及过程。 其目的是以最小投入获取最大健康效益。 健康管理的八大目标: 1.完善健康和福利 2.减少健康危险因素 3.预防疾病高危人群患病 4.易化疾病的早期诊断 5.增加临床效用、效率 6.避免可预防的疾病相关并发症的发生 7.消除或减少无效或不必要的医疗服务 8.对疾病结局作出度量并提供持续的评估和改进 健康管理的特点: 标准化足量化个体化系统化 健康管理的三个基本步骤: 1.了解和掌握健康,开展健康信息收集和健康检查 2.关心和评价健康,开展健康风险评价和健康评估 3.干预和促进健康,开展健康风险干预和健康促进 健康风险评估是手段,健康干预是关键,健康促进是目的 健康管理的五个服务流程: 1.健康调查与健康体检 2.健康评估 3.个人健康咨询 4.个人健康管理后续服务 5.专项的健康和疾病管理服务 健康管理的六个基本策略: 1.生活方式管理 2.需求管理 3.疾病管理 4.灾难性病伤管理 5.残疾管理 6.综合群体健康管理 生活方式管理的特点: 1.以个体为中心,强调个体的健康责任和作用

2.以预防为主,有效整合三级预防 生活方式的四大干预技术: 教育激励训练营销 影响需求管理的四大主要因素: 1.患病率 2.感知到的需要 3.消费者选择偏好 4.健康因素以外的动机(残疾补贴、请病假的能力等) 需求管理的策略: 1.小时电话就诊和健康咨询 2.转诊服务 3.基于互联网的卫生信息数据库 4.健康课堂 5.服务预约 疾病管理的三个特点: 1.目标人群是患有特定疾病的个体 2.不以单个病例和(或)其单次就诊事件为中心,而关注个体或群体连续性的健康状况与 生活质量 3.医疗卫生服务以及干预措施的综合协调至关重要 灾难性病伤管理的五大特点: 1.转诊及时 2.综合考虑各方面因素,制订出适宜的医疗服务计划 3.具备一支包含多种医学专科及综合业务能力的服务队伍,能够有效应对可能出现的多种 医疗服务需要 4.最大程度地帮助病人进行自我管理 5.尽可能使患者及其家人满意 残疾管理的八大目标: 1.防止残疾恶化 2.注重功能性能力 3.设定实际康复和返工的期望值 4.详细说明限制事项和可行事项 5.评估医学和社会心理学因素 6.与病人和雇主进行有效沟通 7.有需要时要考虑复职情况 8.实行循环管理 《健康中国2030规划纲要》 1.强调预防为主,防患未然

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

医学统计学第三版第四章课后习题答案

2. ANOVA 实验结果 Sum of Squares df Mean Square F Sig. Between Groups 43.194 3 14.398 13.697 .000 Within Groups 37.842 36 1.051 Total 81.036 39 Multiple Comparisons Dependent Variable: 实验结果 Dunnett t (2-sided)a (I) 分组(J) 分组Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound 0.5 对照组-2.15000*.45851 .000 -3.2743 -1.0257 1.0 对照组- 2.27000*.45851 .000 - 3.3943 -1.1457 1.5 对照组-2.66000*.45851 .000 -3.7843 -1.5357 F=13.697 P=0.000004 P A=0.000113 P B=0.000051 P C=0.000004均小于0.001 根据完全随机资料的方差分析,按α=0.05水准,拒绝H0,接受H1,认为四组治疗组小白鼠的肿瘤重量总体均数不全相等,即不同剂量药物注射液的抑癌作用有差别。 3. Tests of Between-Subjects Effects Dependent Variable: 重量 Source Type III Sum of Squares df Mean Square F Sig. Hypothesis 99736.333 1 99736.333 58.489 .005 Error 5115.667 3 1705.222a 治疗 Hypothesis 6503.167 2 3251.583 44.867 .000 Error 434.833 6 72.472b 分组 Hypothesis 5115.667 3 1705.222 23.529 .001 Error 434.833 6 72.472b F:44.867 23.529 P:0.000246 0.001020<0.01 根据随机区组资料的方差分析,按α=0.05水准,拒绝H0,接受H1,三组注射不同剂量雌激素的大白鼠子宫重量总体均数不全相等,即注射不同剂量的雌激素对大白鼠子宫重量有影响 5.

2017年人民大学统计学生物医学统计学考研参考书

2017年人民大学统计学生物医学统计学考研参考书 统计学:生物医学统计学 风险管理与精算学: 《概率论》,李贤平,高等教育出版社 《数理统计基础》,陆璇,清华大学出版社 《概率论与数理统计》,茆诗松、周纪芗,中国统计出版社 《应用回归分析》,何晓群等编,中国人民大学出版社 《统计学》,贾俊平等编,中国人民大学出版社 概率论与数理统计: 《数学分析》上、下册复旦大学数学系陈传璋、金福临等编高等教育出版社《高等代数》北京大学出版社 《概率论》李贤平高等教育出版社 《数理统计基础》陆璇清华大学出版社 《概率论与数理统计》茆诗松、周纪芗中国统计出版社 流行病与卫生统计学: 《流行病学》詹思延人民卫生出版社 《卫生统计学》方积乾、徐勇勇、陈峰编人民卫生出版社 (专业学位)应用统计: 《统计学》第四版贾俊平中国人民大学出版社配套习题 《应用回归分析》何晓群等编中国人民大学出版社 《多元回归分析》何晓群等编中国人民大学出版社 《抽样技术》金勇进等编中国人民大学出版社 《时间序列分析》易丹辉中国人民大学出版社 《概率论与数理统计》第三版刘次华高等教育出版社配套习题 2017年新祥旭考研全程复习计划

一、英语全程规划 基础阶段(3月-6月) 1.学习目标:完成至少1轮的单词背诵,巩固语法基础 2.阶段重点:英语单词、语法 3.复习建议: (1)英语每天抽空背背单词,建议时长0.5-1h;不管是用单词软件还是传统词书,不管是用词根词缀还是死记硬背,最重要的是每天都背。积累到某一天时,你会发现好多文章都看得懂了。 (2)英语基础不牢的童鞋,应该花点时间复习语法。语法知识能帮助你在读文章和翻译时更加流畅、对文章意思把握得更准确。 (3)多看看新闻,关注时事热点。近年来的英语作文和阅读都是涉及到热点话题的。 (4)不建议大家在这个阶段做习题集。 强化阶段(7月-10月) 1.学习目标:熟读并详细分析近10年真题 2.阶段重点:真题真题真题,重点是阅读 3.复习建议: (1)单词记忆每天进行,不间断。 (2)定时做真题阅读,做完后详细分析。 ①利用早上整段的时间做真题(作文可以不写),不要查单词,完全自己做,然后对答案,之后看一下答案分析。 ②每天分析2-3篇,分析包括:第一遍分析正确选项,第二遍分析错误选项的设置,第三遍在原位中找对应的句子,是每个选项对应的句子哟,分析为什么这样出题,第四遍,了解文章的背景,作者的情感。 ③此阶段不建议专门建立单词笔记本,重要的单词在分析时顺便查一下就好。 ④时间比较充足的童鞋可以全文翻译阅读原文。 (3)完成阅读后,用同样的方法完型、翻译和新题型。完型和新题型这两类题型不用全文

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

医学统计学重点图表总结

描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99

医学统计学考试重点

医学统计学考试重点 The latest revision on November 22, 2020

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)

医学统计学期末重点总结

误差:观测值与真实值、样本计量与总体参数之间的差别。 相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。 相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。 统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。 统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 同质:指根据研究目的所确定的观察单位其性质应大致相同。 变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。 定量数据:也称计量资料。变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。 有序数据:也称半定量数据或等级资料。变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。 总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。 参数:描述总体特征的指标称为参数。 统计量:描述样本特征的指标称为统计量。 概率:描述某事件发生可能性大小的度量。 小概率事件:习惯上将P≤0.05的事件称为小概率事件。 平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。 率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。 构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。 线性相关的概念:研究两个变量之间是否具有直线相关关系。 相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。 研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。 处理因素:根据研究目而欲施研究对象的干预措施。 处理水平:处理因素在实验中所处的状态称为因素的水平(level),亦称处理水平。 对照:指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。随机化:是指每个受试对象有相同的概率或机会被分配到不同的处理组。 重复:是指在相同实验条件下重复进行多次观察。 统计学的基本内容:统计设计,数据整理,统计描述,统计判断 数据类型:定量数据,定性数据,有序数据 误差的类型:系统误差,随机测量误差,抽样误差 配对样本t检验配对设计:同源配对,异源配对,自身配对 方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。 非参数检验的适用范围:①总体分布类型未知或非正态分布数据;②有序或半定量资料;③数据两端无确定的数值。 标准差与标准误的区别与联系:区别:标准差:意义,描述个体观察值变异程度的大小,标准差越小,均数对一组观察值的代表性越好。应用,与X拔结合,用以描述个体观察值的

医学统计学考试重点

医学统计学考试重点Prepared on 21 November 2021

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 不 真实情况拒绝H 拒绝H 正确Ⅰ型错误(ɑ) 推 H 断正确(1ɑ) 不正确推断正确(1β) Ⅱ型 H 错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H Ⅱ型错误(β错误): H 为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S =S/√n x ㈡样本率 率的抽样误差:样本率p和总体率π的差异

【孙振球第四版】医学统计学复习题

一、名词解释: 1、总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。 2、有限总体:是指空间、时间范围限制的总体。 3、无限总体:是指没有空间、时间限制的总体。 4、样本:从总体中随机抽取部分观察单位,其实测值的集合。 5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。 6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。 8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。 9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。 10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本

统计量之间的差异。 11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I型错误。检验水平,就是预先规定的允许犯I 型错误概率的最大值。I型错误概率大小也用α表示,α可取单尾亦可取双尾。 12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。 13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。 14、率:强度相对数,说明某现象发生的频率或强度。 15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。 16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。 17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。 18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。 19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。 20、相关系数:又称Pearson积差相

医学统计学重点总结

<<医学统计学>>重点总结 1. 总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。 2. 样本:按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。 3. 同质:影响研究指标的主要因素易控制的因素基本上相同。 4. 抽样误差:在抽样研究中,由于变异的存在,即使在同一总体中抽取的几个样本,各样本统计量往往不等。样本统计量与总体参数也不等,这种由于抽样研究所至样本之间和样本与总体之间的差异称为。。。 5. 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。 6. 截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/ 终止(研究时限已到而终止观察)。 7. 卡方基本思想:X2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。X2反应实现了实际频数与理论频数的吻合程度。如果检验假设成立,则A-T 一般不大,X2应很小,即出现大X2值概率很小。即X2越大,P越小,若P≤a时,就怀疑假设的成立,拒绝H0。若P>a则没有理由拒绝H0。 8. X2用途: (1)实际频数与拟合频数拟合优度:A推断两个或两个以上总体率或构成比有无差别(四格表/行x 列表)。B两变量之间有无相互关系。C频数分布的拟合优度检验(判断次样本是否来自某种分布)。(2)某些分布可用X2近似。 (3)间接应用:如t分布和F分布就是在X2分布基础上推导出来的。 9. 方差分析的基本思想:根据研究目的和设计类型,把总体变异中离均差平方和分解成两部分或更多部分,也把总变异中的自由度相应分成两部分或更多部分,然后再进行比较,评价由某种因素引起的变异是否具有统计学意义。 10. 假设检验中P,a,b(倍他)的关系及统计学意义: a:检验水准,即显著性检验,在此概率之下的认为是小概率事件,统计学上以为此事件“不可能发生”,以此判断是否不拒绝H0无效假设,在假设检验中,按a检验水准,拒绝了原来正确的H0,即犯了第1类错误,犯此错误的概率为a。 b:在T假设检验中,按照a检验标准,没有拒绝原来错误的无效假设,即犯了第2类错误,犯次错误的概率是b。 P:是在H0成立时大于等于用样本计算的统计值出现的概率用P值与检验水准a比较,根据比较的结果作出统计判断。如果P≤a时,就怀疑假设的成立,拒绝H0。若P>a则接受H0拒绝H1。P值越小只能说明作出拒绝H0,接受H1的推论时犯错误的机会越小。 11.行x列表X2检验应注意: (1)行x列表中不宜有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1,若发生上述情况可采用:A将理论频数过小的格子所在的行或列与性质相近的邻近行或列中的实际频数合并,使重新计算的理论频数增大。B删去理论频数过小的行或列。C增大样本含量以增大理论频数。 (2)当效应按强弱分为若干级别,则按实验结果可整理为单向有序行x列表,在比较各处理组的效应有无差别时,宜用秩和检验,ridit分析等。如作X2检验只说明各组构成比的差异有无统计学意义。

华中科技大学医学统计学试题

医学统计学试题(A )卷(闭卷) 学号:姓名: 一、A型题:请从备选答案中选出1个最佳答案并填在后面的括号里(每小题1分,共30分)。 1.流行病学研究内容的三个层次是指() A.疾病、伤害和健康 B.传染病、寄生虫病和地方病 C.传染性疾病、非传染病疾病和意外伤害 D.疾病分布、危险因素和预防控制措施 E.人群分布、时间分布和地区分布 2.提出由于维生素C缺乏引起身体虚弱的坏血病病因假说并开创了流行病学临床试验先河的医生是:() A.希波克拉底(Hippocrates) B.詹姆士·林德(James Lind) C.约翰斯诺(John Snow) D.路易斯(PCA Louis) E.葛郎特(John Graunt) 3.流行病学研究方法的核心思想是() A.预防为主的思想 B.研究对象为人群 C.对比思想 D.社会医学观念 E.生态学思想 4.流行病学任务的三个阶段是() A.观察性研究、实验性研究和理论性研究 B.揭示现象、找出原因和提供措施 C.描述分布、提出假设和验证假设 D.整理资料、分析资料和得出结论 E.早期发现、早期诊断和早期恰当治疗 5.关于率和比的描述,下列哪项是不正确的() A.大多数率是构成比,分子是分母的一部分 B.比表示分子和分母的数量关系,而不考虑分子和分母所来自的总体如何C.比的分子是分母的一部分 D.率也是比,但比不一定是率 E.率是用来描述变量随时间变化的动态指标 6.某单位发生一起食物中毒,为尽快查明原因,调查中应该使用的主要指标是() A.发病率 B.患病率C.罹患率D.病死率E.期间患病率 7.关于发病率的描述,下列哪项是不正确的() A.发病率可用来描述疾病的分布 B.发病率的变化意味着并因因素的变化 C.发病率的高低取决于疾病报告、登记制度以及诊断的正确 D.发病率的准确性取决于疾病报告、登记制度以及诊断的正确

相关文档
相关文档 最新文档