当前位置：文档库 › 医学统计学孙振球(第三版)SAS程序及结果

医学统计学孙振球(第三版)SAS程序及结果

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

6. 男性吸烟率是女性的10倍，该指标为（ A ）（A）相对比（B）构成比（C）定基比（D）率 7、统计推断的内容为（ D ） A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验，其目的是检验（ C ） A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本，样本含量分别为n1和n2，在进行成组设计资料的t 检验时，自由度是（ D ）（A） n1+ n2 （B） n1+ n2 –1 （C） n1+ n2 +1 （D） n1+ n2 -2 10、标准误反映（ A ） A 抽样误差的大小 B总体参数的波动大小

【孙振球第三版】医学统计学复习题

一、名词解释： 1、总体：根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。 2、有限总体：是指空间、时间范围限制的总体。 3、无限总体：是指没有空间、时间限制的总体。 4、样本：从总体中随机抽取部分观察单位，其实测值的集合。 5、计量资料：又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小，而获得的资料。其变量值是定量的，表现为数值大小，一般有度量衡单位。根据其观测值取值是否连续，又可分为连续型或离散型两类。 6、计数资料：又称定性资料或者无序分类变量资料，亦称名义变量资料，是将观察单位按照某种属性或类别分组计数，分组汇总各组观察单位数后得到的资料。其变量值是定性的，表现为互不相容的性或类别。分两种情形：（1）二分类：两类间相互对立，互不相容。（2）多分类：各类间互不相容。 7、等级资料：又称半定量资料或有序分类变量资料，是将观察单位按某种属性的不同程度分成等级后分组计数，分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质，表现为等级大小或属性程度。 8、随机误差（偶然误差）：是一类不恒定的、随机变化的误差，由多种尚无法控制的因素引起，观察值不按方向性和系统性变化，在大量重复测量中，它可呈现或大或小，或正或负的规律性变化。 9、平均数：描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。 10、抽样误差：由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异，以及统一总体若干样本统计量之间的差异。 11、I型错误：拒绝了实际上成立的H0，这类“弃真”错误称为I 型错误。检验水平，就是预先规定的允许犯I型错误概率的最大值。I型错误概率大小也用α表示，α可取单尾亦可取双尾。12、II型错误：“接受”了实际上不成立的H0，这类“取伪”的错误称为II型错误。其概率大小用β表示，β只取单尾，β值的大小一般未知，，须在知道两总体差值δ、α及n时，才能算出。13、相对数：两个有联系的指标之比，是分类变量常用的描述性统计指标，常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。 14、率：强度相对数，说明某现象发生的频率或强度。 15、构成比：结构相对数字，表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。 16、相对比：简称比，是两个相关联指标之比，说明两指标间的比例关系。两指标可以性质相同，也可以性质不同，通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。 17、标准化：采用某影响因素的统一标准构成以消除内部构成不同对总率的影响，使通过标化后的标准率具有可比性。 18、动态数列：是一系列按时间顺序排列起来的统计指标，用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。 19、非参数检验：相对于参数检验而言，不依赖于总体分布类型，也不对总体参数进行统计推断的假设检验方法，称为参数检验。 20、相关系数：又称Pearson积差相关系数，以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位，其值为-1≤r≤1。相关系数的检验假设常用t检验。 21、回归系数：即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。 22、随机划原则：是指在实验分组时，每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。 23、分类变量资料：计数资料，又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数，分组汇总各组观察单位数后得到的资料。其变量值是定性的，表现为互不相容的性或类别。分两种情形：（1）二分类：两类间相互对立，互不相容。（2）多分类：各类间互不相容。 24、无序分类变量资料：计数资料，又称定性资料。是将观察单位按照某种属性或类别分组计数，分组汇总各组观察单位数后得到的资料。其变量值是定性的，表现为互不相容的性或类别。分两种情形：（1）二分类：两类间相互对立，互不相容。（2）多分类：各类间互不相容。 25、期望寿命：指同时出生的一代人活满x岁以后尚能生存的年数（即岁数）。 26、检验效能：表达式为1-β，以往称把握度。其意义为当两总体确有差异，按规定检验水准所能发现该差异的能力。 27、观察单位：亦称个体，是统计研究中的基本单位。它可以是一个人、一只动物，也可以是特指的一群人；可以是一个器官，甚至一个细胞。 28、样本含量：样本中包含观察单位数称为该样本的样本含量。 29、变量：确定总体之后，研究者应对每个观察单位的某项特征进行观察或测量，这种特征能表现观察单位的变异性，成为变量。 30、变量值：对变量的观测值称为变量值或观察值。 31、误差：泛指实测值与真实值之差，按产生原因和性质可粗分为（1）随机误差；（2）非随机误差①系统误差②非系统误差。32、系统误差：实验过程中产生的误差，它的值或恒不变，或遵循一定的变化规律，其产生的原因往往是可知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源，力求通过周密的研究设计和严格的技术措施施加以消除或控制。 33、非系统误差：在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除，否则将影响研究结果的准确性。 34、频率：一个随机试验有几种可能，在结果重复进行试验时，个别结果看来是偶然发生，但当重复试验次数相当大时，总有规律出现。在重复多次后，出现结果的比例称之为频率。

医学统计学试题及答案

医学统计学试题及答案集团文件发布号：（9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案习??题《医学统计学》第二版??（五年制临床医学等本科生用）（一）??单项选择题 1．观察单位为研究中的( d??)。 A．样本? ?? ??B. 全部对象 C．影响因素? ?? ?????D. 个体2．总体是由（ c ）。 A．个体组成? ?? ?B. 研究对象组成 C．同质个体组成? ?? ? D. 研究指标组成 3．抽样的目的是（b??）。 A．研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C．研究典型案例研究误差? ???D. 研究总体统计量 4．参数是指（b? ?）。 A．参与个体数? ???B. 总体的统计指标 C．样本的统计指标? ? ??D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（ a ）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A.均数不变，标准差改变? ?? ? B.均数改变，标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用（ a??）。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中（? ?d）可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用（? ?c）描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后，（? ?b）不变。 A．算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.（ a??）分布的资料，均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种（ c ）分布。

(完整版)医学统计学第六版课后答案

第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果，需要对其进行统计描述和统计推断，统计描述可以使数据更容易理解，统计推断则可以使用概率的方式给出结论，两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律，使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率，并使结果更加准确和可靠，数据整理主要是对数据进行归类，检查数据质量，以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征，统计推断指由样本数据的特征推断总体特征的方法，包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图，统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标，由样本数据计算得到，参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生，随机测量误差是生物体的自然变异和各种不可预知因素产生的误差，抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

《医学统计学》考试试题及答案(三)

《医学统计学》考试试题及答案（一）单项选择题 3．抽样的目的是（b ）。 A．研究样本统计量 B. 由样本统计量推断总体参数 C．研究典型案例研究误差 D. 研究总体统计量 4．参数是指（b ）。 A．参与个体数 B. 总体的统计指标 C．样本的统计指标 D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（ a ）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A.均数不变，标准差改变 B.均数改变，标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用（ a ）。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中（d）可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用（c）描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后，（b）不变。 A．算术均数 B.标准差 C.几何均数 D.中位数 11.（ a ）分布的资料，均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种（ c ）分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料，可用（ c ）描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.（ c ）小，表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是（ c ）。 A. 算术平均数 B.中位数

医学统计学试题及答案

《医学统计学》课程考试试题（A卷）（评卷总分：100分，考试时间：120分钟，考核方式：□开卷 V 闭卷）一、选择题（每题1分，共62分，只选一个正确答案） 1、医学科研设计包括（ D ） A．物力和财力设计 B．数据与方法设计 C．理论和资料设计 D．专业与统计设计 2、医学统计资料的分析包括（ D ） A．数据分析与结果分析 B．资料分析与统计分析 C．变量分析与变量值分析 D．统计描述与统计推断 3、医学资料的同质性指的是（ D ） A．个体之间没有差异 B．对比组间没有差异 C．变量值之间没有差异 D．研究事物存在的共性 4、离散型定量变量的测量值指的是（ D ） A．可取某区间内的任何值 B、可取某区间内的个别值 C．测量值只取小数的情况 D．测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是（ A ） A．无序二分类变量 B、定量变量． C．等级变量 D．无序多分类变量 6、计量资料编制频数表时，组距的选择（ D ） A．越大越好 B．越小越好 C．与变量值的个数无关 D．与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选（ D ）A．极差 B．方差 C．标准差 D．变异系数 8、若要用方差描述一组资料的离散趋势，对资料的要求是（ D ）A．未知分布类型的资料 B．等级资料 C．呈倍数关系的资料 D．正态分布资料 9、频数分布两端没有超限值时，描述其集中趋势的指标也可用（ D ） A．标准差 B．几何均数 C．相关系数 D．中位数 10、医学统计工作的步骤是（ A ） A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析，统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法，其正确的是（ A ） A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间（小时）分别为3, 4，5，3，2，5.5，2.5，6，6.5, 7,其中位数是（ B ） A．4 B．4.5 C．3 D．2 13、调查一组正常成年女性的血红蛋白，如果资料属于正态分布，描

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布，（1）可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验；（2）采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐，（1）采用Satterthwate 的t’检验；（2）采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布，采用配对t检验。 1.2.2 两组差值不服从正态分布，采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布，且各组方差齐性，直接采用完全随机的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey 法，Scheffe法，SNK法等。 1.3.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Kruscal－Wallis法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布，且各组方差齐性，直接采用随机区组的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey 法，Scheffe法，SNK法等。 1.4.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用符号配对的Wilcoxon检验。 ****需要注意的问题：（1）一般来说，如果是大样本，比如各组例数大于50，可以不作正态性检验，直接采用t 检验或方差分析。因为统计学上有中心极限定理，假定大样本是服从正态分布的。（2）当进行多组比较时，最容易犯的错误是仅比较其中的两组，而不顾其他组，这样作容易增大犯假阳性错误的概率。正确的做法应该是，先作总的各组间的比较，如果总的来说差别有统计学意义，然后才能作其中任意两组的比较，这些两两比较有特定的统计方法，如上面提到的LSD检验，Bonferroni法，tukey法，Scheffe法，SNK法等。**绝不能对其中的两

医学统计学课后习题答案

医学统计学第一章绪论答案名词解释：（1）同质与变异：同质指被研究指标的影响因素相同，变异指在同质的基础上各观察单位（或个体）之间的差异。（2）总体和样本：总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。（3）参数和统计量：根据总体个体值统计算出来的描述总体的特征量，称为总体参数，根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。（4）抽样误差：由抽样造成的样本统计量和总体参数的差别称为抽样误差。（5）概率：是描述随机事件发生的可能性大小的数值，用p 表示（6）计量资料：由一群个体的变量值构成的资料称为计量资料。（7）计数资料：由一群个体按定性因数或类别清点每类有多少个个体，称为计数资料。。（8）等级资料：由一群个体按等级因数的级别清点每类有多少个体，称为等级资料。是非题： 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题： 1. C 2. E 3. D 4. C 5. D 6. B 第二章计量资料统计描述及正态分布答案名词解释： 1. 平均数是描述数据分布集中趋势（中心位置）和平均水平的指标 2. 标准差是描述数据分布离散程度（或变量变化的变异程度）的指标 3. 标准正态分布以μ服从均数为0、标准差为1的正态分布，这种正态分布称为标准状态分布。 4. 参考值范围参考值范围也称正常值范围，医学上常把把绝大多数的某指标范围称为指标的正常值范围。填空题： 1. 计量，计数，等级 2. 设计，收集资料，分析资料，整理资料。 3. σ μχ-=u （变量变换）标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体，具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值，描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比，其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布，其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A ．比较不同计量指标的变异程度 2. 对于近似正态分布的资料，描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4．应用百分位数法估计参考值范围的条件是B ．数据服从偏态分布 5．已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布，描述其个体差异的统计指标应使用 E ．四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109 /L ～9.1×109 /L ，其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差，应该使用的方法是 E.增加样本含量 5．两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料

医学统计学第3版,02计量资料的统计描述试题

第二章计量资料的统计描述一、教学大纲要求（一）掌握内容 1. 频数分布表与频数分布图（1）频数表的编制。（2）频数分布的类型。（3）频数分布表的用途。 2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。算术均数、几何均数、中位数。 3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。极差、四分位数间距、方差、标准差、变异系数。（二）熟悉内容连续型变量的频数分布图：等距分组、不等距分组。二、教学内容精要计量资料又称为测量资料，它是测量每个观察单位某项指标值的大小所得的资料，一般均有计量单位。常用描述定量资料分布规律的统计方法有两种：一类是用统计图表，主要是频数分布表（图）；另一类是选用适当的统计指标。（一）频数分布表的编制频数表（frequency table ）用来表示一批数据各观察值或在不同取值区间的出现的频繁程度（频数）。对于离散数据，每一个观察值即对应一个频数，如某医院某年度一日内死亡0，1，2，…20个病人的天数。如描述某学校学生性别分布情况，男、女生的人数即为各自的频数。对于散布区间很大的离散数据和连续型数据，数据散布区间由若干组段组成，每个组段对应一个频数。制作连续型数据频数表一般步骤如下： 1.求数据的极差（range ）。 min max X X R -= （2-1） 2.根据极差选定适当“组段”数（通常8—10个）。确定组段和组距。每个组段都有下限L 和上限U ，数据χ归组统一定为L ≤χ

医学统计学试题及答案

医学统计学一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制（ B ） A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式Ｂ负偏态分布Ｃ正偏态分布Ｄ正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮，其统计方法是（A ） A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用（A ） A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是（ A ） A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍，该指标为（A ）（A）相对比（B）构成比（C）定基比（D）率 7、统计推断的内容为（ D ） A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验，其目的是检验（ C ） A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本，样本含量分别为n1和n2，在进行成组设计资料的t检验时，自由度是（ D ）（A）n1+ n2 （B）n1+ n2 –1 （C）n1+ n2 +1 （D）n1+ n2 -2 10、标准误反映（A ） A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) Ａ垂直距离的平方和最小Ｂ垂直距离最小Ｃ纵向距离的平方和最小Ｄ纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr，对回归系数检验的t值为tb，二者之间具有什么关系（C） A tr>tb B tr

医学统计学试题及答案

第一套试卷及参考答案一、选择题（40分） 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制（B ） A 条图 B 百分条图或圆图 C 线图 D 直方图 2、均数和标准差可全面描述D 资料的特征 A 所有分布形式Ｂ负偏态分布Ｃ正偏态分布Ｄ正态分布和近似正态分布 3、要评价某市一名5 岁男孩的身高是否偏高或偏矮，其统计方法是（A ） A 用该市五岁男孩的身高的95% 或99% 正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99% 的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用（A ） A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是（A ） A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6.男性吸烟率是女性的10倍，该指标为（A ）（A）相对比（B）构成比（C）定基比（D）率 7、统计推断的内容为（D ） A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A 和B 均不是 D. A 和B 均是 8、两样本均数比较用t 检验，其目的是检验（C ） A 两样本均数是否不同 B 两总体均数是否不同 C 两个总体均数是否相同 D 两个样本均数是否相同 9、有两个独立随机的样本，样本含量分别为n1和n2，在进行成组设计资料的t检验时，自由度是（D ）（A）n1+ n2 （B）n1+ n2 –1 （C）n1+ n2 +1 （D）n1+ n2 -2 10、标准误反映（A ） A 抽样误差的大小 B 总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的（C）Ａ垂直距离的平方和最小Ｂ垂直距离最小Ｃ纵向距离的平方和最小Ｄ纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r，对回归系数检验的t 值为t b，二者之间具有什么关系？（C） A t r>t b B t rχ20.05,ν可认为（A ） A 各总体率不同或不全相同 B 各总体率均不相同 C 各样本率均不相同 D 各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原，其中甲年级调查35人，阳性人数4人；乙年级调查40人，阳性人数8 人。该资料宜选用的统计方法为（A ） A．四格表检验B. 四格表校正检验C t 检验D U 检验 16、为调查我国城市女婴出生体重：北方n1=5385，均数为3.08kg，标准差为0.53kg；南方n2=4896，均数为3.10kg，标准差为0.34kg，经统计学检验，p=0.0034<0.01，这意味着（D ） A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学第三版第四章课后习题答案

2. ANOVA 实验结果 Sum of Squares df Mean Square F Sig. Between Groups 43.194 3 14.398 13.697 .000 Within Groups 37.842 36 1.051 Total 81.036 39 Multiple Comparisons Dependent Variable: 实验结果 Dunnett t (2-sided)a (I) 分组(J) 分组Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound 0.5 对照组-2.15000*.45851 .000 -3.2743 -1.0257 1.0 对照组- 2.27000*.45851 .000 - 3.3943 -1.1457 1.5 对照组-2.66000*.45851 .000 -3.7843 -1.5357 F=13.697 P=0.000004 P A=0.000113 P B=0.000051 P C=0.000004均小于0.001 根据完全随机资料的方差分析，按α=0.05水准，拒绝H0，接受H1，认为四组治疗组小白鼠的肿瘤重量总体均数不全相等，即不同剂量药物注射液的抑癌作用有差别。 3. Tests of Between-Subjects Effects Dependent Variable: 重量 Source Type III Sum of Squares df Mean Square F Sig. Hypothesis 99736.333 1 99736.333 58.489 .005 Error 5115.667 3 1705.222a 治疗 Hypothesis 6503.167 2 3251.583 44.867 .000 Error 434.833 6 72.472b 分组 Hypothesis 5115.667 3 1705.222 23.529 .001 Error 434.833 6 72.472b F：44.867 23.529 P：0.000246 0.001020<0.01 根据随机区组资料的方差分析，按α=0.05水准，拒绝H0，接受H1，三组注射不同剂量雌激素的大白鼠子宫重量总体均数不全相等，即注射不同剂量的雌激素对大白鼠子宫重量有影响 5.

【孙振球第三版】医学统计学复习题

1、总体：根据研究目的确定的同质观察单位的全体。 2、有限总体：是指空间、时间范围限制的总体。 4、样本：从总体中随机抽取部分观察单位，其实测值的集合。 5、计量资料：描述指标，对每个观察单位用定量的方法测量某项指标量的大小所得的资料，有计量单位。 6、计数资料：相对数，将观察单位按性质或类别分类，然后清点各组观察单位的个数所得资料。 7、等级资料：又称半定量资料或有序分类变量资料，是将观察单位按某种属性的不同程度分成等级后分组计数，分类汇总各组观察单位数后而得到的资料。 8、随机误差（偶然误差）：是一类不恒定的、随机变化的误差，由多种尚无法控制的因素引起，观察值不按方向性和系统性变化，在大量重复测量中，它可呈现或大或小，或正或负的规律性变化。 9、平均数：描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。 10、抽样误差：由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异，以及统一总体若干样本统计量之间的差异。 11、I型错误：拒绝了实际上成立的H0，这类“弃真”错误称为I型错误。检验水平，就是预先规定的允许犯I 型错误概率的最大值。I型错误概率大小也用α表示，α可取单尾亦可取双尾。 12、II型错误：“接受”了实际上不成立的H0，这类“取伪”的错误称为II型错误。其概率大小用β表示，β只取单尾，β值的大小一般未知，须在知道两总体差值δ、α及n时，才能算出。 13、相对数：两个有联系的指标之比，是分类变量常用的描述性统计指标，常用两个分类的绝对数之比表示相对数的大小。如率、构成比、比等。 14、率：强度相对数，说明某现象发生的频率或强度。 15、构成比：结构相对数字，表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。 16、相对比：简称比，是两个相关联指标之比，说明两指标间的比例关系。两指标可以性质相同，也可以性质不同，通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。 17、标准化：采用某影响因素的统一标准构成以消除内部构成不同对总率的影响，使通过标化后的标准率具有可比性。18、动态数列：是一系列按时间顺序排列起来的统计指标，用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。 19、非参数检验：相对于参数检验而言，不依赖于总体分布类型，也不对总体参数进行统计推断的假设检验方法。20、相关系数：又称Pearson积差相关系数，以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位，其值为-1≤r≤1。相关系数的检验假设常用t检验。 21、回归系数：即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。 22、随机划原则：是指在实验分组时，每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。 26、检验效能：表达式为1-β，以往称把握度。其意义为当两总体确有差异，按规定检验水准所能发现该差异的能力。27、观察单位：亦称个体，是统计研究中的基本单位。它可以是一个人、一只动物，也可以是特指的一群人；可以是一个器官，甚至一个细胞。 29、变量：确定总体之后，研究者应对每个观察单位的某项特征进行观察或测量，这种特征能表现观察单位的变异性，成为变量。 30、变量值：对变量的观测值称为变量值或观察值。 31、误差：泛指实测值与真实值之差，按产生原因和性质可粗分为（1）随机误差；（2）非随机误差①系统误差 ②非系统误差。 32、系统误差：实验过程中产生的误差，它的值或恒不变，或遵循一定的变化规律，其产生的原因往往是可知的或可能掌握的。 33、非系统误差：在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除，否则将影响研究结果的准确性。 34、频率：一个随机试验有几种可能，在结果重复进行试验时，个别结果看来是偶然发生，但当重复试验次数相当大时，总有规律出现。在重复多次后，出现结果的比例称之为频率。 35、概率：概率是描述随机事件发生可能性大小的一个度量。36、医学参考值：是直指包括绝大多数正常人的人体形态、功能和代谢产物等个各种生理指标常数，也称正常值。由于存在个体差异，生物医学数据并非常数而是在一定范围内波动，故医学参考值范围作为判定正常和异常的参考标准。 37、正态分布：正态分布又称高斯分布，是一种很重要的连续型分布，应用很广。若指标X的频率分布曲线对应于数学上的正态分布曲线，则称该指标服从正态分布。 38、偏态分布：指集中位置偏向一侧，频数分布不对称。（1）正偏态分布：集中位置偏向数值小的一侧。（2）负偏态分布：集中位置偏向数值大的一侧。 39抽样：这种从总体种随机抽取部分观察单位的过程称为抽样。为保证样本的代表性，抽样时必须遵循随机化原则。参数：参数（ｐａｒａｍａｔｅｒ）是指总体的统计指标，如总体均数、总体率等。总体参数：是固定的常数。多数情况下，总体参数是不易知道的，但可通过随机抽样抽取有代表性的样本，用算得的样本统计量估计未知的总体参数。统计量：统计量（ｓｔａｔｉｓｔｉｃ）是指样本的统计指标，如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。参数统计样本所来自的总体分布具有某个已知的函数形式，而其中有的参数是未知的，统计分析的目的就是对这些未知的参数进行估计或检验。此类方法称为参数统计。非参数统计样本所来自的总体分布难以用某种函数式来表达，还有一些资料的总体分布的函数式是未知的，只知道总体分布是连续型的或离散型的，解决这类问题的一种不依赖总体分布的具体形式的统计方法。线性相关系数：表示两个变数线性相关方向及程度的统计数或参数。又叫直线相关系数,简称相关系数。,|R|的极值为1,|R|越大(接近1),则直线关系越好。完全随机设计（completely random design）：又称单因素（one-way）设计。它是将受试对象按随机化的方法分配到各个处理组中，观察实验效应，临床试验中的随机对照试验也属于此类设计。配对设计（paired design）：是将受试对象按一定条件匹配成对，再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 1、医学统计工作的基本步骤：设计、搜集资料、整理资料、分析资料。 2、医学统计资料的主要来源的四个方面：统计报表、经常性工作记录、专题调查、统计年鉴和数据库专集。 3、正态分布的规律的应用：估计频数分布情况、质量控制、统计处理方法的理论基础、估计医学参考值范围。 4、计量资料统计描述的方法：频数分布表、频数分布图、统计指标。 5、CV（变异系数）：常用于度衡量单位不同和均数相悬殊的多组资料变异度的比较。 1．标准正态分布是一种特殊的正态分布，标准正态分布的υ= 0，σ2= 1 ，通常用u（或Z）表示服从标准正态分布的变量，记为υ～N（0，12）。 6、统计推断是从总体中随机抽样本，由样本信息推断总体特征的过程，包括参数估计和假设检验两方面内容。参数估计包括点估计和区间估计。 7、可信区见估计的优劣取决于两要素：（1）可信度1-α （准确度），即区间包含总体均数μ的理论概率大小，可信度愈接近1愈好。（2）区间宽度β（精密度），即区间的长度，区间愈窄愈好。 8、变量变换的方法有：对数变换、平方跟变换、倒数变换、平方根反正弦变换。 9、分类资料统计描述，常用的相对数：率、构成比、相对比。 10、动态数列常用指标有：绝对增长量、发展速度与增长速度、平均发展速度、平均增长速度。 11、二项式分布的参数是n和π。n,每次独立重复实验数目；π，每次实验的“阳性”概率。 12、二项式分布在n很大，而π很小，且nπ=λ为常数时，二项式分布近似Poisson分布。 13、总体均数λ与总体方差σ2相等是Poisson分布的重要特征。14、Poisson分布具备可加性。 15、当λ（总体率）增大时，Poisson分布渐近正态分布。 16、四格表中四格子基本数值为两对实测的实际频数和理论频数。17、R*C表的卡方检验，若表格中有一个方向按多个等级分类时，则称之为单向有序行列表，当等级数大于3时，如检验各处理组各等级下的构成比有无差别时采用Χ2检验，如检验各处理组各等级下的程度上有无差别时采用非参数检验。 18、配对比较秩和检验，以正秩或负秩的和（T）为检验统计量，其中T越小则P的值小于相应的检验水平。 19、正态分布的两个参数μ和σ2，前者决定分布的位置，后者决定分布的形态（形状、变异度）。 20、四格表Χ2的校正条件为n≥40而且1＜T＜5。 21、R*C表资料Χ2检验，如果有T＜1，应该采取的措施有：（1）增加样本含量，使理论频数增大；（2）根据专业知识考虑能否删除理论频数太小的行或列，能否将理论频数太小的行或列与性质相近的行或列合并。（3）改用双向无序R*C表资料的Fisher确切概率法。 22、Poisson分布中，总体的方差与均数的关系是λ=σ2，当均数较大时，Poisson分布趋近于正态分布。 23、要分析某个资料是否属于二项分布，可用频数分布的拟合优度的Χ2检验。 24、r是相关系数，表示具有直线关系的两变量间相关密切程度和相关方向。 25、变异系数的应用条件是均数相差较大、观察指标单位不同。26、Χ2表示理论频数与实际频数的符合程度。 27、常用相对数的指标有强度相对数字（率）、结构相对数（构成比）、相对比（比）。 28、常用的描述构成比的统计图有圆图和百分比条图。 29、方差分析的应用条件为相互独立的随机样本、来自正态总体、方差齐性。 30、实验设计的基本原则随即机原则、对照原则、重复原则。31、常用的几种统计图有直条图、圆图和百分比条图、线图、直方图、统计地图、其它特殊分析图。 32、写出四种变量变换的方法：倒数变换、平方根变换、平方反正弦变换、对数变换。 33、在F检验中如有各比较组方差不齐时应用变量变换、近似t检验、W ilcoxon秩和检验的方法。 34、四格表资料Χ2适用条件：（1）n≥40且T≥5时用 Χ2检验的基本公式，当P≈α时，改用四格资料表的 Fisher的确切概率法；（2）n≥40且1＜T＜5时用，用四格资料表Χ2检验的校正公式，或改用四格资料表的 Fisher的确切概率法；（3）n＜40，或T＜1时，改用四格资料表的Fisher的确切概率法。 35、当总体率λ很小时，当n很大时，二项分布可用泊松分布来近似。36、率的标准化的计算方法有直接标准化方法和间接标准化方法。 37、Χ2检验的用途：（1）推断两个总体率或构成比之间有无差别；（2）多个总体率或构成比之间有无差别；（3）两分类变量间有无关联性；（4）多个样本间的多重比较；（5）频数分布拟合优度的Χ2检验。 38、拟合优度检验常用判定实际分布是否符合正态分布、二项分布、Poisson分布和负二项分布。 39、实验设计的三个基本要素为：实验单位、处理因素、实验效应。40、变异系数常用于观察单位指标不同和均数相差较大的多组资料变异度的比较。 41、所有检验统计量是在H0的条件下计算出来的。 42、标准化的目的是为了消除构成比不同对合计率的影响，使比较组间具有可比性。 43、统计推断包括：参数估计（区间估计、点值估计）、假设检验。44、医学参考值的制定方法包括：正态分布法、百分位数法。 45、Poisson分布的性质：(1)可加性、(2)总体均数λ与总体方差α2相等、(3)当n很大而π很小且nπ=λ时二项分