当前位置：文档库 › 临床医生统计学助手

临床医生统计学助手

转]医学统计学傻瓜教程---带图示

作为一名临床医师，有时为了完成一些小科研，或晋升职称，都必须撰写医学论文。大多数人会碰到一个难题，医学论文的数据都必须进行统计学处理，上大学时学过的《医学统计学》早已忘得差不多了，重新翻开统计学书本，花上十天半个月的时间，还是看得不知所云。《医学统计学傻瓜教程》有别于其他任何的统计学教程，其特点是略去一些高深难懂的统计学原理及计算公式，直奔解决实际问题的方法。

本教程的学习时间约需要2～3小时，但你必须曾经学过《医学统计学》，不管学得好或学得差，或是否已忘记，只要有一点印象即可，同时还需要下载一个简明统计学处理软件《临床医师统计学助手V3.0》，因为作数据统计学处理时最令人头痛的问题是烦琐的计算，则由预存在本软件内的计算公式来完成。

《临床医师统计学助手 V3.0》下载地址:https://www.wendangku.net/doc/cf3072082.html,/03/tjx/help.htm

这是一个全“傻瓜化”的教程，由4个实例组成，只要认真看完这4个实例，将实际中碰到的问题对号入座，就足以解决绝大多数问题了。接下来我们开始轻松愉快的学习过程。

一、均数与标准差

【例1】本组105 例，男55例，女50例；平均年龄：62.3±6.1岁，所有入选病例均符合1999年WHO 高血压诊断标准。

举这个例子是为了说明“均数”与“标准差”的概念。我实在不愿意多花时间阐述一些概念性的东西，但是由于“标准差”实在太重要了。【例1】中的数据“62.3±6.1”，“62.3”就是年龄的均数，均数的概念大家都懂，那么后面的“6.1”是什么呢？它就是标准差。有人可能会问，表达一组人的平均年龄，用均数就够了，为什么还要加一个标准差呢？先看下面的一个例子：有两组人，第1组身高（cm）：98、99、100、101、102；第2组身高（cm）：80、90、100、110、120，这两组人虽然身高的均数都是100cm，但是，仔细观察，第1组的身高很接近，第2组的身高差别很大，故仅仅用一个平均数表达一组数据的特征是不完整的，还需要用另一个指标来表达其参差不齐的程度，这就是标准差。统计学上对一组测量结果的数据都要用“均数±标准差”表示，习惯表达代号是：，具体例子如：平均收缩压120±10.2mmHg。

我想现在大家都已知道标准差是什么东东了，那么，标准差是怎样得到的呢？有一个比较复杂的计算公式，我们不必去深究这个公式是怎么样的，只需知道标准差越小，说明数据越集中，标准差越大，说明数据越分散。

撰写医学论文的第一步是收集原始数据，如：

第1组身高（cm）：98、99、100、101、102；

第2组身高（cm）：80、90、100、110、120。

在论文中并不是直接给出原始数据，而是要以方式表示。利用软件《临床医师统计学助手 V3.0》，只要输入原始数据，就能自动计算出均数及标准差，即第1组平均身高：100±1.58cm；第2组平均身高：100±15.81cm，如下图。

二、两样本均数差别T检验

【例2】目的研究中药板兰根对“非典”疗效。方法将36例“非典”患者随机分为治疗组19例，采用常规治疗+板兰根口服，对照组17例，仅采用常规治疗。结果治疗组平均退热时间3.28±1.51d；对照组平均退热时间5.65±1.96d，两组间对照差别有极显著意义（p＜0.01 ）结论中药板兰根对“非典”有显效疗效，实为国之瑰宝。

这是最常见的一种统计学数据处理类型，统计学述语叫做“两样本均数差别T检验”，说得通俗易懂一些，就是检验两组方法所得到的数据到底有没有差异，或者说，差异是否有意义。我们平时的思维习惯是，数据的大小还用得着检验吗？这是小学生都会的问题。可是别忘记了现在是在搞科研，科学方法看问题可不一定这么简单。

可能还没有说明白这个问题，下面举一个简单的例子。我们的目的是得出这样一个结论：“北京出产的西瓜比上海出产的西瓜大”。最可靠的方法是把所有北京的西瓜和上海的西瓜都测量重量，得到两个均数，然后比大小即可，可是智商正常的人并不会这样去做，通常的做法是，随机选一部分北京的西瓜和一部分上海的西瓜，先让这两部分西瓜比大小，然后推断到底那里的西瓜大。这种方法是“窥一斑可见全豹”，统计学述语叫做“由样本推断总体”，事实上，我们所做的医学科研都是基于这种

方法。

再回到上面的例子，假如我们有二种做法：

A、随机选2个北京西瓜，平均重量是5.6±0.3kg；再随机选2个上海西瓜，平均重量是4.3±0.25kg；

B、随机选1000个北京西瓜，平均重量是5.6±0.3kg；再随机选1000个上海西瓜，平均重量是

4.3±0.25kg。

凭生活常识，由B推出“北京的西瓜比上海西瓜大”这个结论的把握性就非常的大，而A则基本上推不出这个结论。现在，终于可以引出我们的主题了，统计学处理本质是考查由样本差异推断总体差异的把握性有多大，这种把握性在统计学上由P值表示。如P＜0.05或P＜0.01，可以理解为由样本差异推断总体差异的把握性达95%或99%以上，两组数据差异有显著意义；如P＞0.05，可以理解为这种把握性在95%以下，两组数据差异没有显著意义。

上面所讲的实已为统计学之精髓，建议多看几遍，如果天生愚鲁，还是看不太懂，也没有关系，现在进一步“傻瓜化”，即所谓统计学处理，只要求得P值即可。P＜0.05或P＜0.01，表示阳性结果，两组数据差异有显著意义；P>0.05，表示阴性结果，两组数据差异没有显著意义。所以，统计学处理的中心任务是求P值。

下面讲解遇到【例2】这样的问题，如何求P值。【例2】中一共有6个数据：第一组均数（X1）、标准差（S1）、例数（N1）与第二组均数（X2）、标准差（S2）、例数（N2），就是根据这6个数据，先通过复杂计算，求出“T”值（如果没有想成为统计学专家，就不必去理解“T”是什么了，知道“T”是为了求“P”用的就可以了），求出“T”值后，再查“T界值表”，就知道“P值”了。

具体解法步骤如下：

⑴通过计算（这里略去计算公式，可由软件求出），T=4.088

⑵计算自由度：自由度=N1+N2-2=19+17-2=34（计算自由度是为了查T界值表用的，自由度即两组例数之和减去2，不要问我为什么不减去3或减去1这样的问题了。）

⑶ 查T界值表，对应自由度34，T0.05=2.032，T0.01=2.728,今T=4.088＞T0.01，即P＜0.01,差别有高度显著意义。

T=4.088是如何求出的呢？我们再回到软件《临床医师统计学助手 V3.0》，只要把第一组均数（X1）、标准差（S1）、例数（N1）与第二组均数（X2）、标准差（S2）、例数（N2）这6个数据输入对应的框内，该软件就会利用预先存储的公式自动计算T值，并查T界值表，得到P值，如图：

三、配对计量资料T检验

【例3】目的研究音乐胎教对胎儿运动技能培养的效果。方法10例28～32周孕妇，分别记录听音乐（水浒传主题曲）前每小时的胎动次数及听音乐后每小时的胎动次数，结果数据如表1所示，音乐胎教后胎动次数增多，差别有显著意义（p＜0.05 ）结论音乐胎教可增强胎儿运动技能，对培养我国运动天才有现实意义。

显然【例3】与【例2】有所不同，主要是【例3】两组间的数据可以前后配对的。我们经常碰到这种情况，即同一个体做两次处理，如治疗前检测某一指标，治疗后再检测某一指标，而后做治疗前后配对比较，以判断疗效，正如【例3】。这种情况如何进行统计学处理呢？同样也是先计算T值，然后按自由度（这时自由度=对子数-1，如本例自由度是9。）查T界值表，求得P值。但是“配对T检验”计算T值的方法与“两样本均数T检验”有所不同，这里不再作介绍，由软件《临床医师统计学助手 V3.0》自动完成即可，如下图。本例T=2.47，自由度=10-1=9，查T界值表，对应自由度9，T0.05=2.26，T0.01=3.25,今T=2.47＞T0.05，即P＜0.05,差别有显著意义。

可能有人会问,【例3】的情况，也可以把胎教前视为对照组，求得平均胎动次数是：21.8±5.31，胎教后视为治疗组，求得平均胎动次数是：24.0±6.31，然后套用【例2】的方法，用“两样本均数T检验”行不行？这样虽无大错误，但是将会导致检验效率的下降，就是说，如果数据差异较大时，两种方法均可，如果数据差异较小时，用“配对T检验”会显示出差异有意义，而用“两样本均数T检验”时，可能差异无意义。切记，非配对资料误用配对T检验，则是错误的。四、计数资料卡方检验【例4】目的研究医患关系对重症病人死亡率的影响。方法根据问卷调查对收住重症监护病房的病人分为“医患关系良好组”与“医患关系紧张组”，比较两组间的住院死亡率。结果“医患关系良好组”25例，住院间死亡3例，死亡率13.6%，“医患关系紧张组”23例，住院间死亡9例，死亡率39.1%，两组间差别有显著意义（p＜0.05 ）结论医患关系紧张增加重症病人的住院死亡率，可能与医师害怕被病人告而治疗方案趋向保守有关。【例4】又是一个非常常见的一种统计学数据处理类型。【例4】中所提供的数据是“比例”，或百分数，与前面三个例子不同，前面三个例子所提供的数据则是直接在病人身上测量到的数据，如收缩压120±10.2mmHg、身高100±15.81cm等，我们把【例4】中的数据叫做计数资料，而【例1、2、3】中的数据叫做计量资料。计数资料无法用形式表示，只能用比例表示，如：死亡率13.6%、30例中显效10例（10/30）等。显然，对于计数资料，再用T检是不适合了，必须用卡方检验。卡方检验的步骤是：先求出X2（类似于T检验时先求T值）值，然后进行判断：⑴如果X2＜3.84，则P＞0.05；⑵如果X2＞3.84，则P＜0.05；⑶如果X2＞6.63，则P＜0.01。解释一下，上面的两个数字“3.84”与“6.63”是查“X2界值表”得来的，只要记住即可。所以，卡方检验的关键是求出X2值。为了求出X2值，必须先介绍“四表格”概念。“四表格”的形式如下，关键数据是

a、b、c、d 四个数，X2值就是通过这四个数据计算出来的（这里仍不介绍公式，由软件计算。）。

现将【例4】中的数据填入“四表格”即如下图。

当你学会了填“四表格”数据之后，就能利用软件《临床医师统计学助手 V3.0》非常容易的进行卡方检验了，本软件提供与“四表格”完全相同的界面，把数据填写正确之后，就自动计算X2值并判断结果，【例4】X2=4.702＞ 3.84，故P＜0.05，如下图：

在此说明一下，大家可能已注意到本软件中出现的“理论数（T）”，在此不解释“理论数（T）”

是什么，只要记住，当例数（n）＜40或T＜1时，应采用“精确概率法”，这个方法太复杂，在此不作介绍。现在已经讲完了4个实例，掌握本教程的诀窍是将实际中碰的的情况，对照实例，“对号入座”即可，而具体计算过程，可由软件去完成。

统计学中的基本概念

1、2 统计学得几个基本概念 1、2、1 总体与总体单位 1、总体 (1)总体得概念:总体就是指客观存在得、具有某种共同性质得许多个别事物组成得整体; 在统计研究过程当中,统计研究得目得与任务居于支配与主导得地位,有什么样得研究目得就应该有什么样得统计总体与之相适应。例如:要研究我们学院教师得工资情况,那么全体教师就就是研究得总体,其中得每一位教师就就是总体单位;如果要了解某班50个学生得学习情况,则总体就就是该班得50名学生,每一名学生就是总体单位。根据我们研究目得得不同,我们要选取得研究对象也就就是研究总体相应地要发生变化。 (2)总体得分类: 总体根据总体单位就是否可以计量分为有限总体与无限总体: ★有限总体:指所包含得单位数就是有限得总体。如一个企业得全体职工、一个国家得全部人口等都就是有限总体; ★无限总体:指所包含得单位数目就是无限得,或准确度量它得单位数就是不经济或没有必要得,这样得总体称为无限总体。如企业生产中连续生产得大量产品,江河湖海中生长得鱼得尾数等等。划分有限总体与无限总体对于统计工作得意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体得特征: ★大量性:就是指构成总体得单位数要足够得多,总体应由大量得单位所构成。大量性就是对统计总体得基本要求。个别单位得现象或表现有很大得偶然性,而大量单位得现象综合

则相对稳定。因此,现象得规律性只能在大量个别单位得汇总综合中才能表现出来。只有数量足够得多,才能准确地反应我们要研究得总体得特征,达到我们得研究目得。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性就是构成统计总体得前提条件。 ★变异性:即构成总体得各个单位除了至少在某一方面具有共同性质外,在其她方面具有一定得差异。差异性就是统计研究得主要内容。如以一个班级得所有学生作为一个总体,则“专业”就是该总体得同质性,而“性别”、“籍贯”等则就是个体之间得变异性;以我院全体教师为一个总体,则“工作单位”就是其同质性,而“学历”、“月工资”等则就是它得变异性。需要特别说明得三个问题: ★变异就是客观存在得,没有变异得事物就是不存在得; ★变异对于统计非常重要,没有变异就没有统计。这就是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位得资料就可以推断总体情况了; ★变异性与同质性之间相互联系、相互补充,就是辩证统一得关系。用同质性否定变异性或用变异性否定同质性都就是错误得。 2、总体单位就是构成总体得每一个个体。【思维动起来】对2015年10月份某市小学生得近视情况进行调查: 统计总体就是什么?总体单位就是什么? 总体得同质性就是什么？变异性就是什么？ 3、总体与总体单位得关系在统计研究中,确定统计总体与总体单位就是十分重要得,它决定于统计研究目得与认识对象得性质。在一次特定范围、目得得统计研究中,统计总体与总体单位就是不容混淆得,二者得含义就是确切得,

统计学中的基本概念

1.2 统计学的几个基本概念 1.2.1 总体和总体单位 1.总体（1）总体的概念：总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体；在统计研究过程当中，统计研究的目的和任务居于支配和主导的地位，有什么样的研究目的就应该有什么样的统计总体与之相适应。例如：要研究我们学院教师的工资情况，那么全体教师就是研究的总体，其中的每一位教师就是总体单位；如果要了解某班50个学生的学习情况，则总体就是该班的50名学生，每一名学生是总体单位。根据我们研究目的的不同，我们要选取的研究对象也就是研究总体相应地要发生变化。（2）总体的分类：总体根据总体单位是否可以计量分为有限总体和无限总体： ★有限总体：指所包含的单位数是有限的总体。如一个企业的全体职工、一个国家的全部人口等都是有限总体； ★无限总体：指所包含的单位数目是无限的，或准确度量它的单位数是不经济或没有必要的，这样的总体称为无限总体。如企业生产中连续生产的大量产品，江河湖海中生长的鱼的尾数等等。划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们设计统计调查方法。很显然，对于有限总体，可以进行全面调查，也可以进行非全面调查，但对于无限总体不能进行全面调查，只能抽取一部分单位进行非全面调查，据以推断总体。（3）总体的特征： ★大量性：是指构成总体的单位数要足够的多，总体应由大量的单位所构成。大量性是对统计总体的基本要求。个别单位的现象或表现有很大的偶然性，而大量单位的现象综合则相对稳定。因此，现象的规律性只能在大量个别单位的汇总综合中

才能表现出来。只有数量足够的多，才能准确地反应我们要研究的总体的特征，达到我们的研究目的。 ★同质性：指总体中各单位至少在某一个方面性质相同，使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性：即构成总体的各个单位除了至少在某一方面具有共同性质外，在其他方面具有一定的差异。差异性是统计研究的主要内容。如以一个班级的所有学生作为一个总体，则“专业”是该总体的同质性，而“性别”、“籍贯”等则是个体之间的变异性；以我院全体教师为一个总体，则“工作单位”是其同质性，而“学历”、“月工资”等则是它的变异性。需要特别说明的三个问题： ★变异是客观存在的，没有变异的事物是不存在的； ★变异对于统计非常重要，没有变异就没有统计。这是因为，如果总体单位之间不存在变异，我们只需要了解一个总体单位的资料就可以推断总体情况了； ★变异性和同质性之间相互联系、相互补充，是辩证统一的关系。用同质性否定变异性或用变异性否定同质性都是错误的。 2.总体单位是构成总体的每一个个体。【思维动起来】对2015年10月份某市小学生的近视情况进行调查：统计总体是什么?总体单位是什么? 总体的同质性是什么？变异性是什么？ 3.总体和总体单位的关系在统计研究中，确定统计总体和总体单位是十分重要的，它决定于统计研究目的和认识对象的性质。在一次特定范围、目的的统计研究中，统计总体与总体单位是不容混淆的，二者的含义是确切的，是包含与被包含的关系，但是随着统计研究任务、目的及范围的变化，统计总体和总体单位可以相互转化。

临床试验中的统计学若干问题

临床试验中的统计学若干问题 ——《小胖说统计》系列日志节选（一）

前言 “统计学基本上是寄生的。靠研究其他领域内的工作而生存。这不是对统计学的轻视，这是因为对很多寄主来说，如果没有寄生虫就会死。对有的动物来说，如果没有寄生虫就不能消化它们的食物。因此，人类奋斗的很多领域，如果没有统计学，虽然不会死亡，但一定会变得很弱” －L.J.Savage “统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。” －H.G.Wells 统计学研究的是来自各领域的数据，由解决其他领域内的问题而存在并发展。这一点对临床试验生物统计学也不例外，临床试验的大力发展催生并发展了统计在制药行业的应用。对于每个从事临床试验工作的人来说，我们并不都需要你通晓每种统计方法的由来，我们需要的是你用一种统计的思维方式来看待和判断临床试验中的问题。基于此小胖结合自己在临床试验生物统计方面微不足道的经历，于2008年6月推出了自己的日志系列《小胖说统计》，初衷在于在不侧重复杂的统计理论和计算的基础上，通过一些浅显易懂的语言，简单介绍一下临床试验中一些生物统计的基本知识，并希望能成为和广大临床试验同行进行交流的平台。承蒙广大网友的抬爱，《小胖说统计》推出后受到了大家的认可，至今已发表约180篇博文。为了方便大家的阅读，应广大网友的要求，特对《小胖说统计》中的主要内容加以节选，所有内容均属个人观点，仅供参考，欢迎大家批评指正。《小胖说统计》系列日志将会继续进行持续更新，详细内容可参见以下链接： https://www.wendangku.net/doc/cf3072082.html,/2113 https://www.wendangku.net/doc/cf3072082.html,/ucenterhome/5612 在此对长期关注和支持《小胖说统计》系列日志的公卫论坛和药物临床试验论坛的广大坛友表示感谢。

ICH E9临床试验的统计学指导原则解析

ICH E9临床试验的统计学指导原则解析 ICH E9 Statistical principles for clinical trials （临床试验的统计学指导原则）可谓生物统计师的bible，目的在于协调欧洲、日本和美国在进行药品上市申请的临床试验时所应用的统计学方法的指导原则。虽说中国是协调三方之外的国家，SFDA还为此另外制定了自己的《化学药物和生物制品临床试验的生物统计学技术指导原则》，但其内容基本还是照抄翻译了ICH E9的内容。首先，我们先看一下ICH E9的内容概况： 1．引言 2．整个临床试验的基本考虑 3．试验设计中的基本考虑 4．试验进行中的基本考虑 5．数据分析 6．安全性与耐受性评价 7．研究报告临床研发计划中的统计思维众所周知，药物临床研究的主要目标就是以最小的成本和最快的时间，科学地评估有希望进入市场的药物的风险－效益。万事计划为先，为了保证药物研发的成功，制定一个临床研发计划（clinical development plan）是十分必要的。那什么是临床研发计划包括哪些内容呢？通常地，临床研发计划包括研发依据、试验的一些基本情况、时间表、预算以及所需的人力物力财力资源等。在大多数公司，在开展一项临床试验前，可能不会有一项正规的成文的临床研发计划，但总会考虑到上述这些内容。尽管临床研发计划的确定主要基于医学和科学的正确合理，但其他方面比如生物统计、注册、市场甚至管理层的影响也同等重要。在这里我们重点讨论一下，统计在临床研发中的作用。首先，管理者在做临床研发计划时希望从生物统计师这里获得一些有助于他们决策的有用的信息。他们需要在市场销售、医学、注册等各方面追求一个平衡。他们需要明确知道药物研发的风险收益。 Confirmatory Trial（验证性试验）和Exploratory Trial （探索性试验）对整个临床试验的角度考虑，我们通常可以把临床试验分为Confirmatory Trial（验证性试验）和Exploratory Trial （探索性试验）两种类型。什么是验证性试验呢？简单地讲，验证性试验就是检验假设（hypothesis-testing）的试验，是一种事先提出假设，并对其进行检验的有对照组的试验。可以提供疗效和安全性方面的确定的证据。我们进行的验证性试验包括所有的III期试验、大多数IV期试验以及一些晚期的II期试验。当然对于验证性试验，我们接触最多的便是III期注册试验。其中验证性试验最核心的部分就是假设（Hypothesis），而对于它必须做到： 1．假设必须直接根据试验的主要目的确定 2．假设必须在试验前事先确定 3．假设必须在试验完成后进行检验与之对应的探索性试验，对数据作一些探索分析，可能会做一些假设检验，但这些假设不需要是事先确定的，而是根据数据的特点而定的，因此不能作为证实疗效的正式依据。虽然说

医学统计学题库完整

第一章绪论习题一、选择题 1．统计工作和统计研究的全过程可分为以下步骤:（D ） A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中，习惯上把（B ）的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3～8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下：0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是（ A ）。 4.分别用两种不同成分的培养基（A 与B ）培养鼠疫杆菌，重复实验单元数均为5个，记录48小时各实验单元上生长的活菌数如下，A ：48、84、90、123、171；B ：90、116、124、225、84。该资料的类型是（C ）。 5.空腹血糖测量值，属于（ C ）资料。 6.用某种新疗法治疗某病患者41人，治疗结果如下：治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是（B ）。 7.某血库提供6094例ABO 血型分布资料如下：O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是（D ）。 8. 100名18岁男生的身高数据属于（C ）。二、问答题 1．举例说明总体与样本的概念. 答：统计学家用总体这个术语表示小异的对象全体，通常称为目标总体，而资料常来源于目标总体的一个较小总体，称为研究总体。实际中由于研究总体的个体众多，甚至无限多，因此科学的办法是从中抽取一部分具有代表性的个体，称为样本。例如，关于吸烟与肺癌的研究以英国成年男子为总体目标，1951年英国全部注册医生作为研究总体，按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2．举例说明同质与变异的概念答:同质与变异是两个相对的概念。对于总体来说，同质是指该总体的共同特征，即该总体区别于其他总体的特征；变异是指该总体部的差异，即个体的特异性。例如，某地同性别同年龄的小学生具有同质性，其身高、体重等存在变异。 3．简要阐述统计设计与统计分析的关系答：统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的，统计设计在前，然而一定的统计设计

临床试验中的统计学讲解

小胖说统计之一：认识α,β 要了解生物统计在临床试验中的应用，首先需从认识α,β开始，就是这两个不起眼的符号贯穿了临床试验生物统计的始终。α和β的定义是比较拗口的，特别是对于那些没学过统计的人来说，这两个东西是怎么也搞不明白具体是怎么回事。虽然比较拗口，但咱还得在这里重复一下α和β的科学定义：α又称第I类错误或显著性水平，指拒绝了实际上成立的H0，β又称第II类错误，指不拒绝实际上不成立的H0。对应β的还有一个概念叫power，国内翻译为把握度，它等于1－β，指拒绝实际上不成立的H0的概率。说得通俗一点，临床试验中你会犯俩错误，一种错误就是两种药本来没啥区别，却说成您的药优于人家的药，这就是α；另一种错误就是你的药的确优于人家的药，却说成两种药没啥区别，这就是β。那1－β呢，就是咱的优秀药物被发现的概率啊。不知道，上边的解释，您听明白了吗？如果听明白了，小胖要问您了，谁应该最关心α啊，那又谁应该最关心β啊？最关心α的当然是我们伟大的SFDA以及诸如FDA之类的药品审批机构啊，为啥？他们当然不希望一种药明明和别的药没啥区别，却被药厂说成疗效更好，换言之，他们可不希望审批无效的药物进入市场。所以啊，它们要限定这种错误发生的概率，也就是我们的α了，一般情况下，α被限定为0.05。最关心β的当然是我们的药厂了，为啥？为钱，哈哈！药厂当然不希望明明他的药优于别人的药，却被说成两种药没啥区别吧，所以它们希望降低这种错误发生的概率，也就是降低β了。换言之，他希望提高把握度（1－β），使自己的药能有更高的概率作出来优于别的药物，从而进入市场，赚取钞票。。。一般情况下，β应小于0.2，甚至0.1，对应的把握度为80％或90％。当然药厂降低β，也就是提高把握度，会提高你试验成功的概率，但这也同时意味着同等条件下样本量的增加，样本量的增加就意味着money的增加，这些都是矛盾的，没办法，谁让这世界本来就是一个矛盾的世界呢，你只好去权衡利弊，找个平衡点呗。。。今天就到这里吧，休息，休息。。。

统计学基本概念

基本概念 1、统计的含义：统计工作、统计资料、统计学 2、社会经济统计学的特点：数量性、社会性、综合性 3、统计工作的职能：统计信息职能、统计咨询职能、统计监督职能 4、统计工作过程：统计调查、统计整理、统计分析 5、统计调查的质量要求：准确性、全面性、及时性、有效性 6、专门调查的方法：普查、重点调查、典型调查、抽样调查 7、统计调查的方法：直接观察法、报告法、采访法、通讯法、实验调查法、网上调查法 8、次数分布的主要类型：钟型分布、U型分布、J型分布 9、统计表的结构，从组成要素看，由总标题、横行与纵栏标题、指标数值等三部分组成 10、统计表的结构，从容上看，由主词、宾词两部分构成 11、统计分析方法：综合指标、动态数列、统计指数、相关回归、抽样推断 12、综合指标从它的作用和方法特点的角度可概括为三类：总量指标、相对指标、平均指标 13、相对指标的种类：计划完成相对指标、结构相对指标、比例相对指标、比较相对指标、强度相对指标、动态相对指标 14、平均指标的种类：算术平均数、调和平均数、几何平均数、众数、中位数 15、测定标志变动度的主要方法：全距、四分位差、平均差、标准差、离散系数

16、动态数列按构成其指标数值的性质不同分为：绝对数动态数列、相对数动态数列、平均数动态数列 17、动态数列的水平分析指标：发展水平、平均发展水平、增长量、平均增长量 18、动态数列的速度分析指标：发展速度、增长速度、平均发展速度、平均增长速度 19、测定长期趋势常用的主要方法：间隔扩大法、移动平均法、最小平方法 20、指数按其反映指标性质不同分为：数量指标指数和质量指标指数 21、指数按其表现形式不同分为：综合指数、平均指数、平均指标对比指数 22、相关关系按其方向不同分为:正相关和负相关 23、相关关系按其涉及因素多少分为：单相关和复相关 24、相关关系按其形式不同分为：直线相关和曲线相关 25、抽样调查的组织形式：简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样 26、总体参数的抽样估计方法为点估计和区间估计。统计分析 1．某市某“五年计划”规定计划期最末一年甲产品产量应达到75万吨，假定每天产量相等，实际生产情况如下表所示（单位：万吨）。试计算该市甲产品产量五年计划完成程度和提前完成计划的时间。第一年第二年第三年56 58 62 第四年一季二季三季四季16 17 18 18

临床试验中常用统计分析方法

临床试验中常用统计分析方法 ---统计分析的质量是与临床试验的设计、实施和数据管理密切相关的。就统计分析本身而言，其指导思想是使偏差最小和避免I类错误的增大。定性资料的统计分析方法统计学试验设计：包括确定样本量的大小、试验设计方法（盲法/开放）（具体见有关章节） 1. 定性资料的概念： ---统计资料中按品质和属性分组计数所得的资料，由定性变量和频数两部分组成。定性变量可分为名义变量(如治疗方法分甲、乙、丙等)和有序变量(如疗效结果分治愈、显效、有效、无效)。 ---新药临床研究中，定性资料常用的统计检验方法有卡方检验、校正的卡方检验、Fisher精确检验及Ridit检验、秩和检验。 2. 定性资料的统计描述计算率、比等指标，如试验组和对照组的有效率，并可用各种统计图来表示。 3. x2检验 ---治疗前年龄、性别、病程、病情等一般情况组间均衡性比较，治疗后计数资料的改善情况比较均为双向无序R×C 表资料，用x2检验。当表中理论频数小于5的格子数超过

全部格子数的1／5时，应用Fisher精确检验。 ---如果为2×2表资料，当总样本含量n≥40，且理论频数T均大于5时，用x2检验；当总样本含量n≥40，单有理论频数满足1≤T＜5时，用校正的x2检验；当总样本含量n ＜40或有理论频数＜l时，用Fisher精确检验。 ---目前，各种计算机统计软件的应用(如SAS)使统计学分析中复杂得运算过程简单化，有条件将双向无序R×C表资料均进行Fisher精确检验。 4. 秩和检验 ---进行组间疗效比较或对量化的症状、体征的改善进行组间比较以及考察疗效与年龄、性别等相关性分析时，这些资料属于单向有序R×C表资料，应采用与"有序性"有联系的秩和检验或Ridit检验。 ---秩和检验的优势在于它不仅可判断各组间是否有显著性差异，而且可说明对比各组的效果优劣和强弱是x2检验无法做到的。 ---对于单向有序R×C表资料，Ridit检验和秩和检验的意义完全相同，根据试验者的习惯及熟练程度选一种即可。 5. 定性资料统计分析注意事项 (1) 不可用x2检验分析一切列联表资料，要根据列联表中定性变量的性质决定统计分析方法。 (2) x2检验中资料要满足公式的要求，不可盲目套用。

医学统计学重点图表总结

定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平均数个体的平均值对称分布几何均数平均倍数取对数后对称分布中位数位次居中的观察值 ①非对称分布；②半定量资料；③末端开口资料； ④分布不明众数频数最多的观察值不拘分布形式，概略分析调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式，概略分析标准差（方差）观察值平均离开均数的程度对称分布，特别是正态分布资料四分位数间距居中半数观察值的全距 ①非对称分布；②半定量资料；③末端开口资料； ④分布不明变异系数标准差与均数的相对比 ①不同量纲的变量间比较；②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些？分别适用于什么分析目的？常用统计图的适用资料及实施方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 1

1 散点图双变量间的关联点的密集程度和形成的趋势，表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形，叶片为个体值，叶长为频数定性资料统计描述常用的统计指标及其适用场合指标计算公式适用场合频率 n/N 估计总体中某一结局发生的概率频率分布 n 1/N ，n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率强度阳性人数/总观察人时数估计总体中单位时间内某一结局发生的概率比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定？参考值范围（%）正态分布法百分位数法双侧单侧双侧单侧下限上限下限上限 90 S X 64.1± S X 1.28－ S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1－ S X 64.1+ P 2.5~P 97 .5 P 5 P 95 99 S X 58.2± S X 2.33－ S X 2.33+ P 0.5~P 99 .5 P 1 P 99 1．标准差与标准误的区别与联系？

统计学中的基本概念

统计学的几个基本概念总体和总体单位 1.总体（1）总体的概念：总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体；在统计研究过程当中，统计研究的目的和任务居于支配和主导的地位，有什么样的研究目的就应该有什么样的统计总体与之相适应。例如：要研究我们学院教师的工资情况，那么全体教师就是研究的总体，其中的每一位教师就是总体单位；如果要了解某班50个学生的学习情况，则总体就是该班的50名学生，每一名学生是总体单位。根据我们研究目的的不同，我们要选取的研究对象也就是研究总体相应地要发生变化。（2）总体的分类：总体根据总体单位是否可以计量分为有限总体和无限总体： ★有限总体：指所包含的单位数是有限的总体。如一个企业的全体职工、一个国家的全部人口等都是有限总体； ★无限总体：指所包含的单位数目是无限的，或准确度量它的单位数是不经济或没有必要的，这样的总体称为无限总体。如企业生产中连续生产的大量产品，江河湖海中生长的鱼的尾数等等。划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们设计统计调查方法。很显然，对于有限总体，可以进行全面调查，也可以进行非全面调查，但对于无限总体不能进行全面调查，只能抽取一部分单位进行非全面调查，据以推断总体。（3）总体的特征： ★大量性：是指构成总体的单位数要足够的多，总体应由大量的单位所构成。大量性是对统计总体的基本要求。个别单位的现象或表现有很大的偶然性，而大量单位的现象综合则相对稳定。因此，现象的规律性只能在大量个别单位的汇总综合中

才能表现出来。只有数量足够的多，才能准确地反应我们要研究的总体的特征，达到我们的研究目的。 ★同质性：指总体中各单位至少在某一个方面性质相同，使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性：即构成总体的各个单位除了至少在某一方面具有共同性质外，在其他方面具有一定的差异。差异性是统计研究的主要内容。如以一个班级的所有学生作为一个总体，则“专业”是该总体的同质性，而“性别”、“籍贯”等则是个体之间的变异性；以我院全体教师为一个总体，则“工作单位”是其同质性，而“学历”、“月工资”等则是它的变异性。需要特别说明的三个问题： ★变异是客观存在的，没有变异的事物是不存在的； ★变异对于统计非常重要，没有变异就没有统计。这是因为，如果总体单位之间不存在变异，我们只需要了解一个总体单位的资料就可以推断总体情况了； ★变异性和同质性之间相互联系、相互补充，是辩证统一的关系。用同质性否定变异性或用变异性否定同质性都是错误的。 2.总体单位是构成总体的每一个个体。【思维动起来】对2015年10月份某市小学生的近视情况进行调查：统计总体是什么总体单位是什么总体的同质性是什么变异性是什么 3.总体和总体单位的关系在统计研究中，确定统计总体和总体单位是十分重要的，它决定于统计研究目的和认识对象的性质。在一次特定范围、目的的统计研究中，统计总体与总体单位是不容混淆的，二者的含义是确切的，是包含与被包含的关系，但是随着统计研究任务、目的及范围的变化，统计总体和总体单位可以相互转化。

统计学中的基本概念

1、2统计学得几个基本概念 1. 2. 1总体与总体单位 1、总体 ⑴总体得概念:总体就是指客观存在得、具有某种共同性质得许多个别事物组成得整体；在统计硏究过程当中，统计研究得目得与任务居于支配与主导得地位，有什么样得硏究目得就应该有什么样得统计总体与之相适应。例如:要硏究我们学院教师得工资情况，那么全体教师就就是研究得总体，其中得每一位教师就就是总体单位;如果要了解某班50个学生得学习情况，则总体就就是该班得50名学生，每一名学生就是总体单位。根据我们研究目得得不同,我们要选取得研究对象也就就是研究总体相应地要发生变化。 ⑵总体得分类：总体根据总体单位就是否可以计量分为有限总体与无限总体：★有限总体:指所包含得单位数就是有限得总体。如一个企业得全体职工、一个国家得全部人口等都就是有限总体； ★无限总体:指所包含得单位数目就是无限得，或准确度量它得单位数就是不经济或没有必受寻这样得总体称为无限总体。如企业生产中连续生产得大量产品，江河湖海中生长得鱼得尾数划分有限总体与无限总体对于统计工作得意义就在于可以帮助我们设计统计调查方法。很显然，对于有限总体，可以进行全面调查，也可以进行非全面调查，但对于无限总体不能进行全面调查，只能抽取一部分单位进行非全面调查，据以推断总体。 ⑶总体得特征: ★大量性:就是指构成总体得单位数要足够得多，总体应由大量得单位所构成。大量性就是对统计总体得基本要求。个别单位得现象或表现有很大得偶然性，而大量单位得现象综合则相对稳定。因此,现象得规律性只能在大量个别单位得汇总综合中才能表现出来。只有数量足够得多，才能准确地反应我们要研究得总体得特征，达到我们得研究目得。

临床试验中的统计学要求(DOC)

临床试验中的统计学要求临床试验是以病人为研究对象，比较临床治疗干预措施和对照措施的效果及其临床价值的前瞻性研究。临床试验以人为研究对象，与动物实验不同。在临床试验中，研究者不能完全支配病人的行为，只能要求病人避免采用某些干扰试验的治疗或行为，因此必须考虑病人的依从性问题。临床试验还必须考虑医学伦理学问题，当新药已被证实对病人弊大于利，尽管试验仍未完成，也要中止。当已经存在经医学验证对试验疾病有效的药物时，使用安慰剂对照是不适当的。当病人出现紧急情况需要额外治疗措施时，也必须给予。因此临床试验要面对比动物实验更多的问题，在设计上有着更严格的特殊要求。新药的临床试验分为Ⅰ、Ⅱ、Ⅲ、Ⅳ期：Ⅰ期临床试验是初步的临床药理学及人体安全性评价试验，观察人体对于新药的耐受程度和药物代谢动力学，为制定给药方案提供依据；Ⅱ期临床试验是随机盲法对照临床试验，对新药有效性及安全性作出初步评价，推荐临床给药剂量；Ⅲ期临床试验是扩大的多中心临床试验，遵循随机对照原则，进一步评价有效性和安全性；Ⅳ期临床试验是新药上市后的监测，在广泛使用条件下考察疗效和不良反应，尤其是罕见不良反应。本节主要讨论II期和III期临床试验的统计学要求。例11.1 临床观察发现急性心肌梗塞后，梗塞区膨出和左心室重构常导致左心室增大和心功能不全。为研究急性心肌梗塞后长期使用卡托普利治疗对心脏的保护作用，需设计一个药物疗效评价的临床试验，在设计中要考虑以下问题。 1．观察变量的选择 (1)主要变量和次要变量主要变量 (primary variable)又称目标变量(target variable),即能够为临床试验目的提供可信证据的变量。临床试验的主要变量一般只有一个，必要时可有多个。主要变量应易于量化、客观性强、被相关研究领域所公认。次要变量（secondary variable)是指与试验主要目的有关的附加的变量，也可以是与试验次要目的有关的变量。两种变量均应在临床试验的设计方案中明确定义，并说明其被选择的理由。临床试验的样本含量估计、疗效或安全性评价应以主要变量为依据。 (2)复合变量(compound variable) 当与临床试验主要目的有关的变量很多,难以确定单一的主要变量时，可预先确定一种综合计算方法(如求和，加权求和等)，或用多元分析的方法(如主成分分析等)将多个变量综合成一个复合变量，如临床研究中采用的各种量表就是一种复合变量。当组成复合变量的某些单项变量具有临床意义时，也可以单独进行统计分析。 (3)全局评价变量(global assessment variable) 将客观指标和研究者对病人的病情及其改变总的印象综合起来所设定的变量称为全局评价变量，它通常是有序分类变量。全局评价变量往往带有一定的主观成份。因此，如果需选择全局评价变量，应在方案中明确说明它与试验的主要目的有关，有选择的依据和可靠的基础，同时具有明确判断等级的方法。客观性较好的全局评价变量应该作为主要变量之一单独加以考虑。例11.1中，研究目的是为评价卡托普利治疗对左心室容量、收缩功能和舒张充盈的作用，因此主要指标是用多普勒超声心动图测定左心室容量和射血分数。次要变量可选择左心室充盈速率。评价左心室容量和充盈速率的变量有多个，各变量的结果不一致时，难以对药物作总的结论。因此在统计分析时可以将多个变量综合成一个变量进行分析，这综合变量就是复合变量。上例中研究的最终目的是卡托普利治疗对心功能的保护作用，因此可以选择心功能级别作为全局评价变量。２．对照组的选择临床试验中对照组与试验组唯一的差别是试验组中受试者接受新药治疗, 而对照组的受试者则接受对照药物的治疗。临床试验要求试验组和对照组来自相同的受试者总体。两组受试者不但在试验开始时要求基本情况相似, 而且在试验进行中除了试验药物不同外, 其它条件均需保持一致。临床试验中常用的对照组设置有以下3种类型: （１）安慰剂对照安慰剂(placebo)是一种虚拟药物, 其外观剂型、大小、颜色、重量、气味和口味等都与试验药尽可能保持一致, 但不含有试验药物的有效成份。设置安慰剂对照的目的在于消除研究者、受试者和参与评价人员等由心理因素等影响而形成的偏倚，分离出由试验药物所引起的真正的效应和不良反应。安慰剂可以用于平行对照或自身交叉对照。（2）阳性药物对照在临床试验中采用已知的、已批准上市的有效药物作为试验药的对照, 称为阳性药物对照。阳性对照药物必须是合法的、公认有效的、并对所研究的适应症最为有效安全的药物。设计方案可以是平行对照也可以是自身交叉对照。（3）剂量-反应对照将试验药物设计成几个剂量, 而受试者随机地分入其中一个剂量组；它可以包括安慰剂对照即零剂量，也可以不包括安慰剂组。剂量-反应对照主要用于研究剂量与疗效和不良反应的关系, 或者仅用于说明疗效。剂量-反应对照有助于回答给药方案中采用的剂量是否合适。例11.1中急性心肌梗塞病人不适宜采用安慰剂对照，因此采用常规治疗包括溶栓剂、阿斯匹林等作阳性药物

医学统计学相关公式汇总

医学统计学相关公式汇总 Chapter 基本概念显著性检验（test of significance ）：计算P 值医学统计工作的内容： 1、实验设计：最关键最重要 2、收集资料：最基础原始资料：实验数据现场调查资料医疗卫生工作记录报表报告卡质量控制——精度和偏倚 3、整理资料（1）资料的逻辑检查（坏数）（2）一致性检查（3）原始数据加工：频数分布表 4、分析资料：统计描述（表、图、离散趋势、集中趋势）和统计推断统计描述类型的选择：集中趋势离散趋势对称、正态 μ，x S SS ，，对数正态 G S lgX 偏态及其他 M Q ，R 单位不同或均数差别大 CV 医学统计的资料类型：计量资料、计数资料、等级分组资料医学统计学的对象：有变异的事物总体和样本：总体（population ）的特性：同质性、大量性、差异性。

抽样的要求：代表性、随机性、可靠性、可比性。样本的三性：代表性、随机性、可靠性。可靠性（reliability ）：实验的结果要具有可重复性。即由科研课题的样本得出的结论所推测总体的结论有较大的可信度。两样本间具有：可比性。误差的类别： 1、系统误差（system error ）：在资料的收集过程中，由于仪器初始状态没有调零、标准试剂未经矫正、标准指定偏高或偏低等原因，造成的观察结果的倾向性的偏大或偏小。必须克服。 2、随机测量误差（random measurement error ）：在避免系统误差的情况下，由于各种偶然因素的影响造成对同一对象多次测量值的不一致。 3、抽样误差（sampling error ）：由于抽样造成的的样本统计量与总体参数之间的差别。不可避免。样本含量越大，抽样误差越小。如均数的抽样误差：|-X | 。概率（probability ）：P （A ）小概率事件：P ≤0.05（有统计学意义）或P ≥0.01（有高度统计学意义）。 Chapter 集中趋势的统计描述手工整理资料频数表（frequency table ）的步骤： 1、求极差（全距） 2、确定组数、组距参考组距=全距 / 组数 3、确定组段 4、手工编制划记表直方图（histogram ）：高度：各组的频数纵轴宽度：组距横轴表示组限均数（average ）：适用：对称分布或偏度不大的资料，尤其适合正态分布。抽样总体样本推断

统计学中的基本概念

变异 ?同质～性质相同。是指基本条件相同变异～同质事物之间的差异。是指不同的个体在相同的条件下，对外界环境因素的反应不同 ?总体Population：根据研究目的所确定的同质观察单位的全体； ?个体Individual：是构成总体的最基本观察单位； ?根据随机化原则有总体中随机抽取部分个体组成总体的过程 ?样本Sample：是从总体中按照一定的目的随机抽取的一部分个体。为什么要抽样？ ?样本含量Sample Size：样本中包含的个体个数。抽样原则一个样本应具有： “代表性(representative)” “随机性(randomization)” “可靠性（reliability)” 如果进行两个或多个样本之间的比较，要求：每二个样本之间应具有：可比性(comparable) 可比性是指处理组（临床设计中称为治疗组）与对照组之间，除处理因素不同外，其他可能影响实验结果的因素要求基本齐同，也称为齐同对比原则。误差（error） ?系统误差（system error） ?由于固定的原因（常见实验条件），影响资料的准确性。可以克服。 ?随机测量误差（random measurement error） ?由于偶然的因素造成同一对象多次测量结果的差异。可控制但不可消除。应采取措施，尽最大可能在一定的允许范围内抽样误差(sampling error) 抽样的原因造成统计量与总体参数或不同样本统计量之间的差异。原因：①个体变异②抽样抽样误差，对它要用统计方法进行正确分析概率 ?概率有古典概率与统计概率之分， ?医学上常用的是统计概率f／N ?必然事件，概率为1 ?不可能事件，概率为0 ?小概率事件，Ｐ≤0.05 或Ｐ≤0.01 ?常把Ｐ≤0.05 作为事物差别有统计学意义的界限，

医学统计学定性资料统计描述思考与练习带答案

第五章定性资料的统计描述【思考与练习】一、思考题 1．应用相对数时需要注意哪些问题？ 2. 为什么不能以构成比代替率？ 3. 标准化率计算的直接法和间接法的应用有何区别？ 4. 常用动态数列分析指标有哪几种？各有何用途？ 5. 率的标准化需要注意哪些问题？二、案例辨析题某医生对98例女性生殖器溃疡患者的血清进行检测，发现杜克雷氏链杆菌、梅毒螺旋体和人类单纯疱疹病毒2型病原体感染患者分别是30、51、17例，于是该医生得出结论：女性生殖器溃疡患者3种病原体的感染率分别为30.6%(30/98)、52.0%(51/98)和17.4%(17/98)。该结论是否正确？为什么？三、最佳选择题 1. 某地2006年肝炎发病人数占当年传染病发病人数的10.1%，该指标为B A. 率 B. 构成比 C. 发病率 D. 相对比 E. 时点患病率 2. 标准化死亡比SMR是指A A. 实际死亡数/预期死亡数 B. 预期死亡数/实际死亡数 C. 实际发病数/预期发病数 D. 预期发病数/实际发病数 E. 预期发病数/预期死亡数 3. 某地人口数：男性13,697,600人，女性13,194,142人；五种心血管疾病的死

亡人数：男性16774人，女性23334人；其中肺心病死亡人数：男性13952人，女性19369人。可计算出这样一些相对数： 11395283.18%16774 p ==， 21395219369 83.08%1677423334p +==+， 313952 101.86/1013697600 p = =万， 416774122.46/1013697600p = =万，523334 176.85/1013194142 p = =万， 645p p p =+ 71395219369 123.91/101369760013194142 p += =+万 81677423334 149.15/101369760013194142 p += =+万该地男性居民五种心血管疾病的死亡率为D A. 1p B. 2p C. 3p D. 4p E. 5p 4. 根据第3题资料，该地居民五种心血管病的总死亡率为E A. 1p B. 2p C. 5p D. 6p E. 8p 5. 根据第3题资料，该地男、女性居民肺心病的合计死亡率为D A. 2p B. 5p

统计学基础知识及其概念

一、概念篇总体：总体是指客观存在的，在同一性质基础上结合起来的许多个别事务的整体，亦称统计总体。总体单位：总体单位是指构成统计总体的个别事物的总称。指标：指标是反映总体现象数量特征的概念。标志：标志是说明总体单位特征的名称。统计调查：是按照预定的目的和任务，运用科学的统计调查方法，有计划有组织地向客观实际搜集统计资料的过程。调查对象：是根据调查目的、任务确定的调查的范围，即所要调查的总体，它是由某些性质上相同的许多调查单位所组成的。调查单位：是所要调查的现象总体中的个体，即调查对象中的一个一个具体单位，它是调查中要调查登记的各个调查项目的承担者。报告单位：是负责向统计调查机关提交调查资料的单位。普查：是专门组织的一次性的全面调查，用来调查属于一定时点上或时期内的现象的总量。抽样调查：是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究，并根据这部分单位的调查结果来推断总体，以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。抽样调查是抽取总体重的部分单位，收集这些单位的信息，用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体，它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的，将总体记作N，将样本记作n。面谈访问法：是由访问员与被调查者见面，通过直接访问来填写调查问卷的方法。统计整理：是统计工作的一个重要环节，它是根据统计研究的任务与要求，对调查所取得的各种原始资料，进行审核、分组、汇总，使之系统化、条理化，从而得到反映总体特征的综合资料的过程。复合分组：对同一总体选择两个或两个以上的标志重叠起来进行分组。复合分组体系：多个复合分组组成的分组体系。频数：是指分配数列中各组的单位数，也称次数。频率：是将跟组的单位数（频数）与总体单位数相比，求得的用百分比表示的相对数，也称比率或比重。统计指标：是反映总体现象数量特征的基本概念及其具体数值的总称。总量指标：是反映总体规模的统计指标，表明现象总体发展的结果。平均指标：是总体各单位某一数量标志一般水平的统计指标。是将一个总体内各个单位在某个数量标志上的差异抽象化，以反映总体的一般水平的综合指标。标志变异指标：是表明总体各个单位标志值的差异程度（离散程度）的指标。强度相对指标：是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值，是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。加权算数平均数：是在总体经过分组形成变量数列（包括单项数列和组距数列），有变量值和次数的情况下，将各组变量值分别与其次数相乘后加总求得标志总量，再除以总体单位数（即次数总和）而求得的数值。标准差：是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。发展速度：是表明社会经济现象发展程度的相对指标，它是根据两个不同时期发展水平对比求得，说明报告期水平是基期水平的几倍或百分之几，常用倍数或百分数来表示。由于所采用的基期不同，发展速度又可分为定基发展速度和环比发展速度。概率抽样：概率抽样在抽取样本时不带有任何倾向性，它通过从总体中随机抽选单位来避免这种偏差，因而对总体的推断更具代表性。比例分析法：比例分析法又名“比率分析法”，是用倍数或百分比表示的分数式，即通过计算相关指标之间的相对比值，来揭示和对比不同规模、不同性质事物的水平和效益的好坏，或分析部分和整体之间比例关系的分析方法。国家统计报表制度：国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案，由国家统计局制定，或者由国家统计局和国务院有关部门共同制定。现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。周期性普查制度：是国家统计报表制度的一个类型，是就我国社会经济发展的状况，由国务院组织，每隔一段时