文档库 最新最全的文档下载
当前位置:文档库 › 统计学名词解释整理

统计学名词解释整理

统计学名词解释整理
统计学名词解释整理

第一章:绪论

第一节统计的产生与发展

1.统计—总括地计算;对某一现象有关的数据进行搜集、整理、计算和分析等;统计学

概括地说统计就是用数字作为语言表述事实。它有三层含义即:统计资料、统计工作、统计学

2统计资料是反映一定社会经济现象或科学技术内容的统计数字和相联系的文字分析报告。3统计工作是在一定理论指导下,采用适宜的科学方法搜集、处理统计资料的一系列调查研究过程。

3统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。其目的就是探索数据内在的数量规律性(为什么?)。P8

三者之间的关系:统计工作和统计资料是过程与成果的关系;统计工作和统计学是实践与理论的关系,理论源于实践,理论又高于实践,反过来又指导实践。统计学是统计工作的经验概括和总结,是系统化了的知识体系。

第二节统计的基本问题

1.统计的作用认识世界的有力武器是治国和管理的重要手段是科学研究的有效工具P4

2.统计的特点数量性总体性(综合性)具体性

3.统计工作过程统计设计→统计调查→统计整理→统计分析

4、统计设计就是根据统计活动的目的,结合研究对象的性质、特点,对统计范围、统计指标、分类目录、资料搜集整理方法、分析要求及有关组织工作等方面所作出的整体规划。

5、统计调查就是根据统计活动的目的所确定的统计指标,把研究对象中各总体单位的某些必须了解的特征记录下来。

6、统计整理就是根据统计设计的要求,将调查资料进行审核、分组、汇总、编制统计表等科学加工处理的过程,以便清晰地反映研究总体的综合特征。

7、统计分析就是根据统计研究的任务,以统计数据为基础,结合具体情况,运用静态和动态分析方法进行研究,肯定成绩,发现问题,找出原因,根据事物的本质及其规律性,提出解决问题的方法,更好地为社会主义现代化建设服务。

第三节统计学的若干基本概念

1、总体:指在某种共性的基础上由许多个别事物结合起来的整体。简言之总体是同质个体所组成的整体。三大特点:①同质性(共性)②大量性③差异性

总体可分为两大类:

①有限总体:指总体单位数有限而可以计数的总体(如全国人口普查)

②无限总体:指总体单位数无限不可以计数的总体(如在检验某种新工艺是否真正能够改善产品的性能的问题中)

2、总体单位:就是构成总体的个别事物,称为总体单位。简称单位。

3、总体与总体单位关系:总体和总体单位都是客观存在的事物,是统计研究的客体。都是根据统计研究的目的确定的。总体和单位是相对而言的,随着研究目的的不同、总体范围不同而变化。同一个研究对象,在一种情况下为总体,但在另一种情况又可能变成单位。

4样本从总体中抽取出一部分单位,作为代表这一总体的部分单位组成的集合体称为样本(或子样)。样本所包含的总体单位数被称为样本容量。其特点:样本的单位必须取自总体内部,不许总体外部单位参加。从一个总体可以抽取多个样本。样本的代表性和客观性。5标志是说明总体单位特征的名称由标志名称+标志值组成。

标志的分类:品质标志:说明总体单位属性方面的特征,其表现只能用文字、语言来描述。数量标志:说明总体单位数量方面的特征,需用数值来表现。不变标志:无

论是品质标志还是数量标志,所有总体单位共同具有的特征(或各单位有关标志的具体表现都相同)可变标志:总体各单位之间存在差异的标志,这类标志称作可变标志(或称变异标志)

6变异:可变的品质标志变量:可变的数量标志变量的具体表现就是变量值(或标志值)

变量按其取值确定与否,分为确定性变量和随机性变量。

变量按其数值表现是否连续,分为连续变量和离散变量。

任意两个变量值之间取值有限的称为离散变量。任意两个变量值之间取值无限的称为连续变量。

7 指标是说明总体数量特征的概念,由指标名称+指标值组成。

数量指标是反映总体范围、总体规模、总体水平的指标。质量指标是事物的性质、质量和管理水平的指标。表现为相对数和平均数。

8指标体系是由一系列相互联系的统计指标所组成的有机整体。

9指标与标志的联系与区别:

区别:指标是说明总体的,标志是说明总体单位的;指标必须能计量,而标志有可以用数值表示的数量标志和不能用数值表示的品质标志。联系:指标可以由标志汇总而来;指标和标志存在着相互变换关系。(由于总体和总体单位会随着研究目的不同而变化)

10统计数据

数据的计量尺度

根据对研究对象计量的不同精确程度,将计量尺度由低到高、由粗略到精确分为四个层次:定类尺度、定序尺度、定距尺度和定比尺度。

1 定类尺度

是最粗略、计量层次最低的计量尺度。按照客观现象的某种属性对其进行分类。这一场合的所使用的数值只是作为各种分类的代码,并不反映各类的优劣、量的大小或顺序。

2 定序尺度

是对客观现象各类之间的等级差或顺序差的一种测度。利用定序尺度不仅可以将研究对象分成不同的类别,而且还可以反映各类的优劣、量的大小或顺序。

3 定距尺度

对现象类别或次序之间间距的测度。定距尺度不但可以用数表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。定距尺度使用的计量单位一般为实物单位(自然或物理)或者价值单位。定距尺度的主要数学特征是“+”或“–”。统计中的总量指标就是运用定距尺度计量的。

4 定比尺度

是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成相对数(或平均数),用于反映现象的结构、比重、速度、密度等数量关系。例如,将一个企业创造的增加值与该企业的职工人数对比,计算全员劳动生产率,以此反映该企业的生产效率。定比尺度的主要数学特征是“×”或“÷”。

数据的类型

横截面数据和时间序列数据

横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。时间序列数据又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据。

数据的表现形式1 绝对数2 相对数3 平均数

第二章统计调查

第一节统计调查概述

1统计调查是指根据统计研究的目的和任务,运用科学的调查方法,有组织有计划地就某一标志向总体中的各个总体单位搜集数字资料的过程。

2统计调查的基本原则要实事求是,如实反映情况(准确性原则)要及时反映,及时预报(及时性原则)要数字与情况相结合(完整性原则)

3统计调查的意义统计调查是指根据统计研究的目的,有组织有计划地搜集统计资料的过程。统计调查是统计工作的第一阶段,是整个统计工作的基础一环节。

第一节统计调查的组织形式

1普查是根据统计的特定目的专门组织的一次性全面调查。

组织原则:1.要规定调查资料所属的标准时点。2.在普查范围内,各调查单位或调查点尽可能同时进行,并尽可能在最短期限内完成3.调查项目一经统一规定,不能任意改变或增减,以免影响综合汇总,降低普查资料的质量。

特点:第一,非经常性的调查,一般间隔较长的时间才进行一次;第二,它是一种全面调查,比任何一种调查形式更能掌握大量、详细、全面的统计资料。

2抽样调查是一种非全面调查,按抽选调查单位方法的不同,分为随机抽样调查和非随机抽样调查。

随机抽样调查(概率抽样调查)

(1)定义:随机抽样调查是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征。

(2)特点:第一,样本单位按随机原则抽取,排除了主观因素对选择的影响;第二,根据部分调查的实际资料对调查对象总体数量特征作出估计;第三,抽样误差可以事先计算并加以控制。

非随机抽样调查(非概率抽样调查)

非随机抽样调查是指调查者有意识地或随意而非随机地从总体中抽取部分单位进行调查的统计方法。非随机抽样不遵循随机原则,所以一般不用于推断总体指标,其调查误差也难以事先计算。

3重点调查是从总体中选择一部分重点单位进行调查,用以反映总体基本情况的一种非全面调查。重点单位:是指这部分单位在我们所关心的标志上的标志总量占有绝大的比重。

4典型调查是在对调查对象有一定了解的基础上,有意识地选择少数典型单位进行的调查。典型单位:是它的某种数量表现最具有普遍意义,最有代表性。

5统计报表是依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级定期提供统计资料的一种调查方式。

特点:第一,报表资料的来源建立在基层单位的各种原始记录的基础上,基层单位可利用其资料对生产、经营活动进行监督管理;第二,各级领导部门能获得管辖范围内的报表资料了解本地区、本部门的经济和社会发展情况;第三,统计报表属于经常性调查,调查项目相对稳定,有利于积累资料,并进行动态对比分析。

第二节统计调查的方法

统计调查方法统计资料搜集方法是指搜集调查对象原始资料的方法,即调查者向被调查者搜集答案的方法。常用的方法有直接观察法、报告法、采访法等。

一、直接观察法二、报告法三、采访法四、通讯法五、实验调查法六、网上调查法

P19

第三节调查方案与问卷设计

1调查方案:指关于统计调查完整的工作计划。

基本内容a调查目的b调查对象、调查单位和报告单位c设计调查项目d设计调查表格和问卷e调查时间和地点f调查的方式、方法g调查工作的组织实施计划P20

2问卷设计P22

3调查技术a自由回答法b二项选择法c多项选择法d赋值评价法e空位填答法f等级定位法g排序顺位法h比较选择法i连线配合法P23

第四节调查误差

1调查误差是指调查所得统计数字与调查对象的实际数量之间的差异。

种类(1)工作误差(由于人的主观故意或失误而产生的误差,理论上它可以用某种方法加以避免)(2)代表性误差(只有在非全面调查中才有(不可避免、可减少),全面调查不存在这类误差)

2控制调查误差的办法(一)正确周密地制定统计调查方案(二)健全原始记录,完善统计台账(三)加强对统计人员的培训,提高统计人员的素质(四)加强对调查资料的审核(五)科学地抽取样本和选择典型(六)加强统计司法,严惩弄虚作假行为

第三章统计整理

第一节统计整理的基本问题

1统计整理:根据统计研究的目的和要求,对调查所得原始材料进行科学分组与汇总和对以往的材料进行再加工,使之系统化、条理化成为能反映事物总体特征的综合资料的过程。

2计整理意义统计整理是整个统计工作和研究过程的中间环节,起者承前启后的作用,是统计调查的继续也是统计分析的基础。统计整理最后的结果就是形成各种统计表格和统计图。3统计整理的程序审核;分组;汇总;制图表P27

第二节统计整理的审核

一、审核资料的完整性和及时性二、审核资料的准确性三、历史资料的审查四、资料审查后的修正P29

第三节统计分组

1统计分组就是根据统计研究的需要,按照一定的标志,将总体中所有单位划分为若干个组成部分的一种统计方法。P29

2统计分组的作用划分不同的社会经济现象说明现象总体的内部结构及比例关系分析社会现象之间的依存关系P29

3统计分组的种类P31

4统计分组的原则:

穷尽原则:使总体中的每一个单位都应有组可归(每个孩子都有家可归),或者说各分组的空间足以容纳总体所有的单位。

互斥原则:就是在特定的分组标志下,总体中的任何一个单位的只能归属于某一组,而不能同时或可能归属于几个组。

5统计分组的方法P33

(1)品质分组:按品质标志分组事物本身的属性特征;统计研究的要求

(2)数量分组:按数量标志分组。应注意问题:第一,分组时数量界限的确定必须能反映事物的差别;第二,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。

(A)单项式分组与组距式分组

单项式分组:用一个变量值作为一组,形成单项式变量数列。一般适用变动范围不大的离散型变量。

组距式分组:将变量依次划分为几段区间,一段区间表现为从“……到……”距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。区间的距离就是组距。适用于连续型变量或者变动范围较大的离散型变量。

(B)间断组距式分组和连续组距式分组

组距式分组中,每组包含许多变量值,每一组变量值中,其最小值为下限,最大值为上限。组距是上下限之间的距离,相邻的界限,称为组限。

凡是组限不相连的,称为间断组距式分组。凡是组限相连的,即以同一数值作为相邻两组的共同界限,称为连续组距式分组。P34

(C)等距分组与异距分组

等距分组就是标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。凡是在标志值变动比较均匀的情况下,都可采用等距分组。

异距分组即各组的组距不相等。一般地,异距分组适用于以下几个场合:一是标志值分布很不均匀;而是标志值相等的量具有不同意义;标志值按一定比例发展变化。

6分组标志:是指将总体划分为性质不同的组的标准或依据。分组标志选择的要求:1、要符合统计研究的目的和要求2、必须选择最主要的标志作为分组依据3、要考虑社会经济现象所处的具体历史条件即将总体分为几组。P32

7组数和组距P33

8组限和组中值P35

第四节统计汇总

1统计汇总:即在统计分组的基础上,将统计资料归并到各组中去,并计算各组和总体的合计数(包括单位总数和标志总量)的工作过程。意义:揭示出总体的数量特征组织形式:逐级汇总集中汇总汇审汇编综合汇总方法,手工和计算机P36

第五节分布数列

1分布数列的定义P37

2 分布数列的两个要素P38 频数频率

频数密度=频数/组距频率密度=频率/组距累计频数与累计频率

3分布数列的种类P39

单项式数列组距式数列(等距和异距数列)

钟型分布数列、U型分布数列和J 型分布数列

钟型分布数列分为正态分布和偏态分布数列(右偏和左偏)

第六节统计资料的显示

1统计表P49

2统计图P53

第四章总量指标和相对指标

第一节总量指标

1总量指标又称绝对指标,或简称绝对数,是反映社会经济现象在一定时间、地点条件下规模或绝对水平的综合指标。其表现形式:绝对数

2总量指标的种类

总体总量标志总量时期指标时点指标实物指标价值指标劳动量指标P61

3计算和运用总量指标应注意的问题正确确定指标含义、计算范围、指标界限。同类实物总量指标才能相加。使用统一计量单位。把总量指标与相对指标和平均指标结合起来使用。第二节相对指标

1相对指标是两个有联系的统计指标进行对比的比值。也称为相对数。

作用1 说明社会经济现象之间的数量对比关系2 把社会经济现象的绝对差异抽象化,使原来不能直接对比的统计指标可以进行对比。

表现形式无名数①成数:将对比的基数化为10 ②系数和倍数将对比的基数化为1③百分数、千分数、万分数有名数:有具体内容的计量单位的数值。单名数和复名数

2相对指标的种类计划完成相对数结构相对数比例相对数比较相对数动态相对数强度相对数P65

第五章平均指标

第一节平均指标的意义和特点P73

1平均指标指同质总体某一标志在一定时间、地点、条件下所达到的一般水平,是总体的代表值,它描述分布数列的集中趋势。特点、同质性(前提)代表性抽象性作用、可以比较同类现象在不同单位、不同地区间的平均水平。可以比较同类现象在不同时期的平均水平。可用于研究事物之间的依存关系。利用平均数还可以进行推算和预测。种类数值平均数算术平均数调和平均数几何平均数位置平均数众数中位数P75 P89

第二节算术平均数

1算术平均数是总体各单位某一数量标志的平均数。算术平均数=标志总量÷总体总量

2算术平均数与强度相对数的比较

1、概念不同。强度相对数是两个有联系而性质不同的总体对比而形成相对数指标。算术平均数是反映同质总体单位标志值一般水平的指标。

2、主要作用不同。强度相对数反映两不同总体现象形成的密度、强度。算术平均数反映同一现象在同一总体中的一般水平。

3、计算公式及内容不同。算术平均数分子、分母分别是同一总体的标志总量和总体单位数,分子、分母的元素具有一一对应的关系,即分母每一个总体单位都在分子可找到与之对应的标志值,反之,分子每一个标志值都可以在分母中找到与之对应的总体单位。而强度相对数是两个总体现象之比,分子分母没有一一对应关系。

3种类简单算术平均数加权算术平均数P75

4权数——指在计算总体平均数或综合水平的过程中对各个数据起着权衡轻重作用的变量。可以是绝对数形式,也可以是比重形式(如频率)来表示。

5算术平均数的数学性质P80

6交替标志平均数概念:交替标志又称是非标志,它是一个只有两种答案的标志。表示形式公式P82

第三节调和平均数

1调和平均数又称倒数平均数,是变量倒数的算术平均数的倒数。变量X的调和平均数是该变量的各个变量值的倒数的算术平均数的倒数。简单调和平均数和加权调和平均数。P83 2应用调和平均数应注意问题变量x的值不能为0。调和平均数和算术平均数易受极端值的影响。要注意其运用的条件。

第四节几何平均数

1几何平均法是n个变量连乘积的n次根。

2适用条件适用于各个变量值之间存在连乘积关系的场合。对数正态分布或近似对数正态分布资料;等比级数资料。主要用于计算现象的平均发展速度也适用于对某些具有环比性质的比率求平均.

3公式:简单几何平均法加权几何平均法P87

4应注意的问题变量数列中任何一个变量值不能为0,一个为0,则几何平均数为0。用环比指数计算的几何平均易受最初水平和最末水平的影响。几何平均法主要用于动态平均数的计算。

第五节众数和中位数P89

1众数是指变量数列中出现次数最多或频率最大的变量值

2中位数将总体单位的某一数量标志的各个数值按照大小顺序排列,居于中间位置的那个数值就是中位数

第六节几种平均数的关系P94

1算数平均数、众数和中位数的关系

2算数平均数、调和平均数和几何平均数的关系

第七节计算和运用平均数的原则

只能在同质总体中计算。总平均数要与组平均数结合运用。平均数必须同绝对数和具体事例结合应用

第六章变异度指标

第一节变异度指标的意义

1变异度指标又称标志变动度指标,是综合反映总体各单位标志值及其分布的差异程度的指标。作用a衡量平均数的代表性。变异度指标值与平均数的代表性大小成反比。变异度指标值(离散程度)越大,平均数的代表性就越小。b衡量现象变动的离散程度、稳定性和均衡程度。变异度指标越小,现象变动的稳定性和均衡程度越高。c计算抽样误差和确定样本容量的依据。

2变异度指标的种类全距四分位差平均差标准差方差离散系数偏度峰度P100

第二节变异度指标的计算

全距P101 四分位差P101 平均差P102 标准差和方差P104 离散系数P111

第三节偏度与峰度

偏度P112、峰度P117 偏度和峰度的简捷计算及应用P 118

第七章概率与概率分布

第一节概率基础P124

1确定性现象在一定条件下必然出现(或不出现)某种结果的现象。

2随机现象在给定的条件下不能确切预言其结果的现象。

3随机事件及其运算

概率P124 古典概率实验概率

条件概率乘法公式独立事件

第二节离散型随机变量的概率分布P131

二项分布两点分布泊松分布超几何分布

第三节连续性随机变量的概率分布P133

正态分布

第四节极限定理P136

大数定理中心极限定理

第八章抽样与参数估计

第一节抽样调查P143

概念作用特点

第二节抽样的基本概念P144

总体样本参数统计量样本量样本可能量重复抽样不重复抽样第三节抽样分布P145

1抽样分布的概念总体分布抽样分布样本值分布

2样本平均值得抽样分布分重复抽样和不重复抽样两种情况146

3样本成数的抽样分布分重复抽样和不重复抽样两种情况152

4样本方差的抽样分布X2分布153

第四节参数估计P155

1概念

2估计量估计值点估计区间估计估计量的优良标准无偏性有效性一致性

3总体均值的区间估计157

4总体成数的区间估计159

5总体方差的区间估计160

6样本量的确定必要样本量161

第五节抽样调查的组织形式P162

1 简单随机抽样抽样误差影响误差大小的因素163

总体均值的参数估计165

总体成数的参数估计167

样本量的确定168

小样本条件下的简单随机抽样169

2类型抽样概念

总体均值与总体总值得参数估计170

样本量的确定171各类型之间样本量分配171

3 等距抽样17

4 4 整群抽样176 5多级抽样178

第九章假设检验

第一节假设检验的意义P184

1假设检验是一种常用的统计推断方法。具体做法是首先对总体分布函数或数字特征做出某种假设,然后根据样本资料所提供的信息,在一定的概率保证下,判断假设是否合理,从而做出接受或拒绝假设的结论,达到推断总体分布函数和数字特征的目的。又称统计检验或显著性检验。类型参数假设检验非参数假设检验特点采用逻辑上的反证法依据统计上的小概率原理

2抽样估计与假设检验的必然联系(一)两者存在联系。(二)假设检验可以看成是区间估计中置信区间的另一表达方式。落在置信区间外的假设判定为具有显著性差异,不能接受;而落在置信区间里的假设则不能说存在显著性差异,因此不能拒绝。(三)两者考虑的问题不同,关心结论不同。

第二节假设检验的基本思路

1假设检验的思路与程序188

2双侧检验与单侧检验189

3Z检验与t检验190

第三节总体参数检验

总体均值检验192总体成数检验194总体方差检验196两类误差分析198

第十章相关与回归

第一节相关与回归的基本问题

1函数关系202

2相关关系概念及种类202

3回归概念与种类203

4 相关分析与回归分析的联系作用步骤204

第二节直线相关与简单直线回归分析

1相关图205

2简单直线回归分析特点简单直线回归方程205

3直线相关分析特点相关系数﹙离差平方和的分解相关系数R 2﹚显著性检验209

4估计标准误差212

5相关与回归计算上的关系回归到相关相关到回归213

第三节曲线相关与曲线相关回归分析

1概念和分类215

2可现行化的曲线回归方程变换及相关指数的计算215

第四节时间数列自身相关与回归分析

1 简单自身回归方程218

2自身相关系数

第五节复相关与复回归分析

1二元线性回归方程221

2复相关系数

第六节应用相关与回归分析应注意的问题225

第十一章时间数列与分析指标

第一节时间数列概述230

1时间数列(Time series): 是指将表明社会经济现象在不同时间发展变化的某种指标数值,按时间先后顺序排列而形成的数列。构成(1)资料所属的时间(2)在一定时间条件下的统计指标数值时间数列的概念、时间数列的种类、编制时间数列的原则作用可以描述社会经济现象在不同时间的发展状态和过程。可以研究社会经济现象的发展趋势和速度以及掌握发展变化的规律性。可以进行分析和预测。

2时间数列与变量数列的区别:(1)两者所包括的范围不同。时间数列是变量数列的一种。(2)两者的构成要素不同。时间数列由时间和发展水平构成,变量数列由变量和次数构成。(3)变量数列是建立在统计分组基础上的,时间数列不是分组数列

3分类绝对数时间数列﹙时期数列时点数列﹚相对数时间数列平均数时间数列

4时间数列的编制原则

前提条件:保证同一时间数列中各项指标值的可比性。时间长短应该可比。总体范围大小应该一致。指标的内容相同。计算方法和计量单位统一。

第二节时间数列的水平分析指标

1发展水平是指时间数列中每一具体指标值,反映某种社会经济现象在一定时期或时点所达到的规模或水平。在动态对比时作为对比基础时期的水平,称为基期水平;所要分析的时期的水平,称为报告期或计算期水平。232

2平均发展水平,也称序时平均数,是指根据时间数列中不同时期(或时点)上的发展水平计算出来的平均数。233

3序时平均数和一般平均数的比较

共同点:把社会经济现象的数量差异抽象掉。区别:一般平均数是将总体各单位在同一时间的数量差异抽象化,是根据变量数列计算的静态平均数;序时平均数是将同一总体在不同时间的数量差异抽象化,是根据时间数列计算的动态平均数。

4增长量(增减量)=报告期水平-基期水平237

5平均增长量是指逐期增长量的简单算术平均数,说明经济现象在一段时间内平均每期增减变化的数量。237

第三节时间数列的速度分析指标

1发展速度与增长速度238

2平均发展速度与平均增长速度239

3计算和运用速度指标应该注意的问题242 增长1%的绝对值

第十二章时间数列预测方法

第一节时间数列预测分析的基本理论245

1时间数列预测分析意义掌握事物发展规律,预测事物未来的前景,为各级政府和领导制定政策提供决策参考和依据。

2时间数列的因素分析按照影响的性质和作用形式,将时间序列的众多影响因素归结为以下四种:长期趋势( Trend )季节变动( Seasonal Fluctuation )循环变动(Cyclical V ariation)不规则变动(Irregular V ariations )

3时间数列预测分析的基本原理在长期趋势、季节变动、循环变动和不规则变动四种因素中,先剔除其余几种因素的影响来测定一种因素变动的影响;然后再结合起来测定各种因素变动的综合影响。结构模型:乘法模型、加法模型和乘加模型

第二节长期趋势预测

1时距扩大法248

2移动平均法249

3指数平滑法251

4最小平方法255

第三节季节变动分析

1同期水平平均法261

2同期比率平均法

3长期趋势剔除法263

第四节循环变动与不规则变动分析269

第十三章统计指数

第一节指数的意义与分类279

1指数的概念广义指数:指反映社会经济现象变动与差异程度的相对数。包括一切动态相对数和某些比较相对数。狭义指数就是指反映由不同度量的事物所构成的特殊总体变动或差异程度的特殊相对数。

2指数的作用1反映事物变动的方向和程度(如:居民消费物价指数);反映事物在空间上的差异程度(如:消费物价地区差指数)。反映事物之间的某些比例关系(如:工农业商品综合比价指数)进行因素分析(了解原因,如销售额的变动)

3指数的分类个体指数和总指数质量指标指数和数量指标指数定基指数和环比指数

时间数列指数、空间数列指数和属性数列指数综合指数、平均指数和平均指标指数

第二节综合指数

1综合指数即用综合法加总总体各部分数值来计算的指数

2综合指数由两个因素构成(1)指数化因素:即通过指数去反映其变化或差异程度的因素。(2)同度量因素:即将特殊总体中不同度量的事物转化为同度量事物的媒介因素。

综合指数的计算

第三节平均指数

1平均指数的概念285

2综合指数变形的必要性285

3加权调和平均指数286

4综合指数变形的一般原则287

第四节指数体系和因素分析法

1指数体系287

2因素分析法的意义288

3因素分析法应用应注意的问题289

4总量指标的因素分析289

5相对指标的因素分析291

6平均指标的因素分析292

7平均指标与总量指标相结合的因素分析293

第五节指数数列294意义和换算

第六节常用价格指数简介296

统计学名词解释

统计学名词解释 第一章绪论 1.随机变量:在统计学上,把取值之间不能预料到什么值的变量。 2.总体:又称母全体、全域,指具有某种特征的一类事物的全体。 3.个体:构成总体的每个基本单元称为个体。 4.样本:从总体中抽取的一部分个体,称为总体的一个样本。 5.次数:指某一事件在某一类别中出现的数目,又称为频数。 6.频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。 7.概率:某一事物或某一情在某一总体中出现的比率。 8.观测值:一旦确定了某个值。就称这个值为某一变量的观测值。 9.参数:又称为总体参数,是描述一个总体情况的统计指标。 10.统计量:样本的那些特征值叫做统计量,又称特征值。 第二章统计图表 1.统计表:是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。一般由表号、名称、标目、数字、表注组成。 2.统计图:一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。纵轴表示事物出现的次数或因变量,称为数值轴。一般由图号及图题、图目、图尺、图形、图例、图组成。 3.简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表,适合数据个数和分布范围比较小的时候用。 4.分组次数分布表:数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来,适合数据个数和分布范围比较大的时候用。 5.分组次数分布表的编制步骤: (1)求全距 (2)定组距和组数 (3)列出分组组距 (4)登记次数 (5)计算次数 6.分组次数分布的意义: (1)优点:A.可将杂乱无章数据排列成序,以发现各数据的出现次数及分布状况。B.可显示一组数据的集中情况和差异情况等。 (2)缺点:原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差,即归组效应。 7.相对次数分布表:用频数比率或百分数来表示次数 8.累加次数分布表:把各组的次数由下而上,或由上而下加在一起。最后一组的累加次数等于总次数。 9.双列次数分布表:对有联系的两列变量用同一个表表示其次数分布。

统计学名词解释简答

名词解释 统计总体:指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。统计总体的特征:同质性、差异性、大量性。 总体单位:个体,指构成总体的各个单位。 统计指标:简称指标,用来反映社会经济现象总体的数量特征的概念及其数值。任一概念都包含指标名称和指标数值。特征有总体性、数量性、综合性、具体性。 统计标志:在统计中,总体单位所具有的属性或特征的名称。标志是统计研究的起点,总体单位是标志的载体,是标志的承担者,统计研究是从登记标志开始的,并通过对标志的综合来反映总体的数 量特征。可分为品质标志和数量标志,或不变标志和变异标志。 统计调查:就是根据统计研究的预定目的、要求和任务,运用各种科学的调查方法,有计划、有组织地搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的原始资料的工作过程。 统计调查是整个统计工作的基础环节。统计调查的好坏,将影响统计资料的正确与否,从而影 响统计质量。统计调查的要求:准确性、及时性、全面性、系统性。 普查:是根据统计任务的特定目的而专门组织的一次性全面调查。调查范围:1.属于一定时点的社会经济现象的总量(如人口普查)。2.反映一定时期现象的总量(如出生人口总数)。优点:所获资料 更详细,有较高的准确性和时效性。缺点:工作量大,花费时间长,耗费大量的人力、物力和 财力。主要作用:在于掌握某些关系国计民生、国情国力的数据,获得比较准确的信息。 抽样调查:指从所要研究的总体中,按照随机原则,抽取部分单位进行调查,并将调查整理得出的数量特征,用以推断总体综合数量特征的一种非全面调查组织形式。特点:随机性、推断性。优点: 经济性、时效性、准确性、灵活性。应用范围:①对总体不可能或不必要进行全面调查,但要 掌握总体某些现象的全面数值②用抽样调查资料修正全面调查资料。作用:①承担全面调查无 法或很难承担的调查任务。如气象调查。②与全面调查结合,可以发挥相互补充、校对的作用。 ③进行生产过程的质量控制。④用来检验总体特征的某些假设,为行动决策提供依据。抽样调 查的组织形式:纯随机抽样、机械抽样、类型抽样、整群抽样、阶段抽样。 典型调查:根据调查目的和要求,在对研究总体作全面分析后,有意识地从中选取少数具有代表性的单位进行深入调查研究的一种非全面调查。优点:节省人力、物力,既可搜集统计资料,又可分析 研究问题。缺点:资料不齐全,缺乏代表性。主要作用:1.弥补全面调查不足(获取其它统计调 查方法不能得到的统计资料;补充完善统计报表;验证全面调查数据的真实性。2.进行估算某些 指标数值。 重点调查:是一种非全面调查,是在调查对象中选择重点单位进行的调查,但这部分重点单位占总体的绝大比重。优点:省事、省力,能用较少的代价及时搜集到总体的基本情况和基本趋势。缺点: 资料受重点单位影响大,资料一般不齐全。 统计整理:就是根据统计研究的预定目的,对所搜集到的资料进行科学加工,使之条理化、系统化,建立统计数据库,以满足多方面、多层次的反复需要的工作过程。作用:统计整理是统计工作过程 的重要阶段,它是实现从个体单位标志值过渡到总体数量特征值的必经阶段,是统计分析的前 提。其质量的好坏会直接影响统计分析的效果。 绝对指标:又称总量指标,有时也称绝对数。是用来说明一定社会经济现象的规模、水平的总量。它包括总体总量和标志总量。 相对指标:又称相对数,是两个相联系指标的比值。作分母的指标为基数,分子为表数。通过相对指标可反映现象间的相互关系和对比关系。一般分为有名数和无名数。种类有:计划完成相对指标、 结构相对指标、比较相对指标、动态相对指标、强度相对数。 平均指标:又称统计平均数,它是度量频率分布集中趋势或中心位置的指标。也是社会经济统计中最常用的综合指标。它是在同质总体内各总体单位某一数量标志的一般水平。一般有两种分类:静态 平均数、动态平均数。

统计学名词解释

1、统计学 统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。 2、指标和标志 标志是说明总体单位属性或特征的名称。指标是说明总体综合数量特征和数量关系的数字资料。 3、总体、样本和单位 统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。简称总体。构成总体的个体则称为总体单位,简称单位。样本是从总体中抽取的一部分单位。 4、统计调查 统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。 5、统计绝对数和统计相对数 反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。 6、时期指标和时点指标 时期指标是反映总体在一段时期内累计总量的数字资料,是流量。时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。 7、抽样估计和假设检验 抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。 8、变量和变异 标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。 9、参数和统计量 参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。 10、抽样平均误差 样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。重复抽样的抽样平均误差为总体标准差的1/n。 11、抽样极限误差 抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。 12、重复抽样和不重复抽样 重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位时都放回的抽样方式。不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。13、点估计和区间估计 点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。 14、统计指数 广义上来说,它是表明社会经济现象的数量对比关系的相对指标。狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。 15、综合法总指数 凡是一个总量指标可以分解为两个或两个以上的因素指标时,将其中一个或一个以上的因素指

社会统计学的名词解释

社会统计学的名词解释 非参数检验:泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。符号检验:181页 配对符号秩检验:183页 秩和检验方法:把两个样本混合起来,从小到大进行编号;分别计算两个样本的秩和;;计算检验统计量U;如果计算出的U只小于或等于从附表10中查处的临界值,则零假设被拒绝。 游程检验:把样本1和样本2混合起来,按数值从小到大编号;点算游程数目,以混合样本中游程数目r为检验统计量。 确定性关系:一个变量值确定后,另一个变量值也就完全确定了。 非确定性关系:给定了一个变量值,另一个变量值还可以在一定的范围内变化。相关系数r:这一指标用来度量相关关系程度或强度。就线性相关来说,当\r\=1时,表示完全相关;当0<\r\<1时,表示不完全相关;当\r\=0时,表示无相关或零相关。 判断两个变量有因果联系的条件:(1)两个变量有共变关系;(2)两个变量之间的关系不是有其他因素形成的;(3)两个变量的产生和变化有明确的时间顺序。 列联表:按品质标志吧两个变量的频数分布进行交互分类,由于表内的每一个频

数都需同时满足两个变量的要求,所以列联表又称条件频数表。 消减误差比例(PRE)=(原来的误差—后来的误差)\原来的误差 Gamma系数:适用于测量两对称的定序变项的相关系数。 积差系数:两个定距变量之间的相关测量,最常用的就是积差系数。英国统计学家皮尔逊用积差方法推导出来的,所以也称皮尔逊相关系数,用符号r表示。回归:有一种力量使子辈个体身高趋向父辈平均身高,高尔顿把这种趋向中心的现象称之为回归。 拟合优度检验:检验总体是否具有正态或其他分部形式的非参数统计检验。 方差分析:他可以检验多个总体均值是否存在差异的统计检验方法。 时间数列:是某一指标的数值按时间按先后顺序排列而成的一个序列,也称动态数列。一般有两个基本要素构成:被研究对象所属的时间和反映该现象在各个时间上的统计指标数值。 增长量:总量指标报告期水平和基期水平之差,表明该指标在一定时期内增加和减少的绝对数量。(逐期增长量和累计增长量) 发展速度:反映社会现象发展程度的动态相对指标,即时间相对数。发展速度时报告期发展水平除以基期发展水平所得之商。如果这个比值大于1,表示水平提高了;如果这个比值小于1,表示水平下降了。(环比发展速度、定基发展速度)

统计学名词解释汇总

统计学名词解释汇总 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

1什么是统计学?统计方法可分为哪两大类?统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。方法有描述统计和推断统计两类2统计数据可分为哪几种类型?不同类型数据各有什么特点?按采取计量尺度,分类、顺序、数值型数据;按统计数据收集方法,观测、实验数据;按被描述对象与时间关系,截面、时间序列数据 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分;

截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 3举例说明总体、样本、参数、统计量、变量这几个概念:对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 4什么是有限总体和无限总体?举例说明 有限总体指总体的范围能够明确确定,而且元素的数目是有限可数的,如若干个企业构成的总体,一批待检查的灯泡。无限总体指总体包括的元素是无限不可数的,如科学实验中每个试验数据可看做是一个总体的一个元素,而试验可无限进行下去,因此由试验数据构成的总体是无限总体 5变量可分为哪几类? 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 6举例说明离散型变量和连续型变量

【缩印整理版】医学统计学名词解释及问答题

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。 总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。 抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。 标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数 区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。 参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常 置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法(标准误)、二项分布法。置信区间估计总体参数所在范围 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信区间包含总体参数的可 能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。 参数统计(parametric statistics) 非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。 变异(variation):对于同质的各观察单位,其某变量值之间的差异 同质(homogeneity):研究对象具有的相同的状况或属性等共性。 回归系数有单位,而相关系数无单位 β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。 线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。 参数(parameter):描述总体特征的统计指标。 统计量(statistic):描述样本特征的统计指标。实验设计的基本原则 对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组 重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。作用是估计变异大小和降低变异 随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误(假阳性错误)真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。其发生的概率用α表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误(假阴性错误)真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。其发生的概率用β表示。由于其取值取决于H1 ,因此在假设检验中无法确定。 变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。数值越大,说明数据越离散,反之越集中。极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation 平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode) 单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。最常用的方法是等距抽样 分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差,要求层内误差最小,层间误 差最大。 整群抽样先将总体分成若干“群”,从中随机抽取 几个群,抽取群内的所有观察单位组成调查样本。 “群”的确定与研究目的无关。为减少抽样误差, 需多抽几个“群”。 方差分析:又称变异数分析或 F检验,适用于对多 个平均值进行总体的假设检验,以检验实验所得的 多个平均值是否来自相同总体。 析因设计(factorial design)实验:凡同时配置两个 或两个以上处理因素,这些因素的各水平又具有完 全组合的实验,统称为析因设计(factorial design) 实验。 随机区组设计(randomized block design)是事先 将全部受试对象按某种可能与实验因素有关的特征 分为若干个区组(block),使每一区组内的受试对 象例数与处理因素的分组数相等,使每个实验组从 每一区组得到一例受试对象。 单向方差分析(one way analysis of variance)是指 处理因素只有一个。这个处理因素包含有多个离散 的水平,分析在不同处理水平上应变量的平均值是 否来自相同总体。 (2)计数资料:将观察单位按某种属性或类别分组, 所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。 其观察值是定性的,表现为互不相容的类别或属性。 如调查某地某时的男、女性人口数;治疗一批患者, 其治疗效果为有效、无效的人数;调查一批少数民 族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性 的不同程度分组,所得各组的观察单位数,称为等 级资料(ordinal data)。等级资料又称有序变量。如 患者的治疗结果可分为治愈、好转、有效、无效或 死亡,各种结果既是分类结果,又有顺序和等级差 别,但这种差别却不能准确测量;一批肾病患者尿 蛋白含量的测定结果分为+、++、+++等。 随机变量(random variable)是指取指不能事先确 定的观察结果。随机变量的具体内容虽然是各式各 样的,但共同的特点是不能用一个常数来表示,而 且,理论上讲,每个变量的取值服从特定的概率分 布。 变异系数(coefficient of variation)用于观察指标单 位不同或均数相差较大时两组资料变异程度的比 较。用CV 表示。计算:标准差/均数*100% 直线回归(linear regression)建立一个描述应变量 依自变量变化而变化的直线方程, 并要求各点与该直线纵向距离的平方和为最小。直 线回归是回归分析中最基本、最简单的一种,故又 称简单回归(simple regression)。 回归系数(regression coefficient )即直线的斜率 (slope),在直线回归方程中用b 表示,b 的统计意 义为X每增(减)一个单位时,Y平均改变b 个单 位。 相关系数r:用以描述两个随机变量之间线性相关 关系的密切程度与相关方向的统计指标。 秩次:变量值按照从小到大顺序所编的秩序号称为 秩次(rank)。 秩和:各组秩次的合计称为秩和(rank sum),是非 参数检验的基本统计量。 方差(variance):方差表示一组数据的平均离散情 况,由离均差的平方和除以样本个数得到。 检验效能:1- β称为检验效能(power of test),它是 指当两总体确有差别,按规定的检验水准a 所能发 现该差异的能力。 百分位数(percentile)是将n 个观察值从小到大依 次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是 确定医学参考值范围 随机误差(random error)又称偶然误差,是指排 除了系统误差后尚存的误差。它受多种因素的影响, 使观察值不按方向性和系统性而随机的变化。误差 变量一般服从正态分布。随机误差可以通过统计处 理来估计。 一、统计表有哪些要素构成的?制表的注意事项有 哪些? 一般来说,统计表由标题、标目、线条和数字、备 注五部分组成。但备注并不是必需的内容,可以根 据需要出现。 1简明扼要,重点突出:最好一张表突出一个中心, 不易太多中心,如果需要说明多个中心,可分成多 张统计表。 2合理安排主语和谓语的位置:对于表中任意一行, 从左至右,通过简短的连接词,可连成成一句通顺 的句子。 3表中数据要认真核对,保证准确可靠 二、为什么不宜用t 检验对多组均数进行比较? 如果用t检验进行多个样本均数的两两比较,则会 增加犯I 类错误的概率。 经检验得到拒绝H0 ,认为两组之间有差别的结论 可能犯I类错误的概率为α,不犯I类错误的概率为 1- α.每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数,上例α=0.05, k=3,则均不犯错误 的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I 类错误的概率为1-(1- α)k 三、方差分析的基本思想是什么? 按实验设计的类型,将全部观察值间的变异分解成 两个或多个组成部分,然后将各部分的变异与随机 误差进行比较(每个部分的变异可由某因素的作用 来解释),以判断各部分的变异是否具有统计学意 义,从而推断不同样本所代表的总体均数是否相同。 五、简述直线相关与回归的区别与联系 区别:1.回归说明依存关系,直线回归用于说明两 变量间数量依存变化的关系,描述y如何依赖于x 而变化;相关说明相关关系,直线相关用于说明两 变量间的直线相关关系,此时两变量的关系是平等 的 2.r与b有区别:r说明具有直线关系的两个 变量间相关的密切程度与相关方向; b表示x每改 变一个单位,y平均增(减)多少个单位; 3.资料要求不同:直线回归要求应变量 y是来自正态总体的随机变量,而x可以是来自正 态总体的随机变量,也可以是严密控制、精确测量 的变量,相关分析则要求x,y是来自双变量正态分 布总体的随机变量。 4.取值范围:-∞

统计学名词解释

一、名词解释 总体:指在同一组条件下所有成员的某种状态变量的集合;或者说是某一变数的全部可能值的集合;或性质相同的个体组成的整个集团. 样本:从总体中取出来用作分析、研究的个体称样本。 随机样本:总体中的每个总体单位都有同等的机会被抽取为样本单位,由这种方法抽得的样本叫随机样本.(用随机抽样的方法,从总体中抽出一个部分;等概率抽取的样本。)随机抽样:保证总体中的每一个体在每一次抽样中都有同等的机会被取为样本。 复置抽样:保证总体中的每个个体在每次抽样中都有同等的概率被取为样本。 样本容量:样本中包含的单位数称为样本容量。(样本中变量的个数.) 观察值:每一个体的某一性状测定值叫做观察值。 变数:若干有变异的观察值叫随机变数,简称变数。 连续性变数:指在任意两个变量之间都有可能存在只有微量差异的第三个变量存在,这样一类变数称为连续性变数. 间断性变数:只能取整数的一类变数。 参数:由总体获得的代表总体的特征数.(描述总体的特征数,如μσ .)统计数:由样本获得的代表样本的特征数。(描述样本的特征数。) 数量资料(数量性状资料):以测量或称重的方式获取的试验资料称为数量资料。 计量资料、质量性状资料 次数资料:凡是试验结果以次数表示的资料称为次数资料。 算术平均数、众数 几何平均数:变量对数的算术平均数的反对数, (lg) lg Y G n = ∑ 调和平均数:变量倒数的算术平均数的反倒数, 1 () n H Y = ∑ 中位数:将变量顺序排列,处在中间的变量称中位数,计作M d。极差:一组资料中最大值与最小值的差值为极差. 方差:变数变异程度的度量,对于总体 ()2 2i Y N μ σ - = ∑ ,对于样本 2 2 () 1 Y y s n - = - ∑ 。 (描述变量平均变异程度的统计量.定义为 2 1 2 () 1 n j j Y y s n = - = - ∑ 。) EMS:期望均方,是对均方MS的期望值。 标准差:变数变异程度的度量,总体标准差: () N Y ∑- = 2 μ σ ,样本标准 差: () 1 2 - - = ∑ n y Y s .(变数的平均变异量.) 标准误:统计数变异度的度量,12 y y y s s - == 。(统计数的标准差。)

统计学名词解释超级大全

统计学名词解释超级大全第一章导论 统计学:一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。 教育统计学:专门研究如何搜集、整理、分析在心理和教育方面对实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门科学。 描述统计:对实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均,如在集中量数中将原始数据进行平均,在差异量数中将离均差进行平均,在相关量数中将积差进行平均等等。 推断统计:又称抽样统计。它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应团体。换言之,就是根据已知的情况推测未知情况。 实验设计:研究如何更加合理、有效地获得观测资料,如何更正确、更经济、更有效地达到实验目的,以揭示试验中各种变量关系的实验计划。 统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。这种样本特性保持着总体特性的现象叫做统计常态法则。 小数永存法则:第一个样本中所表现出的特性,在其他样本中也会存在,这就是小数永存法则。此处“小数”是指小数量的意思。 大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不变的。

有效数字:指能影响测量准确性的数字。 变量:又称随机变量。具有变异性的数据。三个特性,离散型,变异性,规律性。 数据:某个数值一旦被取定了,则称这个数值为随机变量的一个观察值。即数据。 总体:性质相同的一类事物的全体。 个体:构成总体的每一基本单位或单元。 样本:总体抽出的部分个体。 参数:表示总体特征的量数。 统计量:直接从样本计算出的量数,代表样本的特征。 名称变量:指一事物与其他事物在属性、类别上不同。 顺序变量:事物的某一属性的多少或大小按顺序排列起来的变量。既无相等的单位又无绝对的零点的变量。 等距变量:只具有相等的单位,而没有绝对的零点的变量。 比率变量:既有相等的单位,又有绝对的零点的变量。 连续变量:指取值可以是某区间内任一数值的随机变量,它是指测量单位之间可以划分成无限多个细小单位,其数字形式多取小数。 离散变量:指测量单位之间不能再细分的数字资料,其数字形式常取整数。 计数数据:计算人或物的个数所获得的数据。 度量数据:用一定的测量工具或测量标准测量时所获得的数据。 指标:表明总体数量特征的概念和具体数值,又称统计指标,它是把各个个体的特征加总起来的综合结果。

《教育统计学》名词解释重点

第一章绪论 1,教育统计学是运用数理统计学的原理来研究教育问题的一门应用科学。 2,教育统计学分为描述统计、推断统计和实验设计三类。 (1)描述统计:计算集中量(算术平均数、中位数、众数、加权算术平均数、几何平均数、调和平均数)来反映集中趋势;计算差异量(全距、四分位距、百分位距、平均差、标准差、差异系数)反映离散程度;计算偏态量及峰态量反映分布形态;计 算相关量(积差相关系数、等级、点二列、二列、四分、C相关系数、肯德尔和谐 系数、多系列相关系数)反映一致性程度。 (2)推断统计包括总体参数估计和假设检验两部分。 3,随机现象三个特性:一,一次试验有多种可能的结果,其所有结果是已知的;二,试验之前不能预料那一种结果会出现;三,在相同条件下可以重复试验。 随机事件:随机现象的每一种结果。 随机变量:把能表示随机现象各种结果的变量称之 4,总体:是我们研究的具有某种共同特性的个体的总和。 样本数目大于30称为大样本,小于等于30称为小样本。 第二章数据的初步整理 1,教统资料来源有经常性资料和专题性资料。 专题性资料包括(1)教育调查。按调查方法分为现情调查、回顾调查和追踪调查;按调查范围分全面调查和非全面调查(抽样调查和典型调查)。(2)教育实验。分为单组实验(指对同一实验对象先后实施两种实验处理)、等组实验(指在甲乙两组条件基本相同的情况下,对之实行不同的实验处理)和轮组实验(指在实验组和对照组分别进行两种实验处理,并且每种处理各重复一次,也即每个或多个单组实验的联合) 2,数据的分类。按来源分为点计数据和度量数据;按随机变量取值情况分为间断型随机变量(取值个数有限、独立的、两个单位之间不能再划分细小单位、一般用整数表示,如优劣程度、品德爱好打分)和连续性随机变量(个数无限、单位之间可以再划分、可以用小数表示如身高体重、完成作业的时间等)。 3,频数分布表制作步骤:求全距;决定组数和组距;决定组限;登记频数。 4,用累计频数表示的频数分布表称为累计频数分布表。 第三章集中量 1,集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。 2,加权平均数:是不同比重数据(或平均数)的平均数。 几何平均数:是n个数值连乘积的n次方根。 调和平均数:是一组数据倒算的算术平均数的倒数,亦称倒数平均数。 第四章差异量 1,差异量是指表示一组数据变异程度或离散程度的量。差异量越大,表示数据分布越广,越不整齐;相反,表示分布越集中,变动范围越小。 2,全距是一组数据中最大值与最小值之差,又称极差,用R表示。 四分位距是指用依一定顺序排列的一组数据中间部分50%个频数距离的一半作为差异量指标。四分位距就是第三个四分位数(第75百分位数)与第一个四分位数(第25半分位数)差的一半。 百分位距是指两个百分位数之差。常用的有两种:一为第90与第10百分位数之差;一为第93与第7百分位数之差。 3,标准差越大,表明离散程度越大,即数据越参差不齐,分布范围越广。

统计学名词解释及简答题 .

名词解释 一、分类数据(categorical data )是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,使用文字来表述的。 二、顺序数据(ran k data )是只能归于某一有序类别的非数字型数据。 三、数值型数据(metric data )是按数字尺度测量的观察值,其结果表现为具体的数值。 四、系统抽样(systematic sampling )将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机的抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样。 五、非概率抽样(non-probability sampling )是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采取某种方式从总体中抽出部分单位对其实施调查。 六、抽样误差(sampling error )是由于抽样的随机性引起的样本结果与总体真值之间的误差。 七、四分位数(quartile)也称四分位点,他是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分为4部分,其中每部分包括25%的数据。 八、离散系数也成为变异系数(coefficient of variation ),它是一组数据的标准差与其相应的平均数之比。其计算公式为: s s v x = 离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 九、泊松分布(Poisson distribution )是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。 十、中心极限定理(central limit theorem ):设从均值μ、2σ(有限)的任意一个总体中抽取样本量为n 的样本,当n 充分大时,样本均值X 的抽样分布近似服从均值为μ、方差2σ/n 的正态分布。 十一、置信区间(confidence interval )在区间估计中,有样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信上限。 十二、显著性水平(significant level)是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05α=或0.01α=,这表明,当做出接受原假设的决定时,其正确的概率为95%或99%。 十三、方差分析(analysis of variance, ANOV A )就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。 十四、相关系数(correlation coefficient )是根据样本数据计算的度量两个变量之间线性关系强度的统计量。 十五、回归模型(regression model )对于具有线性关系的两个变量,可以用一个线性方程来表示他们之间的关系。描述因变量y 如何依赖于自变量x 和误差项ε的方程称为回归模型。 十六、点估计 利用估计的回归方程,对于x 的一个特定值0x ,求出y 的一个估计值就是点估计。点估计可分为两种:一是平均值的点估计;二是个别值的点估计。 十七、时间序列(time series )是同一现象在不同时间上的相继观察值排列而成的序列。 十八、指数平滑法(exponential smoothing )是通过对过去的观察值加权平均进行预测的一种方法,该方法使t+1期的预测值等于t 期的实际观察值与t 期的预测值的加权平均值。 十九、指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。指数是测定多项内容数量综合变动的相对数。这个概念中包含两个重点:第一个要点是指数的实质是测定多项内容;指数概念的第二个要点是其表现形式为动态相对数,既然是动态相对

统计学重点名词解释

什么叫因素或因子:所要检验的对象。因素的不同表现成为水平或处理,每个因子水平下得到的数据称为观察值。 无偏性:估计量抽样分布的数学期望等于被估计的总体参数。 有效性:对同一总体参数的两个无偏估计量,有更小估计差得估计量更有效。 一致性:随着样本量的增大,点估计量的值越来越接近被估总体的参数。 原假设:提出一个或两个参数是否等于或大于、小于某个特殊值的命题。。 备择假设:与原假设逻辑相反的假设。 点估计:就是用样本统计量的某个取值直接作为总体参数的估计值。 区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减误差得到。 置信水平:将构造置信区间的步骤重复很多次,置信区间包括总体参数真值的次数所占的比例。 方差分析就是通过检验个总体的均值是否相等来判断分类自变量对数值型因变量是否有相助影响 假设检验:利用样本信息,对提出的命题进行检验的一套程序和方法。 显著性水平:是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险 单因素方差分析:研究一个分类型自变量同数值型自变量之间关系的一种统计方法。。 离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比,是测度数据离散程度的相对值。离散程度:它反映的是各变量值远离其中心值的程度。 统计学:收集、处理、分析、解释数据并从数据中得到结论的科学。 统计量:描述样本特征的概括性数字度量。 误差的控制主要方法有:改变样本容量、构造不同的抽样框、注意问卷中得措辞方式以及对调查过程的质量控制。 估计量:用来估计总体参数的统计量的名称。根据一个具体样本计算出来的估计量数值称 为估计值。抽样调查的作用:应用范围广、调查结果准确可靠、调查速度快、节省调查费中位数:将所研究的总体中的各单位标志值按大小顺序排列,位于中点位置的那个标志值 就是中位数 小概率原理:是指在发生概率很小的随机事件再一次试验中几乎是不可能发生的。根据这一原理可以做出是否拒绝原假设的决定。 假设检验的流程: 提出原假设、被择假设。 确定适量的检验统计量,并计算其数值 P值决策: 决策规则:P《a 拒绝原假设。P越小,犯第一类错误(弃真)概率越小(当原假设为真时,得到的样本数据或更极端数据的概率) 为什么要选择方差分析? 方差分析采用同时考虑所有样本,因此排除了错误积累概率,从而避免拒绝一个真实的假设,不仅提高了效率同时又将所有的样本信息结合在一起,也增加了分析的可靠性。。 简述众数、中位数和均值的特点和应有场合? 答:众数是一组数据中出现次数最多的变量值,是一种位置代表值,不受极端值的影响,具有不唯一性,也可能没有众数,主要用于分类数据集中趋势的测度;中位数是一组数据排序后处在中点位置的变量值,也是位置代表值,不受极端值的影响,主要用于排序型数据集中

社会统计学名词解释

1.社会统计学 社会统计学是运用统计学的一般原理,对社会各种静态结构和动态趋势进行定量描述或推断的一种专门方法与技术。人们既用它来分析已经发生和正在发生的现象,也用它来估计预测未来可能发生的现象。 2.国势学派 产生于德国,其创始人为康令和阿亨瓦尔。该学派一直以统计学为名,但只用文字记述,不用数字计量,历史上人们将该学派称为“有名无实”学派。 3.政治算术学派 该学派的创始人为英国人格朗特和威廉·配第。该学派“用数字、重量、尺度来表达自己想说的问题”,虽然没有使用统计学这一名词,但所使用的社会宏观数量对比和分析方法揭示了统计学所要研究的内容,因此历史上人们将这一学派称为“有实无名”学派。马克思对配第评价很高,誉他为“政治经济学之父,在某种程度上也可以说是统计学的创始人”。 4.数理统计学派 该学派的创始人未比利时人凯特勒,其最大的贡献就是将法国的古典概率论引入统计学,用纯数学的方法对社会现象进行研究。由于把概率论引进统计学,使社会随机现象数量方面的研究提高了准确性。因此,一门兼有数学和统计学双重意义的学科被命名为“数理统计学”。凯特勒也被人称为“现代统计学之父”。 5.大量观察法 大量观察法,就是就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征。大量观察法是统计调查阶段的重要方法 6.大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可

能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。7.描述性统计 描述性统计,就是讨论范围仅以搜索的资料本身为限,而不予以扩大。早期的统计都是描述统计。 8.推论性统计 推论性统计,主要是依据概率论,研究如何依据有限资料对总体性质作推断,从而使统计的功能大为扩充。是在树立统计学派之后发展起来的,属于比较现代的统计分析方法。9.样本和(或)样本总体 样本或样本总体,是通过抽样得到的用以推断总体特征的那个“部分”。 10.标志 标志是说名总体单位属性或数量特征的名称。 11.虚拟变量 当品质标志的变异性用离散变量来表达时,这个变量可称虚拟变量。 12.指标体系 指标体系就是一系列有内在联系得统计指标集合体。 13.总体和总体单位 总体,就是作为统计研究对象的、由许多具有共性的单位构成的整体。也有人称之为母体。构成总体的每一个个体称为总体单位,简称单位,也称为个体。 14.中位数 把总体单位某一数量标志的各个数值,按大小顺序排列,位于正中处的变量值即为中位数。 15.众数

相关文档