27871统计学基础复习资料整理

27871统计学基础复习资料整理

统计学基础

项目1 基础知识

第1讲统计的基本问题

统计理论的产生和发展

1. 国势学派:又称记述学派,产生于17世纪的德国,首先使用了“统计学”这

个名词。(有统计学之名,无统计学之实)

2. 政治算术学派:起源于17世纪英国,主要代表人物是威廉.配第,著的《政

治算术》,可以说是统计学的创始人。(无统计学之名,有统计学之实) 3. 数理统计学派:产生于19世纪比利时,主要代表人物凯特勒,他完成了统计学和概率论的结合,形成了数理统计学。

统计的含义

有统计工作、统计资料和统计学三种含义

1.统计工作:即统计实践,是对社会经济现象以及自然现象的总体数量进行搜集、整理和分析的活动过程。

2.统计资料:即统计数据,是统计工作的成果,是统计工作过程中所取和的反映社会经济实际情况和变化过程的数字资料,是社会绿洲信息的主体,也是国家制定政策、计划和实行科学管理的数字资料。

3.统计学:是研究统计工作的理论与方法的一门方法论科学,是长期统计工作实践经验和相关理论的科学概括和总结。

4.统计的三种含义之间有着密切的联系。统计资料是统计工作实践的成果,统计学来源于统计工作,是统计工作经验的理论概括,又用理论和方法指导统计工

作,推动统计工作不断提高。随着统计工作的进一步发展,统计学不断地充实和提高,二者是理论和实践和关系。由于统计工作、统计统计学联系紧密,所以习惯上把这三者通称为统计。

统计学的性质

统计学历经三百多年的发展,现在已经成为一门横跨社会科学,自然科学等领

域的综合性学科。

第2讲统计学的研究对象和研究方法

1. 统计学的研究对象是统计研究所要认识的客体。研究对象为大量现象的数

方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。 2. 就性质来说,统计学是一门适用于自然现象和社会现象的方法论学科。 3. 统计学研究对象的特点:数量性、总体性、变异性和具体性。 4. 统计的工作过程:统计设计、统计调查、统计整理和统计分析。 5. 统计学的研究方法:大量观察法、统计

分组法、综合指标法、动态数列分析

法、指数分析法、抽样推断法、相关分析等。(其中大量观察法、统计分组法和综合指标法贯穿统计研究的全过程,是统计研究的基本方法。 6. 大量观察法:是对所研究的经济现象总体中的全部单位或足够量的单位进行

调查研究,以认识社会经济现象发展变化的规律性的一种统计研究方法。 7.

统计分组法:将总体各单位按照某种标志划分为若干组成部分,这种统计研究方法就是统计分组法。

8. 综合指标法:是指运用各种综合指标,是大量社会经济现象的各个方面进行

综合分析来反映总体一般数量特征的统计分析方法。

第3讲统计学的几个基本概念

1.统计总体:简称总体,就是我们要调查或统计的某一现象的全部数据的集合。

2.总体单位:是构成总体的各个个别单位,它是组成统计总体的基本单位,也是各项调查项目的直接承担者。

3(统计总体的特征:同质性、大量性、差异性。

4.同质性:是指总体中的每一个单位必须具有某种共同的性质。

5.大量性:是指构成总体的总体单位必须是大量的。

6.差异性:是指同一总体中的总体单位除了保持同质性外,在其他很多方面必须存在差异。

7.统计总体分为有限总体和无限总体。

8.有限总体:是指统计总体中总体单位的数量是有限的。

9.无限总体:是指统计总体中总体瓣数量是无限的或者在实际生活中不可计数的。

10.品质标志表现只能用文字、语言来描述;数量标志表现是用数值来表示的。

11.标志的分类:

(1)标志按照其性质可以分为品质标志和数量标志。

(2)标志按照在不同的总体单位之间是否有变化,可分为不变标志和可变标志。 12.变量的分类:

(1)变量按其变动规律可分为定性变量和随机变量。

定性变量:变量的变化呈现一定的规律性,在一定程度上人们可以预知的变量称为定性变量,也称确定性变量。

随机变量:变量的变动没有一定的规律,人们不能预知其变动结果。

(2)变量按其数值特征可分为连续变量和离散变量。

连续变量:数值特征呈现连续状态的变量称为连续变量。

离散变量:数值特征呈现离散状态的变量称为离散变量。

13.统计标示:简称指标,是反映同类社会经济现象总体综合数量特征的范畴及其具体数值。(完整的指标应包括指标名称、指标数值、指标所属时间、指标所属空间范畴和环境条件等四个要素)

14.统计指标的类型:

(1)统计指标按其反映对象的数量特点不同,分为数量指标和质量指标。

(2)统计指标按其计算形式不同,分为总量指标、相对指标和平均指标。 15.统计指标和标志的区别和联系:

区别:(1)统计指标是说明总体数量特征的,而标志是说明总体单位特征的。

(2)统计指标都必须可量,而标志未必都可量,例如品质标志就不可量。联系:(1)统计指标的数值是邮总体单位的数量标志值进行直接汇总或间接计算分析而来的。

(2)统计指标和数量标志之间存在着转换关系。

项目2 统计调查

第1讲统计调查概述

1. 统计调查:是按照统计的任务和调查的目的要求,运用科学的方法搜集或者

收集被研究对象的各个标志值的过程。

2. 统计调查的要求:准确性、及时性、完整性、系统性。

3. 统计调查的种类:

统计调查按组织形式,可分为统计报表和专门调查 (1)

(2) 统计调查按研究总体的范围,可分为全面调查和非全面调查 (3) 统计调查按调查登记的时间是否连续,可分为连续调查和非连续调查 (4) 统计调查按搜集资料的方法分为直接调查、凭证调查、采访调查、问卷

调查。

(5) 此外,也有人根据调查工作时间的周期长短,交统计调查划分为经常性

调查和一次性调查。(经常性调查是批调查周期在一年以内的调查,间隔

超过一年的为一次性调查。)

4. 统计调查的方式:统计报表、普查、抽样调查、重点调查、典型调查等

5. 统计报表:是按国家统一规定的表式,统一的指标项目、统一的报送时间,自下而上逐级定期提供基本统计资料的调查方式方法。

6. 普查是专门组织的不连续性全面调查。普查和全面统计报表都属于全面调查,普查属于不连续调查,而全面统计报表属于连续调查。

7. 抽样调查:是按随机原则从总体中选取一部分单位进行观察,用以推算总体数量的一种非全面调查。

8. 抽样调查的特点:

(1)既是非全面调查,又要达到对总体数量特征的认识。

(2)按随机原则去抽取调查单位。

(3)抽样调查具有经济性、时效性、准确性、灵活性等特点。 9. 抽样调查的作有:

(1)能够解决全面调查无法或难以解决的问题。

(2)可以用补充和订正全面调查的结果。

(3)可用于生产过程中产品质量的检查和控制。

(4)可用于对总体的某种假设进行检验。

10.重点调查:是专门组织的一种非全面调查,它是对所要调查的全部单位选择一部分重点单位进行调查。

11. 典型调查:有意识的选择若干具有的单位进行调查,借以认识事物发展的规律。

12(典型调查的选典方法:

(1)解剖麻雀法

(2)划类选典法

(3)抓两头法

13. 典选调查的特点:

(1)深入细致的调查,既可以搜集数字资料,又可以搜集不能用数字反映的实际情况

(2)调查单位是有意识的选择出来的若干有代表性的单位,它更多地取决于调

查者主观判断和决策。

第2讲统计调查的方案设计

1. 一个完整的调查方案,应包括以下基本内容:

(1) 确定调查目的

(2) 确定调查对象和调查单位

(3) 确定调查项目和拟定调查表

(4) 确定调查时间和调查期限

(5) 确定调查工作的组织实施计划

第3讲统计调查的方法

1. 统计调查中常用的调查方法有:观察法、询问调查法、实验法、报告法、网

上调查法等。

2. 观察法:又称直接观察法,是由调查人员到现场亲自对调查对象进行观察、

计量、登记,以取得第一手资料的方法。

3. 询问调查法:又称直接调查法,是调查人员以询问为手段,从调查对象的回

答中获得信息资料的一种方法。(它是市场调查中最常用的方法之一) 4. 实验法:是指通过某种实践活动的验证法去收集有关资料的调查方法。 5. 报告法:是由调查单位根据各种原始记录和核算资料,按照统一的表格及填

报要求,及时向有关单位提供统计资料的一种调查方法。 6. 网上调查法:是一种利用因特网作为媒介的调查方式。(是最流行的) 第4讲调查问卷的设计

1. 问卷:又称调查表或询问表,是统计调查的重要工具,是一种以书面形式记

载和反映被调查对象的反映和看法,从而获得所需资料和信息的表式。 2. 问卷设计:是根据调研目标和所需资料内容,按照一定的格式将调查问题有序排列,形成调查表的活动过程。

3. 问卷的基本结构:前言、主体、编码、结束语等。

4. 问卷设计的程序:

(1) 确定调研目的、来源和局限阶段

(2) 分析样本特征,确定问卷类型阶段

(3) 确定数据收集方法阶段

(4) 确定问题回答形式阶段

(5) 决定问题的措辞阶段

(6) 确定问卷的流程和编排阶段

(7) 确定问卷和编排阶段

(8) 获得各方面的认可阶段

(9) 预先测试和修订阶段

(10)准备最后的问卷阶段

(11)具体实施阶段

5. 问卷设计要注意的问题:

(1) 文字要表达准确。

(2) 问卷要避免使用引导性的语句。

(3) 问卷问句设计要有艺术性,避免对填卷人生刺激而不能很好地合作

(4) 问卷不要提不易回答的问题。

(5) 问题设计排列要科学

(6) 使用统一的参考架构

(7) 有利于数据的处理。

项目3 统计整理

第1讲统计整理概述

1. 统计整理:是对统计调查所搜集到的原始资料进行科学的加工整理,使用之

条理化、系统化,氢反映总体单位的大量原始资料,转化为反映总体的基本统计指标,统计工作的这一过程。

2. 统计整理的内容:

(1) 根据研究任务的要求,选择应整理的指标,并根据分析的需要确定具体

的分组。

(2) 对统计资料进行汇总。

(3) 通过统计表描述汇总的结果。

3. 统计整理的步骤:

设计整理方案 (1)

(2) 对调查资料进行审核、订正

(3) 进行科学的分组

统计汇总 (4)

(5) 编制统计表,绘制统计图

第2讲统计分组

1. 统计分组:是根据研究任务的要求和现象总体的内在特点,将统计总体按照

一定的标志划分为性质不同而有联系的若干组成部分的一种统计方法。 2. 从统计分组的性质来看,具有两方面的含义。对总体而言是“分”,而对于总体单位而言是“合”。

3. 统计分组的作用:

(1) 可以区分社会经济现象的类型

(2) 可以研究总体内部结构

(3) 可以提示现象之间的依存关系

4. 统计分组的类型:

(1) 按照分组标志的多少不同,统计总体可以采用简单分组,也可以采用复

合分组。(简单分组:是对总体按一个标志进行分组;只反映现象在某一

特征方面的差异情况。复合分组:是指对总体用两个或两个以上的标志

进行层叠分组。)

(2) 按照分组标志的性质不同,统计总体可以按品质标志分组,也可以按数

量标志分组。(品质分组:是指选择反映事物属性差异的品质标志作为分

组标志进行分组;数量分组:也称变量分组,是指选择反映事物数量差

异的数量标志作为分组标志进行分组。)

5. 数量分组中常的几个概念:

(1) 全距:也叫极差,是变量数列中所有变量变动的最大范围,常用R表示

(全距(R)=最大变量值-最小变量值

(2) 组限:是各组变量值的变动界限,是组与组之间的分界点。 (3) 闭口组和开口组

(4) 组距

(5) 组中值(组中值=(上限+下限)/2=下限+组距/2=上限-组距/2 第3讲分配数列

1. 分配数列:是统计整理结果的一种重要表现形式,也是统计分析的一种重要

方法。

2. 分配数列的种类:品质分配数列、变量分配数列。

3. 品质分配数列:按品质标志分组形成的分配数列。

4. 变量分配数列:按数量标志分组形成的根本数列。

5. 分配数列的编制(方法):

第一步,将原始资料按其数值大小重新排列

第二步,确定全距

第三步,确定组距和组数

第四步,确定组限

第五步,编制变量分配数列

第4讲统计表和统计图

1. 统计表:是指用纵横交叉的线条所绘制的用以表现统计资料的表格(它是表

现统计资料的一种最主要的形式)

2. 统计表的构成:

(1) 统计表从形式上看由标题、横行标题、纵栏标题、指标值四个组成部分

构成。

(2) 统计表从内容上看包括主词和宾词两部分。

3. 统计表的种类:按照统计表的主词是否分组及分组的程度,分为简单表、分

组表和复合表

4. 统计图,常用的统计图有条形图、折线图、饼状图和曲线图。项目4 综合指标

第1讲总量指标

1. 总量指标:是反映某种社会经济现象在一定时间、空间和条件下的总规模、

总水平或工作总量的综合指标,是最基本的统计指标。(由于总量指标的表现形式为绝对数,因为,总量指标又叫统计绝对数)

2. 总量指标在社会经济统计中的作用

(1) 总量指标是认识社会经济现象的起点

(2) 总量指标是实行社会经济管理的依据之一

(3) 问题指标是计算相对指标和平均指标的基础(相对指标和平均指标一般

都是由两个有联系的问题指标相对比而计算出来的,它们是总量指标的

派生指标)

3. 总量指标的种类:

(1) 按总量指标所反映的内容不同,分为总体单位总量和总体标志总量。(总

体单位总量是反映总体或总体各组单位的问题指标。它是总体内所有单

位的合计数,主要用来说明总体本身规模的大小。总体标志总量是反映

总体或总体各组标志植总和问题指标。)

(2) 按总量指标所反映的时间状况不同,分为时期指标和时点指标。(时期指

标是反映现象在一定时期内发展过程的问题指标。时点指标是反映现象

在某一时点上所处状况的总量指标。)

(3) 按总量指标所采用计量单位不同,分为实物指标、价值指标和劳动指标。

4. 总量指标的计算方法:直接计算法、间接计算法

5. 计算和应用总量指标应注意的问题:

(1) 明确规定每项指标的含义和范围

(2) 注意现象的同质性

(3) 正确确定每项指标的计量单位

第2讲相对指标

1. 相对指标:又称相对数,是社会经济现象中两个相互有联系的指标数值之比所得比率或比值,用以反映现象的发展程度、结构、强度或比例关系。

相对指标=比数/基数

2. 相对指标在统计研究中的作用:

(1) 相对指标比绝对数指标更清晰地反映事物之间的发展变化程度、结构、

强度等,充分说明事物的本质。

(2) 相对指标可以使不能直接对比的总量指标找到可以对比的途径,进行更

为有效的分析。

3. 结构相对指标:是在总体分组的基础上,将总体划分为若干组成部分,以各

部分的数值与总体指标数值对比而计算的比重或比率。(结构相对指标=总体某一部分的数值/总体全部数值)

4. 比例相对指标:是由总体内部不同组成部分数值之间对比求得的相对数,它

反映的是总体各组成部分的数值联系程度和比例关系。(比例相对指标=总体中某一部分的指标数值/总体中另一部分的指标数值)

5. 比较相对指标:是在同一时期内地区与地区之间、部门与部门之间、单位与

单位之间的同类现象的指标进行对比的比率。(比较相对指标=甲空间上某项指标数值/乙空间上某项指标数值)

6. 计划完成程度指标:是指在一定时期内社会经济现象的实际完成数与计划任

务数之比,用以表明计划完成的程度,通常以百分数表示。(计划完成程度相对指标=(实际完成数/计划任务数)*100%)

7. 强度相对指标:是两个性质不同但又联系的指标进行对比的比值。(强度相对

指标=某一总量指标数值/另一有联系但性质不同的总量指标数值) 8. 动态相对指标:是把不同时期的同一类指标数值进行对比的比值,用以说明现象发展变化的方向和程度,一般用百分数或倍数表示。(动态相对指标=报告期指标数值/基期的指标数值)

9. 相对指标分析时注意的问题:

(1) 遵循对比指标的可比性原则

(2) 各种相对指标结合应用分析

(3) 相对指标与总量指标结合运用

练习题 P80—P86

第3讲平均指标

1. 平均指标:是同类社会经济现象一般水平的统计指标,其数值表现为平均

数,

因此平均指标又称统计平均数。

2. 平均指标可以分为算术平均数、调和平均数、几何平均数、中位数和众数

五种

3. 平均指标其作用具体表现在哪几个方面,

平均指标可以反映现象总体的一般水平 (1)

(2) 平均指标可和分组法、分配数列结合起来分析现象间的依存关系和总体

单位的具体分配状况以及平均数的实现过程。

(3) 平均指标可以用来对同类现象在不同空间、不同时间条件下的对比分析,

从而反映现象在不同地区之间的差异,揭示现象在不同时间之间的发展

趋势。

(4) 平均指标中的算术平均数、中位数和众数,可以研究总体单位分布的集

中趋势和离中趋势。

4. 算术平均数:是对总体各单位某一数量标志值之和的平均,它等于总体单位

某一数量标志之和除以总体单位数(算术平均数=总体标志总量/总体单位数) 5. 简单算术平均数公式:

(例)某学习小组6位同学的数学考试成绩分别为:70分、78分、82分、85

分、90分、98分,则该组6位同学的平均成绩为:

6. 加权算术平均数公式:

(例)某地区20家纺织企业的月产值资料统计表如下:,试计算20家纺织企业的平均月产值。

月产值(万元)x 企业数(家)f 各组产值(万元)xf

100 1 100

110 3 330

120 4 480

130 6 780

140 4 560

150 2 300

合计 20 2550

7. 调和平均数:也叫倒数平均数,是指总体各单位标志值倒数的算术平均数的倒数。(一般用字母H表式)

(例) 某企业3月份购进某种原材料三批,每批价格和采购金额见下表,试计算三批原材料的平均价格

批次价格(元/kg)x 采购金额(元)m 采购量(kg)m/x

1 40 20000 500

2 45 27000 600

3 50 10000 200

合计 -- 57000 1300

分析:已知每批价格(x)和采购金额(m),可用每批采购金额除以相对应的价格得出该批采购量,再用三采购总金额除以三批采购总量,即可求出平均价格。

7. 简单几何平均数公式:

(例)某机械厂有毛坯车间、粗加工车间、精加工车间、装配车间四个流水连续作业的车间,某月份第一车间制品合格率为95%,第二车间合格率为92%,第三车间合格率为90%,第四车间合格率为85%,计算四个车间平均产品合格率。因为产品总合格率为95%*92%*90%*85%,所以计算四个车间的平均产品合格率应该开方求其平均数

平均合格率G=

8. 加权几何平均数公式:

(例)假如银行存款是按复利计算,若定期存款25年的年利率如下:试计算平均年利率。

年份第1年第2~5年第6~13年第14~23年第24~25年年利率(%) 2(1 2.5 3.8 4.6 6.9 分析:要计算平均年利率,自先要将各年利率加1换算成年本利率,再计算平均年本利率,用平均年本利率减1(或100%)即可得到平均年利率。

9. 中位数:把部体各单位某一数量标志值按大小顺序排列,居于中间位置的标

志值。

一、根据未分组资料确定中位数;

(1) 将总体各单位标志值按大小顺序排列。

(2) 计算中位数所在的位置(n+1)/2,该位置对应的标志值即为中位数。若总体单位数N为奇数,处于中间位置的标志值即为中位数,若N为偶数,则处于中间公交车的两个标志值的算术平均数即为中位数。

(例)某地区8家4S汽车店的周销售量(辆)分别为:35、36、40、41、43、46、46、50.

则中位数的位置:

(n+1)/2=(8+1)/2=4.5

将排在第四位、第五位的4S汽车店的周销售量简单算术平均,

即:(41+43)/2=42(辆),42辆就是中位数。

二、根据单项数列确定中位数,具体步骤是:

(1)计算累计次数?f;

(2)按(?f+1)/2计算中位数所在的位置,该位置对应的标志值即为中位数。

(例)某生产企业工人每小时加工产品统计资料表如下:试计算产量中位数。每小时加工产品数量(个) 工人人数(人) 累计次数(人)

15 3 3

16 5 8

17 10 18

18 22 40

19 12 52

20 5 57

合计 -- 57

因为累计次数?f=57,所以中位数的位置是:(?f+1)/2=(57+1)/2=29 从上表可以看出,第29位次落在第四组内,所以第四组的标志值18个即为中位数。

三、根据组距数列确定中位数,具体步骤是:

(1) 计算累计次数?f;

(2) 按计算中位数所在的组;?f/2

(3) 用插值法按比例计算中位数的近似值。

中位数的计算公式有下限公式和上限公式。

下限公式(较小制累计时常用):

上限公式(较大制累计时常用):

(例)某计算机公司职工年收入水平分组资料如下表,计算职工年收入中位数。年收入(万元) 职工人数(人) 向上累计次数向下累计次数

2.5以下 5 5 64

2.5~

3.0 9 14 59

3.0~3.5 14 28 50

3.5~

4.0 18 46 36

4.0~4.5 11 57 18

4.5以上 7 64 7

合计 64 -- -- 中位数位置=?f/2=64/2=32

可以看出中位数所在组为第四组,即中位数的具体数值在3.5~4.0万元之间。按下限公式计算:

按上限公式计算:

10. 众数:是指总体中出现次数最多的标志值。

一、由单项数列确定众数,出现次数最多的标志值就是众数。 (例)某商场某品牌男鞋的月销量分组资料如下表,计算该月该品牌男鞋的众数。

型号(公分) 销售量(双)

38 1

39 4

40 14

41 26

42 35

43 22

44 14

45 3

合计 119 从表中资料可以看出,次数最多的是第5组,销售量达到35双,所以该组的标志值42公分的众数。

二、由组距数列确定众数,首先要根据次数最多的原则确定众数所在的组,

即众数组,再用比例插值法推算众数的近似值。计算公式有下限和上限

公式:

下限公式:

上限公式(所得结果更符合标准答案):

(例)根据下表的资料,确定职工年收入的众数。

年收入(万元) 职工人数(人) 向上累计次数向下累计次数

2.5以下 5 5 64

2.5~

3.0 9 14 59

3.0~3.5 14 28 50

3.5~

4.0 18 46 36

4.0~4.5 11 57 18

4.5以上 7 64 7

合计 64 -- -- 根据下限公式计算:

根据上限公式计算:

第4讲标志变异指标

1.标志变异指标:又称标志变动度,是用来说明总体各单位标志值之间差异程度的指标,它反映标志值的离中趋势。

2.标志变异指标的作用:

(1) 标志变异指标是评价平均指标代表性的尺度

(2) 标志变异指标可以反映现象变动的均衡性或稳定性

3.常用的标志变异指标:全距、平均差、方差、和标准差、离散系数,其中标准差的应用最为广泛。

(1)全距:是总体中各单位标志值中最大值与最小值之差,又称为极差。

公式:全距(R)=最大标志值-最小标志值

(例)有甲乙两个学习小组,每组6个人,每人的英语成绩如下(单位:分) 甲组:65 74 82 84 85 90

乙组:71 77 79 82 85 86

通过计算甲乙两组的平均成绩都是80分,甲组的全距=90-65=25(分),乙组的全距=86-71=15(分),可见甲组英语成绩的变动范围比乙组组大,即甲资料的标志变动大于乙组,平均数代表性差。

) 平均差:是总体各单位标志值与算术平均数的离差绝对值的算术平均数。 (3 公式:

(例)以上题资料为例,计算其平均差。

甲组平均差:

AD=(?65-80?+?74-80?+?82-80?+?84-80?+?85-80?+?90-80?)/6=42/6=7 乙组平均差:

AD=(?71-80?+?77-80?+?79-80?+?82-80?+?85-80?+?86-80?)/6=22/6=3.7 (例)某村居民月收入资料如下表,计算该村居民收入的平均差。月收入(元)x 人数(人)f ?x-x? ?x-x?f xf

500 30 15000 180 5400

600 50 30000 80 4000

700 70 49000 20 1400

800 30 24000 120 3600

900 20 18000 220 4400

相关推荐
相关主题
热门推荐