文档库 最新最全的文档下载
当前位置:文档库 › 第5章 统计变异指标20150317

第5章 统计变异指标20150317

第5章  统计变异指标20150317
第5章  统计变异指标20150317

第五章统计变异指标

5.1 统计变异指标概述

5.1.1 统计变异指标的定义

统计变异指标就是说明总体单位标志值的差异大小和程度的指标,简称变异指标。在统计研究中,一方面要计算平均数,用以反映总体各单位标志值的一般水平,另一方面也要计算统计变异指标,用以反映总体各单位标志值的差异程度。所以,为了全面准确地反映出总体特征,在计算了平均数之后,还要进一步计算统计变异指标,以便对平均数做出补充说明。

5.1.2 变异指标的作用

变异指标的作用包括以下几个方面

5.1.2.1 衡量平均数代表性大小

平均数的代表性必须用变异指标来测量,变异指标值大,平均数的代表性就小,相反,变异指标值小,平均数的代表性就大,如果变异指标值等于零,则说明平均数具有完全的代表性,变异指标与平均数呈现出此消彼长的关系。

5.1.2.2 衡量客观现象或事物的节奏性、均衡性和稳定性

例如:有两个乡的水稻平均单产都是400公斤,甲乡的水稻单产在350—450公斤之间的地块,只占播种面积的60%,而乙乡在350—450之间的地块,只占播种面积的30%,试问:哪个乡具有比较稳定而又可靠的收获量?

显然,在这种情况下,甲乡的收获量是比较稳定可靠的。所以,在计算平均数之后,还应该测定标志的变动度。

5.1.3 变异指标的种类

变异指标有全距、平均差、标准差和变异系数。

5.2 全距

5.2.1 全距的定义

全距是总体各单位标志值中最大值与最小值之差,也称为“极差”,是用来表示统计资料中的变异量数,可以反映总体种各单位标志值的差异范围。

5.2.2 全距的公式

全距的计算公式为

全距最大变量值-最小变量值

=

用符号表示

=-

B X X

Max Min

其中

B表示全距

X总体中的最大标志值

Max

X总体中的最小标志值

Min

5.2.3 全距的计算

5.2.3.1 根据未分组的资料计算全距

【举例5—1】

有甲乙两组各五名学生的英语考试成绩(单位:分)如下:

根据上述的资料计算全距。

【解答】

上述的两个组是未分组的资料,找到每个组的最大值和最小值,按照全距公式计算。

甲组的全距是

()

9068=22=-=-Max Min B X X 分

乙组的全距是

()

9660=36=-=-Max Min B X X 分

经过计算得到,甲组的全距为22分,乙组的全距为36分。

乙组同学英语考试成绩的全距大于甲组,说明考试成绩中乙组同学的分数差异比甲组大。

【解答完毕】

5.2.3.2 根据单项分组的资料计算全距

如果是进行了单项分组的资料,通过观察并找到最大变量值和最小变量值后,运用基本公式计算确定全距。

【举例5—1】

有两个学习小组各五名学生的描述统计学考试成绩,按照大小的顺序分组后分别为(单位:分数):

第一组:60、70、80、90、100 第二组:78、79、80、81、82

计算两个学习小组的描述统计学考试成绩的平均数,计算两个学习小组平均数的全距是多少?确定哪一个组的平均数代表性更强?

〖解答〗

首先,计算两个学习小组学生们的平均成绩。 第一小组学生统计学考试的平均成绩

()

60+70+80+90+100

=

5

=80∑X X n

1

分 第二小组学生统计学考试的平均成绩

()

60+70+80+90+100

=

5

=80∑X X n

2

分 其次,计算两个学习小组平均数的全距。 第一组的全距是

()

110060=40=-=-Max Min B X X 分

第二组的全距是

()

28278=4=-=-Max Min B X X 分

很明显,两个小组统计学考试成绩的平均水平都是80分,但是哪一个组的分数比较集中呢(或者说哪一个组的平均数更具有代表性)?

因为第一组的全距大于第二组的全距

12>B B

这说明第一组学生的统计学考试成绩平均水平的标志变动度(或变异趋势)远大于第二组的标志变动度(或变异趋势),第二组平均数更具有代表性。

【解答完毕】

5.2.3.3 根据组距分组的资料计算全距

在组距分组条件下,计算全距可用数列中最高一组的上限减去最低一组的下限,求其近似值。

如果是组距式分组资料,计算全距要通过下面的公式计算

=组距分组全距最大组的上限-最小组的下限

【举例7—1】

某公司2013年五月份职工工资分组资料,如表7—1所示。

根据该表的资料确定全距。 〖解答〗

首先,确定最大组的在最大值和最小组的最小值。

在上表中,最大组是“2500―3000元”组,该组的最大值是3000元;最小组是“1000―1500元”组,该组的最小值是1000元。

那么,该公司2013年五月份职工工资水平的全距

()

===组距分组全距最大组的上限-最小组的下限

3000-10002000元 经计算,该公司2013年五月份职工工资全距为2000元。 【解答完毕】

如果是开口组组距分组资料,则通过下面的公式计算

=开口组全距开口组最大组的上限-开口组最小组的下限

计算出的这个结果只是一个进似值。

【举例7—1】

对某地居民家庭收入情况做调查,调查资料如表7—1所示。

根据该表的资料确定全距。 〖解答〗

首先,计算确定缺上限开口组的上限和缺下限开口组的下限。 计算缺上限开口组的上限。上表中,缺上限开口组为“40000以上”,那么,该组的上限为

()()

+=40000+4000035000=45000缺少上限开口组的=该组下限邻-上限组组距元

补全了上限的最大组为“40000―45000元”组,该组最大值为45000元。

计算缺下限开口组的下限。上表中,缺下限开口组为“10000以上”,那么,该组的下限为

()()

==5000缺少下限开口组的下限邻组组距10000-15000-1=该组上限-0000元

补全了下限的最小组为“5000―10000元”组,该组最小值为5000元。

其次,根据公式计算全距。

()

==40000=开口组最大组的上限开口组最小缺口组开口组全距-45000-组的下限

5000元 那么,该地居民家庭收入的全距为40000元。 【解答完毕】

根据组距分组资料计算极差,是测定标志变动度的一种简单方法,但受极端值的影响,因而它往往不能充分反映客观现象或事物的离散程度。

5.2.4 全距的特点

5.2.4.1 全距的优点

非常明了的说明总体中两个极端标志值的变异范围,其计算方法简便、易懂、容易被人掌握。

5.2.4.2 全距的不足

受极端值影响很大,不能全面反映各单位标志值的差异程度。所以,在实际应用上有一定的局限性。

全距为离散程度的最简单测度值,易受极端值影响。其适用于等距变量、比率变量,不适用于名义变量或次序变量。

全距是测定标志变异程度最简单的方法,但由于它只取决于总体各单位标志值中最大和最小的两个标志值,没有反映其他标志值之间的差异,所以全距很容易受极端标志值的影响。当极端标志值相差较大,而其他标志值分布较均匀时,全距便不能正确反映标志值的离散程度。

5.2.5 全距的适用范围

在实际工作中,全距常用来检查产品质量的稳定性和进行质量控制。在正常生产条件下,全距在一定范围内波动,若全距超过给定的范围,就说明有异常情况出现。因此,利用全距有助于及时发现问题,以便采取措施,保

证产品质量。

最直接也是最简单的方法,即最大值-最小值(也就是极差)来评价一组数据的离散度。这一方法在日常生活中最为常见,比如比赛中去掉最高最低分就是极差的具体应用。

5.3 分位差和四分位差

5.3.1 分位差

分位差是对极差指标的一种改进,就是从变量数列中剔除了一部分极端值之后重新计算的类似于极差的指标。常用的分位差有四分位差、八分位差、十分位差、十六分位差、三十二分位差以及百分位差。

5.3.2 四分位差

5.3.2.1 四分位差的定义

四分位数是将一组数据由小到大(或由大到小)排序后,用3个点将全部数据分为4等份,与这3个点的位置上相对应的数值称为四分位数,分别称为第一四分位数(记为1Q ,也称为上四分位数)、第二四分位数(即中位数)(记为2Q )和第三四分位数(记为3Q ,也称为下四分位数)。

这三个点的位置的计算公式分别是

1Q 的位置为

14+n (n 为奇数),4

n

(n 为偶数) 在这个位置上的值是

U M

3Q 的位置为

()314

+n (n 为奇数),

()3+14

n (n 为偶数)

在这个位置上的值是

M

D

n为数据的个数。

四分位差也称为四分间距,它是上四分位数与下四分位数之差,公式为四分位差四分位数

=上四分位数下

-

用符号表示

M M M

=-

Q U D

其中

M表示四分位差

Q

四分位差越小,说明中间部分的数据越集中;四分位数越大,则意味着中间部分的数据越分散。

5.3.2.2 四分位差的特点

四分位差反映了中间50%数据的离散程度。其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。与极差(最大值与最小值之差)相比,四分位差不受极值的影响。此外,由于中位数处于数据的中间位置,因此四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。

5.3.2.3 四分位差的适用范围

四分位差主要用于测度顺序数据的离散程度。当然,对于数值型数据也可以计算四分位差,但不适合于分类数据。

四分位差的计算实例。

【举例5—1】

下表5—是某公司20名员工加班费资料。

表5—20名员工加班费资料单位:英镑

20名员工加班费按照大小的顺序排列后,再按照第5、第10和第15名员工的加班费把整个分布分成了四个相等部分,分别是1—5、6—10、10—15和16—20。

1

Q的位置为

n

20

==5

44

在这个位置上的值是第5名员工的加班费

()

M英镑

=50

U

Q的位置为

3

?

32060

==15

44

在这个位置上的值是第15名员工的加班费

()

=110

M英镑

D

四分位差

()=11050=60=--Q U D M M M 英镑

如果将四分位差除以2,还能得到半四分位差

()11050

==30222

--=

Q U D M M M 英镑 四分位差有助于数据的总结和描述。在表5—的数据中,四分位差60英镑覆盖了那些加班费在中间水平的员工,这些员工占公司总体员工数量的50%。

四分位差是可比的,例如:一个加班费的四分位差为60英镑的公司和一个加班费的四分位差仅为20英镑的公司相比较,前者的分布在中间部分更加分散。

5.3 平均差

5.3.1 平均差的定义

平均差是各标志值对其算术平均数的离差绝对值之和的平均数。

5.3.2 平均差的种类

由于计算方法和资料使用条件的不同,可分为简单算术平均式平均差和加权算术平均式平均差,简称为“简单平均差”和“加权平均差”。

5.3.2.1 简单平均差

如果掌握的资料是未经过分组和整理的,或者在计算该资料的平均数的时候,采用了简单算术平均数的公式,那么,计算该总体的平均差就要采用简单平均差计。

计算公式为

..∑X X

A D n

-=

其中

..A D 表示平均差

【举例5—1】

见上一章【举例4—1】中某工厂奶粉生产车间的包装第3班组有7名工人,每个工人每日包装奶粉的数量分别是589袋、597袋、603袋、606袋、592袋、579袋和592袋,而第4班组有7名工人,每个工人每日包装奶粉的数量分别是591袋、597袋、600袋、601袋、597袋、581袋和598袋,问:通过计算平均差,确定哪个班组的平均日包装数量更具有代表性?

〖解答〗

第三班组的平均日包装数量是

125895976036065925795927

594()n

X X X X n

+++=

++++++=

=袋 第四班组的平均日包装数量是

12591597600601597581+598

7

595() n

X X X X n

+++=

+++++=

=袋 编制两个班组平均日包装数量的平均差计算表,见表5—

表5— 两个班组平均日包装数量的平均差计算表

第三班组的平均日包装数量平均差是

()

..48=

7

6.86≈∑X X

A D n

-=袋

第四班组的平均日包装数量平均差是

()

..36=

7

5.14≈∑X X

A D n

-=袋

6.86袋>5.14袋,所以,第四班组的平均日包装数量更具有代表性。 5.3.2.2 加权平均差

如果掌握的是分组后的资料,或者在计算该资料的平均数的时候,采用的是加权算术平均数的公式,那么,计算该总体的平均差就要采用加权算术平均式平均差。

计算公式为

..∑∑X X f

A D f

-=

【举例5—】

某厂按月收入水平分组资料如表5—

根据上述资料计算平均差。 〖解答〗

根据上述资料编制该厂按月收入水平分组的组距数列计算表,得到表5—

根据上表资料计算平均数

()

=3100?∑∑X f X f =

558000

180元

计算平均差

()

..37000=

180

205.56≈∑∑X X f

A D f

-=元

计算得到,该厂按月收入的平均差为205.56元。 【解答完毕】 【举例5—】

某企业2007年和2008年生产工人技术等级人数分布资料见表5—

哪一年的平均技术等级更有代表性? 〖解答〗

首先,编制某企业2007年和2008年生产工人技术等级人数分布计算表,见表5—

其次,计算2007年工人技术水平平均等级

22

1.5714

?=

=

≈∑∑X f X f

2008年工人技术水平平均等级

52

1.7330

?=

=

≈∑∑X f X f

再次,编制2007年和2008年工人技术水平平均等级平均差计算表,见表5—

表5— 某企业2007年和2008年生产工人技术等级人数分布计算表

计算2007年工人技术水平平均等级平均差

..17.44=

300.58≈∑∑X X f

A D f -=

2008年工人技术水平平均等级平均差

..8=

140.57≈∑∑X X f

A D f -=

因为0.58>0.57,所以,2008年工人技术水平平均等级的代表性要略高于2007年工人技术水平平均等级,或者说。2007年和2008年工人技术水平平均等级的代表性基本一致。

【解答完毕】

5.4 标准差

5.4.1 标准差的定义

除了在数学处理上和平均差有区别之外,在其他方面,标准差和平均差的做法是一样的,它是各标志值对其算术平均数离差平方的算术平均数的平方根。

标准差也称均方差,是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。标准差在概率统计中最常使用作为统计分布程度上的测量。标准差定义为方差的算术平方根,反映组内个体间的离散程度。测量到分布程度的结果。

标准差是一组数据平均值分散程度的一种度量。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。

例如:两组数的集合{0, 5, 9, 14} 和{5, 6, 8, 9} 其平均值都是7 ,但第二个集合具有较小的标准差。

5.4.2 标准差的性质

标准差具有两种性质,它们分别是以下两种:

5.4.2.1 为非负数值。

与测量资料具有相同单位。

5.4.2.2 一个总量的标准差或一个随机变量的标准差,及一个子集合样品数的标准差之间,有所差别。

5.4.3 标准差的种类

由于计算方法和资料使用条件的不同,标准差可分为两种,分别是简单

算术平均式标准差和加权算术平均式标准差两种,简称为“简单标准差”和“加权标准差”。

5.4.3.1 简单标准差

如果掌握的资料是未经过分组和整理的,或者在计算该资料的平均数的时候,采用了简单算术平均数的公式,那么,计算该总体的标准差就要采用简单算术平均式标准差。

计算公式为

σ

其中

σ——标准差

【举例5—1】

见上一章【举例4—1】中某工厂奶粉生产车间的包装第3班组有7名工人,每个工人每日包装奶粉的数量分别是589袋、597袋、603袋、606袋、592袋、579袋和592袋,第4班组有7名工人,每个工人每日包装奶粉的数量分别是591袋、597袋、600袋、601袋、597袋、581袋和598袋,问:通过计算平均差,确定哪个两个班组的平均日包装数量更具有代表性?

〖解答〗

第三班组的平均日包装数量是

125895976036065925795927

594()n

X X X X n

+++=

++++++=

=袋 第四班组的平均日包装数量是

12591597600601597581+598

7

595() n

X X X X n

+++=

+++++=

=袋 编制两个班组平均日包装数量的标准差计算表,见表5— 表5— 两个班组平均日包装数量的标准差计算表

第三班组的平均日包装数量标准差是

()

8.38σ≈袋

第四班组的平均日包装数量标准差是

()

6.44σ≈袋

通过计算,第三班组的平均日包装数量标准差8.38袋大于第四班组的平均日包装数量标准差6.44袋,所以,第四班组的平均日包装数量更具有代表性。

【解答完毕】 5.4.3.2 加权标准差

如果掌握的是分组后的资料,或者在计算该资料的平均数的时候,采用的是加权算术平均数的公式,那么,计算该总体的标准差就要采用加权算术平均式标准差。

计算公式为

σ

【举例5—】

某厂按月收入水平分组资料如表5—

根据上述资料计算标准差。 〖解答〗

平均指标和变异指标练习题

平均指标和变异指标练习题 一、判断题 1、按人口平均的粮食产量是一个平均数。 2、算术平均数的大小,只受总体各单位标志值大小的影响。() 3、在特定条件下,加权算术平均数等于简单算术平均数。() 4、众数是总体中出现最多的次数。() 5、权数对算术平均数的影响作用只表现为各组出现次数的多少,与各组次数占总次数的比重无关。() 6、标志变异指标数值越大,说明总体中各单位标志值的变异程度就越大,则平均指标的代表性就越小。() 7、中位数和众数都属于平均数,因此他们数值的大小受到总体内各单位标志值大小的影响。() 8、对任何两个性质相同的变量数列,比较其平均数的代表性,都可以采用标准差指标。() 9、比较两总体平均数的代表性,标准差系数越大,说明平均数的代表性越好。() 10、工人劳动生产率是一个平均数。() 二、单选题 1、计算平均指标最常用的方法和最基本的形式是() A中位数B众数 C调和平均数D算术平均数 2、计算平均指标的基本要求是所要计算的平均指标的总体单位应该是() A大量的B同质的 C有差异的D不同总体的 3、在标志变异指标中,由总体中最大变量值和最小变量值之差决定的是() A标准差系数B标准差 C平均差D全距(极差) 4、为了用标准差比较分析两个同类总体平均指标的代表性,其基本的前提条件是() A 两个总体的标准差应相等 B 两个总体的平均数应相等 C 两个总体的单位数应相等 D 两个总体的离差之和应相等 5、已知两个同类型企业职工平均工资的标准差分别为4.3和4.7,则两个企业职工平均工资的代表性是() A 甲大于乙 B 乙大于甲 C 一样的 D 无法判断 6、甲乙两数列的平均数分别为100和14.5,它们的标准差为12.8和3.7,则() A甲数列平均数的代表性高于乙数列 B乙数列平均数的代表性高于甲数列 C两数列平均数的代表性相同 D两数列平均数的代表性无法比较 7、对于不同水平的总体不能直接用标准差来比较其变动度,这时需分别计算各自的()来比较。 A标准差系数B平均数C全距D均方差8、平均数指标反映了同质总体的()。 A 集中趋势B离中趋势 C变动趋势 D 分布特征 9、分配数列各组变量值不变,每组次数均增加25%,加权算术平均数的数值()。 A 增加25% B 减少25% C 不变化 D 无法判断 10、对下列资料计算平均数,适宜于采用几何平均数的是()。 A 对某班同学的考试成绩求平均数 B 对一种产品的单价求平均数 C 由相对数或平均数求其平均数 D计算平均比率或平均速度时 11、SRL服装厂为了了解某类服装的代表性尺寸,最适合的指标是()。 A 算术平均数 B 几何平均数 C 中位数 D 众数 12、若某一变量数列中,有变量值为零,则不适宜计算的平均指标是()。 A 算术平均数 B 调和平均数 C 中位数 D 众数 三、多项选择题 1、平均数的种类有() A算术平均数B众数C中位数 D调和平均数E几何平均数 2、平均指标的作用是() A反映总体的一般水平 B对不同时间、不同地点、不同部门的同质

第四章(下) 平均指标、标志变异指标 补充作业

第四章 平均指标与标志变异指标 补充作业 一、填空题: 1、统计中的变量数列是以 为中心而左右波动,反映总体分布的 。 2、利用组中值计算算术平均数是假定各组内的 分布的,计算结果只是一个 值。 3、权数对算术平均数的影响作用,不决定于权数 的大小,而决定于权数的 大小。 4、在计算加权算术平均数时,必须慎重选择权数,务必使各组的 和 的乘积等于各组的 。 5、调和平均数是平均指标的一种,它是 的算术平均数的 ,又称 平均数。 6、几何平均数是 ,是计算平均比率和平均速度最适用的一种方法。凡是变量值的连乘积等于 或 的现象,都可以适用几何平均数计算平均比率或平均速度。 7、平均指标说明变量数列中变量值的 ;而标志变异指标则说明变量值的 。 8、标志变异指标的大小与平均数代表性的高低成 关系。 二、单选题: 1、某市2007年底总人口700万人,该数字说明全市人口( )。 ①在年内发展的总规模 ②在统计时点的总规模 ③在年初与年末间隔内发展的总规模 ④自年初至年末增加的总规模 2、甲、乙两组工人的平均日产量分别为18件和15件。若两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重上升,则两组工人总平均日产量会( )。 ① 上升 ②下降 ③不变 ④可能上升,也可能下降 3、代表次数最多的那个标志值是( )。 ① 众数 ②中位数 ③算术平均数 ④几何平均数 4、加权算术平均数的大小( )。 ①受各组次数f 的影响最大 ②受各组标志值x 的影响最大 ③只受各组标志值x 的影响 ④受各组标志值x 和次数f 的共同影响 5、机械行业所属3个企业2007年计划产值分别为400万元、600万元、500万元。执行结果,计划完成程度分别为108%、106%、108%,则该局3个企业平均计划完成程度为( )。 ①%33.107%108%106%1083=?? ② %33.1073 % 108%108%106=++ ③%19.107% 108500%106600%108400500 600400=+ +++ ④ %2.107500600400500%108600%106400%108=++?+?+? 6、权数对算术平均数的影响作用,决定于( )。 ①权数本身数值的大小 ②作为权数的单位数占总体单位数的比重大小 ③各组标志的大小 ④权数的经济意义 7、分配数列中,当标志值较小,而权数较大时,计算出来的算术平均数( )。 ①接近与标志值大的一方 ②接近于标志值小的一方 ③接近于大小合适的标志值 ④不受权数影响 8、标准差数值越小,则反映变量值( )。 ①越分散,平均数代表性越低 ②越集中,平均数代表性越高 ③越分散,平均数代表性越高 ④越集中,平均数代表性越低 9、计算平均指标的基本要求是,所要计算的平均指标的总体单位是( )。

平均指标与变异指标

第五章平均指标与变异指标教学目的与要求: 本章主要介绍了经济统计中广泛应用的一种综合指标,即平均指标。并在此基础上,详细论述了反映总体特征的另一指标,即标志变异指标。通过本章的学习和应用能力的训练,重点要求是: 1、深刻理解平均指标和变异指标的基本理论和分析方法 2、掌握计算平均指标的各种方法及运用原则 3、对平均指标进行分析,阐述影响平均指标大小的原因 4、明确平均指标与变异指标的区别与联系 5、掌握变异指标的计算方法,并能运用标志变异指标说明平均数的代 表性基本理论和分析方法。 重点掌握:1、平均制表的分析方法。 2、变异指标的计算意义。 教学方式:用多媒体课件讲练结合。 课时安排:理论4学时,实训2学时 第一节平均指标的概念和作用 一、平均指标的概念 1、定义 平均指标又称平均数,它是统计分析中最常用的统计指标之一。它反映了社会经济现象中某一总体各单位某一数量在一定时间、地点条件下所达到的一般水

平,或者反映某一总体、某一指标在不同时间上发展的一般水平。 2、特点 第一,同质性,即总体内各单位的性质是相同的。 第二,抽象性,即总体内各同质单位虽然存在数量差异,但在计算平均数时并不考虑这种差异,即把这种差异平均掉了。 第三,代表性,即尽管各总体单位的标志值大小不一,但我们可以用平均数这一指标值来代表所有标志值。 二、平均指标的作用 1、可以用来比较同类现象在不同地区、部门、单位(即不同总体)发展的一般水平,用以说明经济发展的高低和工作质量的好坏。 2、可以用来对统一总体某一现象在不同时期上进行比较,以反映该现象的发展趋势或规律。如对同一地区人均年收入逐年进行比较来反映该地区居民生活水平的发展趋势或规律。 1、可以作为论断事物的一种数量标准。 2、可以用来分析现象之间的依存关系。 3、可以估算和推算其他有关数字 三、平均指标的种类 平均指标按其性质可分为静态平均数和动态平均数。 静态平均数反映的是同质总体内各单位某一数量标志在一定时间地点条件的一般水平, 动态平均数反映的是某一总体某一指标值在不同时间上的一般水平。本章主要介绍静态平均数。 第二节平均指标的计算和确定 一、算术平均数 算术平均数是计算平均指标最常用的方法,其基本公式是: 总体标志总量 算术平均数= 总体单位总量 使用这一基本公式应该注意公式中分子与分母的口径必须保持一致,即各个标志值与各单位之间必须具有一一对应关系,属于同一总体,否则计算出的指标便失去了意义,这也正是平均指标与强度相对指标不同的地方。强度相对指标虽然也是两个总量指标之比,但分子分母各属不同的总体,它们之间没有直接的依存关系。由于掌握的资料不同,算术平均数的计算有简单算术平均数和加权平均数之分。

第五章 平均指标和变异指标

第5章平均指标和变异指标 【教学内容】 本章包括平均指标和变异指标两部分内容,阐述了平均指标的概念和作用;各种平均数(算术平均数、调和平均数、几何平均数、众数和中位数)的计算原则、方法与应用条件;变异指标的作用、主要的变异指标(全距、平均差、标准差及其系数)的计算方法和运用条件。【教学目标】 1.理解平均指标和变异指标的概念、意义、作用; 2.明确其种类及其区别; 3.掌握平均指标和变异指标的计算方法、应用的原则和条件、平均指标与变异指标的关系。【教学重点、难点】 1.平均指标的特点和计算、应用原则; 2.加权算术平均数; 3.平均指标与变异指标的关系; 4.标准差及其系数 第一节平均指标的概念和作用 一、平均指标的概念 在社会经济现象的同质总体中,同一标志在各单位的数量表现不尽相同,标志值大小各异,这就需要利用平均指标来代表总体的一般水平。总体各单位的同质性和某种标志值在各单位的差异性,是计算平均数的前提条件。 平均指标,是将同类社会经济现象总体内各单位某一数量标志值的差异抽象化的代表性水平指标,其数值表现为平均数。平均指标一般是一种具有单位名称的数,它的计算单位是一个复合单位。平均指标是社会经济统计中最常用的综合指标之一。 平均指标的显著特点是,把同质总体内各单位在某一数量标志值上的差异抽象化了,是对各单位具体数值的平均;它不是某一单位的具体数值,而是代表总体某种数量标志值的一般水平,是总体各单位的代表值。需要注意的是,掩盖总体内部各单位某种数量标志值的差异,是平均数的局限性,必须充分认识,以防误用。 二、平均指标的作用 平均指标由于能综合反映所研究现象的总体在具体条件下的一般水平,因此,在统计研究中,以及各项经济管理和分析中被广泛应用。其作用概括起来主要有: 1、利用平均指标,可以了解总体次数分布的集中趋势。

变异指标及答案

第六章变异指标 一、本章重点 1.平均指标描述的是总体的集中趋势,而变异指标描述的是总体的离中趋势。它们从两方面来反映总体的分布特征。其作用首先是衡量平均指标代表性大小的一种尺度,其次还可以反映社会经济活动过程的均衡性与协调性,第三是抽样方案设计的基本因素之一。 2.全距、全距系数;四分位差、四分位差系数;平均差、平均差系数是测定标志变异程度的最简便的方法。但由于其数理依据欠科学,在反映标志差异程度方面代表性较差。 3.标准差与标准差系数是反映标志差异程度的主要指标。它比前面介绍的其它指标都科学。标准差就是标志值与其算术平均数离差的平方的算术平均数的平方根。标准差系数是标准差与其算术平均数之比,是反映标志差异程度方面目前最科学的统计指标之一。 4.要掌握是非标志的平均数与标准差的计算。是非标志的最大值是。 二、难点释疑 1.全距、四分位差、平均差、标准差在反映标志变异程度方面各有优缺点。前者计算简单、反映生动鲜明,但是不准确。标准差比较准确,但计算过程复杂。 2.标准差系数的应用。为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。它是标志变异的相对指标。它既消除了变量数列差异的影响,也消除了变量数列水平的影响。 三、练习题 (一)填空题 1.平均指标说明分布数列中变量值的(集中趋势),而标志变异指标则说明变量值的(离中趋势)。 2.(平均指标)反映总体各单位某一数量标志值的共性,也叫集中趋势。(变异指标)可以反映他们之间的差异性,也叫(离中趋势)。 3.标志变异指标是衡量(平均指标代表性大小)的尺度,它还可以表明生产过程的(均衡性)或其它经济活动过程的(协调性)。 4.标志变动度与平均数的代表性成(反比)。 5.全距是总体中单位标志值的(最大值)与(最小值)之差。 6.如果资料为组距数列,全距可以用(最大组的上限)和(最小组的下限)之差来近似地表示全距,他比实际的全距(小)。 7.全距受(极端值)的影响最大。 8.是非标志的平均数为( P ),标准差为( PQ的平方根)。 9.标准差的大小不仅取决于变量值之间(差异程度)大小,还取决于(平均指标)高低。 10.平均数与标准差的计算都是以(同质总体)为中心。 11.标准差系数是(标准差)与(平均数)之比,其计算公式为()。 (二)名词解释 1.标志变动度 2.全距 3.四分位差 4.平均差 5.标准差 6.全距系数 7.平均差系数 8.标准差系数 (三)判断题

平均指标练习及答案

第三章平均指标与标志变异指标 一、填空题 1.平均指标是表明__________某一标志在具体时间、地点、条件下达到的_________的统计指标,也称为平均数。 2.权数对算术平均数的影响作用不决定于权数的大小,而决定于权数的________的大小。 3.几何平均数是n个__________的n次方根,.它是计算和平均速度的最适用的一种方法。 4.当标志值较大而次数较多时,平均数接近于标志值较的一方;当标志值较小而次数较多时,平均数靠近于标志值较的一方。 5.当时,加权算术平均数等于简单算术平均数。 6.利用组中值计算加权算术平均数是假定各组内的标志值 是分布的,其计算结果是一个。 7.中位数是位于变量数列的那个标志值,众数是在总体中出现次数的那个标志值。中位数和众数也可以称为平均数。 8.调和平均数是平均数的一种,它是的算术平均数的。 9.当变量数列中算术平均数大于众数时,这种变量数列的分布 呈分布;反之算术平均数小于众数时,变量数列的分布则 呈分布。 10.较常使用的离中趋势指标 有、、、、 、。 11.标准差系数是与之比。 12.已知某数列的平均数是200,标准差系数是30%,则该数列的方差

是。 13.对某村6户居民家庭共30人进行调查,所得的结果是,人均收入400元,其离差平方和为5100000,则标准差是,标准差系数 是。 14.在对称分配的情况下,平均数、中位数与众数是的。在偏态分配的情况下,平均数、中位数与众数是的。如果众数在左边、平均数在右边,称为偏态。如果众数在右边、平均数在左边,则称为偏态。 15.采用分组资料,计算平均差的公式是,计算标准差的公式是。 二、单项选择题 1.加权算术平均数的大小( ) A受各组次数f的影响最大B受各组标志值X的影响最大 C只受各组标志值X的影响 D受各组次数f和各组标志值X的共同影响 2,平均数反映了( ) A总体分布的集中趋势 B总体中总体单位分布的集中趋势 C总体分布的离散趋势 D总体变动的趋势 3.在变量数列中,如果标志值较小的一组权数较大,则计算出来的算术平均数( ) A接近于标志值大的一方 B接近于标志值小的一方 C不受权数的影响D无法判断 4.根据变量数列计算平均数时,在下列哪种情况下,加权算术平均数等于简单算术平均数( ) A各组次数递增 B各组次数大致相等 C各组次数相

第五章 平均指标和变异指标 补充作业

第五章 平均指标和变异指标 补充作业 一、填空题: 1、统计中的变量数列是以 为中心而左右波动,反映总体分布的 。 2、利用组中值计算算术平均数是假定各组内的 分布的,计算结果只是一个 值。 3、权数对算术平均数的影响作用,不决定于权数 的大小,而决定于权数的 大小。 4、在计算加权算术平均数时,必须慎重选择权数,务必使各组的 和 的乘积等于各组的 。 5、调和平均数是平均指标的一种,它是 的算术平均数的 ,又称 平均数。 6、几何平均数是 ,是计算平均比率和平均速度最适用的一种方法。凡是变量值的连乘积等于 或 的现象,都可以适用几何平均数计算平均比率或平均速度。 7、平均指标反映变量数列中变量值的 ;而标志变异指标则反映变量值的 。 8、标志变异指标的大小与平均数代表性的高低成 关系。 二、单选题: 1、某市2007年底总人口700万人,该数字说明全市人口( )。 ①在年内发展的总规模 ②在统计时点的总规模 ③在年初与年末间隔内发展的总规模 ④自年初至年末增加的总规模 2、甲、乙两组工人的平均日产量分别为18件和15件。若两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重上升,则两组工人总平均日产量会( )。 ① 上升 ②下降 ③不变 ④可能上升,也可能下降 3、代表次数最多的那个标志值是( )。 ① 众数 ②中位数 ③算术平均数 ④几何平均数 4、加权算术平均数的大小( )。 ①受各组次数f 的影响最大 ②受各组标志值x 的影响最大 ③只受各组标志值x 的影响 ④受各组标志值x 和次数f 的共同影响 5、机械行业所属3个企业2007年计划产值分别为400万元、600万元、500万元。执行结果,计划完成程度分别为108%、106%、108%,则该局3个企业平均计划完成程度为( )。 ①%33.107%108%106%1083=?? ② %33.1073 % 108%108%106=++ ③%19.107% 108500%106600%108400500 600400=+ +++ ④ %2.107500600400500%108600%106400%108=++?+?+? 6、权数对算术平均数的影响作用,决定于( )。 ①权数本身数值的大小 ②作为权数的单位数占总体单位数的比重大小 ③各组标志的大小 ④权数的经济意义 7、分配数列中,当标志值较小,而权数较大时,计算出来的算术平均数( )。 ①接近与标志值大的一方 ②接近于标志值小的一方 ③接近于大小合适的标志值 ④不受权数影响 8、标准差数值越小,则反映变量值( )。 ①越分散,平均数代表性越低 ②越集中,平均数代表性越高 ③越分散,平均数代表性越高 ④越集中,平均数代表性越低 9、计算平均指标的基本要求是,所要计算的平均指标的总体单位是( )。

相关文档
相关文档 最新文档