第五章离散趋势测量
一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确答案的序号,填写在题中的括号内。每小题2分,共20分)
1. 离散系数的主要目的是( )。
A. 反映一组数据的平均水平
B. 比较多组数据的平均水平
C. 反映一组数据的离散程度
D. 比较多组数据的离散程度
2. 两组数据的平均数不相等,但是标准差相等。那么( )。
A. 平均数小的,离散程度小
B. 平均数大的,离散程度大
C. 平均数大的,离散程度小
D. 两组数据离散程度相同
二、名词解释(每题4分,共20分)
3. 方差与标准差
四、计算题(每题 1 5分,共30分)
4.某校社会学专业共有两个班级。期末考试时, 一班同学社会学理论平均成绩为86分,标准差为12分。二班同学成绩如下所示。二班同学社会学理论成绩分组数据表
按成绩分组(分) 人数(个)
60分以下 2
60~70 7
70~80 9
80~90 7
90~100 3
合计30
要求:
(1) 计算二班同学考试成绩的均值和标准差。
(2) 比较一班和二班哪个班成绩的离散程度更大? (提示: 使用离散系数)
5.甲单位人均月收入4500元, 标准差1200元。乙单位月收入分布如下所示。
乙单位月收入分布表
按收入分组(元) 人数(个)
3000 分以下120
3000~4000 420
4000~5000 540
5000~6000 420
6000 以上300
合计1800
要求:
(1) 计算乙单位员工月收入的均值和标准差。
(2) 比较甲单位和乙单位哪个单位员工月收入的离散程度更大? (提示: 使用离散系数)
答案: 1. A 2. C
3. 方差与标准差
方差(variance) 是各数值与均值离差平方的平均数,它是数值型数据离散趋势最主要的测量值。 (2分)
标准差(standard variance) 是方差的平方根,用于测量数值型数据离散趋势。(2分)
4.(1)均值:k
k
k f f f X f X f X f X ++++++=
212211
=(55×2+65×7+75×9+85×7+95×5)÷ 30 = 2310 ÷ 30
= 77 (4分)
方差:()
N
f X X
k
i i
i
∑=-=
1
2
2
σ
()()()()()3057795777859777577766277552
2222÷???
?
?????-+?-+?-+?-+?-= = 4080 ÷ 30
= 136
标准差: 6619.111362≈==σσ (4分)
(2)一班考试成绩的离散系数为:1395.08612=÷==一班
一班一班X S V (3分)
二班考试成绩的离散系数为:1515.07766.11=÷==
二班
二班二班X S V (3分)
一班V <二班V ,所以说一班成绩的离散程度小于二班。 (1分)
5.(1)均值:4700=X (4分) 方差:13600002
=σ 标准差:
19.1166=σ (4分)
(2)离散系数:2667.0=甲V (3分) 2481.0=乙V (3分)
甲V >乙V ,所以说甲单位人均月收入的离散程度大于乙单位人均月收入。 (1分)
练习题解答:第五章--集中趋势与离散趋势
————————————————————————————————作者:————————————————————————————————日期: ?
第五章 集中趋势与离散趋势 练习题: 1. 17名体重超重者参加了一项减肥计划,项目结束后,体重下降的重量分别为: (单位:千克) 12 10 15 8 2 6 14 12 10 12 10 10 11 10 5 10 16 (1)计算体重下降重量的中位数、众数和均值。 (2)计算体重下降重量的全距和四分位差。 (3)计算体重下降重量的方差和标准差。 解: (1) 错误!中位数: 对上面的数据进行从小到大的排序: 序号 1 2 3 4 5 6 7 8 9 1 16 1 7 数据 2 5 6 8 1 11 12 1 2 12 14 1 5 16 Md 的位置= 2 1 17+=9,数列中从左到右第9个是10,即M d =10。 \o \ac(○,2)众数: 绘制各个数的频数分布表: 数据 2 5 6 8 1 频数 1 1 1 1 6 1 3 1 1 1 “10”的频数是6,大于其他数据的频数,因此众数M O =“10” 错误!均值: 18.1016 521 =+?++= = ∑=n n x X n i i
(2) 错误!全距:R =max (xi)-m in (xi)=16-2=14 错误!四分位差: 根据题意,首先求出Q 1和Q 3的位置: Q 1的位置= 41+n =4 1 17+=4.5,则Q1=8+0.5×(10-8)=9 Q 3的位置=4)1(3+n =4 ) 117(3+?=13.5,则Q 3=12+0.5×(12-12)=12 Q= Q3- Q 1=12-9=3 (3) 错误!方差: 2 21 222 () 1 (210.18)(510.18)(1610.18) 171 =12.404 n i i x x S n =-= --+--=-∑+?+ 错误!标准差:212.40 3.52S S = == 2.下表是武汉市一家公司60名员工的省(市)籍的频数分布: 省(市)籍 频数(个) 湖北 28 河南 12 湖南 6 四川 6 浙江 5 安徽 3 (1)根据上表找出众值。 (2)根据上表计算出异众比率。 解: (1)“湖北”的频数是28,大于其他省(市)籍的频数,因此众数MO =“湖北”
第五章 集中趋势与离散趋势 练习题: 1. 17名体重超重者参加了一项减肥计划,项目结束后,体重下降的重量分别为: (单位:千克) 12 10 15 8 2 6 14 12 10 12 10 10 11 10 5 10 16 (1)计算体重下降重量的中位数、众数和均值。 (2)计算体重下降重量的全距和四分位差。 (3)计算体重下降重量的方差和标准差。 解: (1)○1中位数: 对上面的数据进行从小到大的排序: M d 的位置= 2 =9,数列中从左到右第9个是10,即M d =10。 ○2众数: 绘制各个数的频数分布表: “10”的频数是6,大于其他数据的频数,因此众数M O =“10” ○3均值: 18.1016 521 =+?++= = ∑=n n x X n i i (2)○1全距:R =max(x i )-min(x i )=16-2=14 ○2四分位差: 根据题意,首先求出Q 1和Q 3的位置:
Q 1的位置=41+n =4 1 17+=,则Q 1=8+×(10-8)=9 Q 3的位置=4)1(3+n =4 ) 117(3+?=,则Q 3=12+×(12-12)=12 Q= Q 3- Q 1=12-9=3 (3)○1方差: 2 21 222 () 1 (210.18)(510.18)(1610.18) 171 =12.404 n i i x x S n =-= --+--=-∑+?+ ○2 标准差: 3.52S === 2.下表是武汉市一家公司60名员工的省(市)籍的频数分布: 省(市)籍 频数(个) 湖北 28 河南 12 湖南 6 四川 6 浙江 5 安徽 3 (1)根据上表找出众值。 (2)根据上表计算出异众比率。 解: (1)“湖北”的频数是28,大于其他省(市)籍的频数,因此众数M O =“湖北” (2)异众比率的计算公式为: mo r n f V n -= ( n 代表总频数,mo f 代表众数的频数) 其中n=60,mo f =28,则: 6028 0.5360 r V -==
如何衡量数据的离散程度 我们通常使用均值、中位数、众数等统计量来反映数据的集中趋势,但这些统计量无法完全反应数据的特征,即使均值相等的数据集也存在无限种分布的可能,所以需要结合数据的离散程度。常用的可以反映数据离散程度的统计量如下: 极差(Range) 极差也叫全距,指数据集中的最大值与最小值之差: 极差计算比较简单,能从一定程度上反映的数据集的离散情况,但因为最大值和最小值都取的是极端,而没有考虑中间其他数据项,因此往往会受异常点的影响不能真实反映数据的离散情况。 四分位距(interquartile range,IQR) 我们通常使用箱形图来表现一个数据集的分布特征: 一般中间矩形箱的上下两边分别为数据集的上四分位数(75%,Q3)和下四分位数(25%,Q1),中间的横线代表数据集的中位数(50%,Media,Q2),四分位距是使用Q3减去Q1计算得到:
如果将数据集升序排列,即处于数据集3/4位置的数值减去1/4位置的数值。四分位距规避了数据集中存在异常大或者异常小的数值影响极差对离散程度的判断,但四分位距还是单纯的两个数值相减,并没有考虑其他数值的情况,所以也无法比较完整地表现数据集的整体离散情况。 方差(Variance) 方差使用均值作为参照系,考虑了数据集中所有数值相对均值的偏离情况,并使用平方的方式进行求和取平均,避免正负数的相互抵消: 方差是最常用的衡量数据离散情况的统计量。 标准差(Standard Deviation) 方差得到的数值偏差均值取平方后的算术平均数,为了能够得到一个跟数据集中的数值同样数量级的统计量,于是就有了标准差,标准差就是对方差取开方后得到的: 基于均值和标准差就可以大致明确数据集的中心及数值在中心周围的波动情况,也可以计算正态总体的置信区间等统计量。 平均差(Mean Deviation) 方差用取平方的方式消除数值偏差的正负,平均差用绝对值的方式消除偏差的正负性。平均差可以用均值作为参考系,也可以用中位数,这里使用均值: 平均差相对标准差而言,更不易受极端值的影响,因为标准差是通过方差的平方计算而来的,但是平均差用的是绝对值,其实是一个逻辑判断的过程而并非直接计算的过程,所以标准差的计算过程更加简单直接。 变异系数(Coefficient of Variation,CV) 上面介绍的方差、标准差和平均差等都是数值的绝对量,无法规避数值度量单位的
离散趋势测量法
第五章 离散趋势测量法 第二节、全距与四分位差 ? 一、全距 ? 1、未分组资料计算公式 ? 全距又称极差,是一组数据的最大值与最小值之差,用表示。计算公式为: ? ? 式中, 、 分别表示为一组数据的最大值与最小值。由于全距是根据一组数据的两个极值表示的,所以全距表明了一组数据数值的变动范围。越大,表明数值变动的范围越大,即数列中各变量值差异大,反之,越小,表明数值变动的范围越小,即数列中各变量值差异小。 2、分组资料计算公式 R=最高组上限 - 最低组下限 ? R=最高组组中组-最低组组中值 ? R=最高组组中组-最低组下限 ? R=最高组上限-最低组组中值 ? 如果资料经过整理,并形成组距分配数列,全距可近似表示为: ? R ≈最高组上限值-最低组下限值 3、优缺点: 优点:计算简单,易于理解。 缺点: (1)受极端值影响大,遇含开口组的资料时无法计算; max()min() i i R X X =-max() i X min() i X
(2)数据利用率低,信息丧失严重; (3)受抽样变动影响大(一般大样本的全距会比小样本的全距大)。 二、四分位差(inter-quartile range) 上四分位数与下四分位数之差的平均数,称为四分位差,亦称为内距或四分间距。 四分位差的计算方法: Q·D=(Q3-Q1) /2 四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。此外,由于中位数处于数据的中间位置,因此,四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。 四分位差主要用于测度顺序数据的离散程度。当然,对于数值型数据也可以计算四分位差,但不适合于分类数据。 优缺点:主要是避免了全距受极端值影响的缺点,其他优缺点同全距:数据利用率低,信息丧失严重;受抽样变动影响大。 第三节、平均差 ?平均差是各变量值与其算术平均数离差绝对值的平均数,用A.D表示。 根据掌握资料的不同,平均差有以下两种计算方法: ? 1. 简单平均法
数据的集中趋势和离散程度 【知识点1】正确理解平均数、众数和中位数的概念 一、平均数:平均数是反映一组数据的平均水平的特征数,反映一组数据的集中趋势.平均数的大小与一组数 据里的每一个数据都有关系,任何一个数据的变化都会引起平均数的变化. 例1:有四个数每次取三个数,算出它们的平均数再加上另一个数,用这种方法计算了四次,分别得到以下四个数:86, 92, 100, 106,那么原4个数的平均数是________ . 例2:有几位同学参加语文考试,赵峰的得分如果再提高13分,他们的平均分就达到90分,如果赵峰的得分降低5分,他们的平均分就只得87分,那么这些同学共有________人. 例3:有5个数,其平均数为138,按从小到大排列,从小端开始前3个数的平均数为127,从大端开始顺次取出3个数,其平均数为148,则第三个数是_______ . 例4:某5个数的平均值为60,若把其中一个数改为80,平均值为70,这个数是________ . 例5:A、B、C、D四个数,每次去掉一个数,将其余下的三个数求平均数,这样计算了4次,得到下面4个数. 23, 26, 30, 33 A、B、C、D 4个数的平均数是多少 例6:有5个抽屉,分别有图书33本、42本、20本、53本和32本,平均每个抽屉里有图书多少本? 例7:小明参加了四次数学测验,平均成绩是88分,他想再通过一次数学测验将五次的平均成绩提高到最少90分,那么在下次测验中,至少要得多少分? 例8:四个数的平均值是30,若把其中一个改为50,平均值就变为40,这个数原来是多少? 例9:有甲、乙、丙三个数,甲数和乙数的平均数是42,甲数和丙数的平均数是46,乙数和丙数的平均数是47,求甲、乙、丙三个数各是多少? 例10:某人沿一条长为12千M的路上山,又从原路返回,上山的速度是2千M/小时,下山的速度是6千M/小时。那么,他在上山和下山的全过程当中的平均速度是多少千M每小时? 例11:若不选择教材中的引入问题,也可以替换成更贴近学生学习生活中的实例,下举一例可供借鉴参考。 某校初二年级共有4个班,在一次数学考试中参考人数和成绩如下: 求该校初二年级在这次数学考试中的平均成绩? 二、众数:在一组数据中出现次数最多的数据叫做这一组数据的众数.一组数据中的众数有时不唯一.众数着
第五章 离散趋势测量法 第二节、全距与四分位差 ? 一、全距 ? 1、未分组资料计算公式 ? 全距又称极差,是一组数据的最大值与最小值之差,用表示。计算公式为: ? ? 式中, 、 分别表示为一组数据的最大值与最小值。由于全距是根据一组数据的两个极值表示的,所以全距表明了一组数据数值的变动范围。越大,表明数值变动的范围越大,即数列中各变量值差异大,反之,越小,表明数值变动的范围越小,即数列中各变量值差异小。 2、分组资料计算公式 R=最高组上限 - 最低组下限 ? R=最高组组中组-最低组组中值 ? R=最高组组中组-最低组下限 ? R=最高组上限-最低组组中值 ? 如果资料经过整理,并形成组距分配数列,全距可近似表示为: ? R ≈最高组上限值-最低组下限值 3、优缺点: 优点:计算简单,易于理解。 缺点: (1)受极端值影响大,遇含开口组的资料时无法计算; (2)数据利用率低,信息丧失严重; (3)受抽样变动影响大(一般大样本的全距会比小样本的全距大)。 二、四分位差(inter-quartile range ) 上四分位数与下四分位数之差的平均数,称为四分位差,亦称为内距或四分间距。 四分位差的计算方法: Q·D=(Q3-Q1) /2 四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。此外,由于中位数处于数据的中间位置,因此,四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。 四分位差主要用于测度顺序数据的离散程度。当然,对于数值型数据也可以计算四分位差,但不适合于分类数据。 优缺点:主要是避免了全距受极端值影响的缺点,其他优缺点同全距:数据利用率低,信息丧失严重;受抽样变动影响大。 max()min() i i R X X =-m ax()i X min() i X
第五章集中趋势与离中趋势的度量习题 一、填空题 1.平均数就是在——内将各单位数量差异抽象化,用以反映总体的。 2.权数对算术平均数的影响作用不决定于权数的大小,而决定于权数的的大小。 3.几何平均数是,它是计算和平均速度的最适用的一种方法。 4.当标志值较大而次数较多时,平均数接近于标志值较的一方;当标志值较小而次数较多时,平均数靠近于标志值较的一方。 5.当时,加权算术平均数等于简单算术平均数。 6.利用组中值计算加权算术平均数是假定各组内的标志值是分布的,其计算结果是一个。 7.统计中的变量数列是以为中心而左右波动,所以平均数反映了总体分布的。 8.中位数是位于变量数列的那个标志值,众数是在总体中出现次数的那个标志值。中位数和众数也可以称为平均数。 9.调和平均数是平均数的一种,它是的算术平均数的。 10.现象的是计算或应用平均数的原则。 11.当变量数列中算术平均数大于众数时,这种变量数列的分布呈分布;反之算术平均数小于众数时,变量数列的分布则呈分布。 12.较常使用的离中趋势指标有、、、、。 13.极差是总体单位的与之差,在组距分组资料中,其近似值是。 14.是非标志的平均数为、标准差为。 15.标准差系数是与之比。 16.已知某数列的平均数是200,标准差系数是30%,则该数列的方差是。 则该数列的极差为,四分位差为。 18.对某村6户居民家庭共30人进行调查,所得的结果是,人均收入400元,其离差平方和为5100000,则标准差是,标准差系数是。 19.测定峰度,往往以为基础。依据经验,当β=3时,次数分配曲线为;当β<3时,为曲线;当β>3时,为曲线。 20.在对称分配的情况下,平均数、中位数与众数是的。在偏态分配的情况下,平均数、中位数与众数是的。如果众数在左边、平均数在右边,称为偏态。如果众数在右边、平均数在左边,则称为偏态。 21.采用分组资料,计算平均差的公式是,计算标准差的公式是。 二、单项选择题 1.加权算术平均数的大小( ) A受各组次数f的影响最大B受各组标志值X的影响最大 C只受各组标志值X的影响D受各组次数f和各组标志值X的共同影响 2,平均数反映了( ) A总体分布的集中趋势B总体中总体单位分布的集中趋势 C总体分布的离散趋势D总体变动的趋势
2015秋苏科版数学九上第三章《数据的集中趋势和离散程 度》word单元测试题 课题: 数据的离散程度测试 一、填空题(每空3分,共30分) 1、数据-5,6,4,0,1,7,5的极差为___________ 2、某校初三年级甲、乙两班举行电脑汉字输入比赛,两个班能参加比赛的学生每分钟输入汉字的个数,经统计的个数,经统计和计算后结果如下表: 班级参加人数平均字数中位数方差 甲 55 135 149 191 乙 55 135 151 110 有一位同学根据上面表格得出如下结论:?甲、乙两班学生的平均水平相同;?乙班优秀人数比甲班优秀人数多(每分钟输入汉字达150个以上为优秀);?甲班同学比赛成绩的波动比乙班学生比赛成绩的波动大。 上述结论正确的是_______(填序号) 3、已知数据a,a,a,的方差是2,那么2a,2a,2a的标准差(精确到0.1)是_________ 。 123123 4、一组数据库,1,3,2,5,x的平均差为3,那么这组数据的标准差是 ______。 5、已知数据1,2,3,4,5的方差为2,则11,12,13,14,15的方差为_________ ,标准差为_______ 。 ,,,,xx6、数据x,x,x,x的平均数为,标准差为5,那么各个数据与之差的平方和为1234 __________。
7、甲、乙两人进行射击比赛,在相同条件下各射击10次,他们的平均成绩为7环,10次 22射击成绩的方差分别是:S=3,S=1.2,成绩较稳定的是 __________(填“甲”或“乙”)。甲乙 8、九年级上学期期末统一考试后,甲、乙两班的数学成绩(单位:分)的统计情况如下表所示: 班级考试人数平均分中位数众数方差甲 55 88 76 81 108 乙 55 85 72 80 112 从成绩的波动情况来看,________班学生的成绩的波动更大 19、已知一组数据x,x,x,x,x的平均数是2,方差是,那么另一组数据 3x-2,3x-2,1234 5123 3x-2,3x-2,3x-2的平均数是________,方差是________。 34 5 10、一组数据中若最小数与平均数相等,那么这组数据的方差为________。 二、选择题(每小题3分,计30分) 11、在学校对学生进行的晨检体温测量中,学生甲连续10天的体温与36?的上下波动数据 为:0.2, 0.3, 0.1, 0.1, 0, 0.2, 0.1, 0.1, 0.1, 0,则对这10天中该学生的体温 波动数据分析不正确的是( ) A、平均数为0.12 B、众数为0.1 C、中位数为0.1 D、方差为0.02 2,,,,xx12、对甲、乙两同学100米短跑进行5次测试,他们的成绩通过计算得;甲=乙,S甲 2=0.025,S=0.026,下列说法正确的是( ) 乙 A、甲短跑成绩比乙好 B、乙短跑成绩比甲好 C、甲比乙短跑成绩稳定 D、乙比甲短跑成绩稳定
第五章离中趋势测量法 主要内容:(1)变异指标;(2)全距和四分位差;(3)平均差、标准差和标准分;(4)绝对离势和相对离势;(5)偏度(及峰度) 所谓离中趋势,是指数列中各变量值之间的差距和离散程度。离势小,平均数的代表性高;离势大,平均数代表性低。 例如有A、B、C、D四组学生各5人的成绩如下: A组:60 ,60,60,60,60 B组:58,59,60,61,62 C组:40,50,60,70,80 D组:80,80,80,80,80 数据显示,平均数相同,离势可能不同;平均数不同,离势可能相同。 变异指标用以反映总体各单位标志值的变动范围或参差程度,与平均指标相对应,从另一个侧面反映了总体的特征。 变异指标如按数量关系来分有以下两类: 凡用绝对数来表达的变异指标,统称绝对离势; 主要有极差、平均差、四分位差、标准差等。 凡用相对数来表达的变异指标,统称相对离势; 主要有异众比率、标准差系数、平均差系数和一些常用的偏态系数。 第一节全距与四分位差 1.全距(Range) 全距(R):最大值和最小值之差。也叫极差。全距越大,表示变动越大。 R =Xmax - Xmin [例] 求74,84,69,91,87,74,69这些数字的全距。 [解] 把数字按顺序重新排列:69,69,74, 74,84,87,91,显然有 R =Xmax - Xmin=91 - 69=22
对分组资料,不能确知最大值和最小值,求全距: (1)用组值最大组的组中值减去最小组的组中值 (2)用组值最大组的上限减去最小组的下限 (3)用组值最大组的组中值减去最小组的下限;或最大组的上限减去最小组的组中值 优点:计算简单、直观。 缺点:(1)受极端值影响大; (2) 没有量度中间各个单位间的差异性,数据利用率低,信息丧失严重; (3)受抽样变动影响大,大样本全距比小样本全距大。 2. 四分位差(Quartile deviation) 第三四分位数和第一四分位数的半距。 避免全距受极端值影响大的缺点。 求下列两组成绩的四分位差: A: 78 80 82 85 89 87 90 86 79 88 84 81 B: 55 68 78 88 99 100 98 90 85 83 84 81 第二节 平均差(Mean absolute deviation) 要测定变量值的离中趋势,尤其是要测定各变量值相对于平均数的差异情况,一个很自然的想法就是计算各变量值与算术平均数的离差。平均差是离差绝对值的算术平均数。(mean deviation) 1.对于未分组资料 A · 2.对于分组资料 A · D=
第三章 数据的集中趋势与离散程度-----第01课时 课题:平均数(1) 目标: 1、了解平均数的意义,会计算一组数据的算术平均数,平均数。 2、在求实际问题的平均数的过程中,体会简化平均数算法的必要性,能灵活地用3数。 3重点:计算一组数据的平均数 教学过程: 一、基础训练 1、数据17,19,16,21,19,22的平均数是_____; 2、数据2、 3、x 、4的平均数是3,则x=________; 3、5个数的平均数是14,3个数的平均数是6,则这8个数的平均数是_____; 4、若两组数x 1,x 2,…,x n 和y 1,y 2,…,y n 的平均数分别为x 和y ,则x 1+y 1,x 2+y 2+y n 的平均数是_________; 5、一场突如其来的地震给玉树带来了巨大的灾难! 45 则全班平均捐款为________元; 6、强烈某食品厂为加强质量管理,对某天生产的罐头抽查了10342,348,346,340,344,341,343,350,340,342 求样本的平均数。 7、某班有50名学生,数学期中考试成绩90分有9人,84分的有12人,73分的有10有13人,56分有2人,45分有4位) 161cm ,B 均身高约为163cm ,小明一定比小丽矮吗? (二)引入新课,梳理知识 题1、2、3、4引入平均数的定义及直接算法,题5、6引入平均数的简便运算,题7穿插引入新课: 1、平均数的概念和计算方法 通常,我们用平均数表示一组数据的“平均水平”,即:这组数据都“接近”这个数。对于n x 2……,x n ,我们把 n 1 (x 1+x 2+…+x n ),叫做这n 个数的算术平均数,简称为平均数,记为x n 1 (x 1+x 2+…+x n )(公式一)x 读作:“x 拔” 剖析:⑴公式x =n 1 (x 1+x 2+…+x n ),是平均数的 “直接算法”;
第五章 离中趋势测量法 一、填空 1.对收集来的数据,数值最大者和最小者之差叫作( ),又称之为( )。 2.各变量值对其算术平均数(或中位数)离差绝对值的算术平均数,称之为( )。 3.全距由于没有度量( )之间的变异性,所以数据资料的利用率很低。 4.用绝对离势除以均值得到的相对指标,即为( )。 5.所谓( ),是指非众数的频数与总体单位数的比值。 6.偏斜系数是以标准差为单位的算术平均数与众数的离差,其取值一般在( )之间。偏斜系数为0表示( ),偏斜系数为3+或3-则表示极右或极左偏态。 二、单项选择 1.下面资料中哪个厂子的平均工资代表性意义最大( ),哪个厂子最小( )。 平均工资(元) 职工人数 工资标准差(元) A 甲厂 108 346 9.80 B 乙厂 96 530 11.40 C 丙厂 128 210 12.10 D 丁厂 84 175 9.60 2.变异指标中,以两数之差为计算基准的是( )。 A 全距 B 平均差 C 标准差 D 方差 3.比较两个性质不同的变量数列的平均数的代表性大小,必须计算( )。 A 标准差 B 平均差 C 全距 D 标准差系数 4.设有甲乙两个变量数列,甲数列的平均数和标准差分别为20和2.5,乙数列的平均数和标准差分别为50和5.2 ,这些数据说明( )。 A 甲数列的稳定性高于乙数列 B 甲数列的稳定性低于乙数列 C 甲乙两数列的稳定性相同 D 甲乙两数列的稳定性无法比较 5.某企业1994年职工平均工资为5200元,标准差为110元,1998年职工平均工资增长了40%,标准差扩大到150元。职工平均工资的相对变异( )。 A 增大 B 减小 C 不变 D 不能比较 三、多项选择 1.凡用绝对数来表达的变异指标,统称绝对离势,主要有( )。 A 极差 B 平均差 C 四分位差 D 标准差 E 标准分 2.凡用相对数来表达的变异指标,统称相对离势,主要有( )。 A 标准差 B 异众比率 C 标准差系数 D 平均差系数 E 偏态系数。 3 不同总体间的标准差,不能进行简单对比的原因是( )。 A 平均数不一致 B 总体单位数不一致
第五章 集中趋势与离散趋势 练习题: 1. 17名体重超重者参加了一项减肥计划,项目结束后,体重下降的重量分别为: (单位:千克) 12 10 15 8 2 6 14 12 10 12 10 10 11 10 5 10 16 (1)计算体重下降重量的中位数、众数和均值。 (2)计算体重下降重量的全距和四分位差。 (3)计算体重下降重量的方差和标准差。 解: (1)○1中位数: ! 对上面的数据进行从小到大的排序: M d 的位置=2 =9,数列中从左到右第9个是10,即M d =10。 ○2众数: 绘制各个数的频数分布表: “10”的频数是6,大于其他数据的频数,因此众数M O =“10” ○3均值: 18.1016 521 =+?++= = ∑=n n x X n i i (2)○1全距:R =max(x i )-min(x i )=16-2=14 ○2四分位差: 根据题意,首先求出Q 1和Q 3的位置:
Q 1的位置= 41+n =4 1 17+=,则Q 1=8+×(10-8)=9 Q 3的位置=4)1(3+n =4 ) 117(3+?=,则Q 3=12+×(12-12)=12 & Q= Q 3- Q 1=12-9=3 (3)○1方差: 2 21 222 () 1 (210.18)(510.18)(1610.18) 171 =12.404 n i i x x S n =-= --+--=-∑+?+ ○2 标准差: 3.52S === 2.下表是武汉市一家公司60名员工的省(市)籍的频数分布: 省(市)籍 频数(个) 湖北 28 \ 河南 12 湖南 6 四川 6 浙江 5 安徽 3 @ (1)根据上表找出众值。 (2)根据上表计算出异众比率。 解: (1)“湖北”的频数是28,大于其他省(市)籍的频数,因此众数M O =“湖北” (2)异众比率的计算公式为: mo r n f V n -= ( n 代表总频数,mo f 代表众数的频数) 其中n=60,mo f =28,则:
第五章离散趋势测量 一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确答案的序号,填写在题中的括号内。每小题2分,共20分) 1. 离散系数的主要目的是( )。 A. 反映一组数据的平均水平 B. 比较多组数据的平均水平 C. 反映一组数据的离散程度 D. 比较多组数据的离散程度 2. 两组数据的平均数不相等,但是标准差相等。那么( )。 A. 平均数小的,离散程度小 B. 平均数大的,离散程度大 C. 平均数大的,离散程度小 D. 两组数据离散程度相同 二、名词解释(每题4分,共20分) 3. 方差与标准差 四、计算题(每题 1 5分,共30分) 4.某校社会学专业共有两个班级。期末考试时, 一班同学社会学理论平均成绩为86分,标准差为12分。二班同学成绩如下所示。二班同学社会学理论成绩分组数据表 按成绩分组(分) 人数(个) 60分以下 2 60~70 7 70~80 9 80~90 7 90~100 3 合计30 要求: (1) 计算二班同学考试成绩的均值和标准差。 (2) 比较一班和二班哪个班成绩的离散程度更大? (提示: 使用离散系数)
5.甲单位人均月收入4500元, 标准差1200元。乙单位月收入分布如下所示。 乙单位月收入分布表 按收入分组(元) 人数(个) 3000 分以下120 3000~4000 420 4000~5000 540 5000~6000 420 6000 以上300 合计1800 要求: (1) 计算乙单位员工月收入的均值和标准差。 (2) 比较甲单位和乙单位哪个单位员工月收入的离散程度更大? (提示: 使用离散系数)
数据的集中趋势和离散程度检测题 (本检测题满分:100分,时间:90分钟) 一、选择题(每小题3分,共30分) 1.对于数据3,3,2,3,6,3,10,3,6,3,2:①这组数据的众数是3;②这组数据的众数与中位数的数值不等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等.其中正确结论的个数为( ) A.1 B.2 C.3 D.4 2.某公司员工的月工资如下表: A.2 200元,1 800元,1 600元 B.2 000元,1 600元,1 800元 C.2 200元,1 600元,1 800元 D.1 600元,1 800元,1 900元 3.某同学在本学期的前四次数学测验中得分依次是95,82,76,88,马上要进行第五次测验了,他希望五次成绩的平均分能达到85分,那么这次测验他应得( )分. A.84 B.75 C.82 D.87 4.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么所求出的平均数与实际平均数的差是( ) A.3.5 B.3 C.0.5 D.-3 5.(2014·天津中考)某公司欲招聘一名公关人员,对甲、乙、丙、丁四位候选人进行了面试和笔试,他们的成绩如下表: 如果公司认为,作为公关人员面试的成绩应该比笔试的成绩更重要,并分别赋予它们6和4的权.根据四人各自的平均成绩,公司将录取( ) A.甲 B.乙 C.丙 D.丁 6.(2013·山东日照中考)如图是某学校全体教职工年龄的频数分布直方图(统计中采用“上限不在内”的原则,如年龄为36岁统计在36≤x <38小组,而不在34≤x <36小组),根据图形提供的信息,下列说法中错误的是( ) A.该学校教职工总人数是50 B.年龄在40≤x <42小组的教职工人数占该学校全体教职工总人数的20% C.教职工年龄的中位数一定落在40≤x <42这一组 D.教职工年龄的众数一定落在38≤x <40这一组
第三章 数据的集中趋势和离散程度检测题 (本检测题满分:100分,时间:90分钟) 一、选择题(每小题3分,共30分) 1.对于数据3,3,2,3,6,3,10,3,6,3,2:①这组数据的众数是3;②这组数据的众数与中位数的数值不等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等.其中正确结论的个数为( ) A.1 B.2 C.3 D.4 2.某公司员工的月工资如下表: A.2 200元,1 800元,1 600元 B.2 000元,1 600元,1 800元 C.2 200元,1 600元,1 800元 D.1 600元,1 800元,1 900元 3.某同学在本学期的前四次数学测验中得分依次是95,82,76,88,马上要进行第五次测验了,他希望五次成绩的平均分能达到85分,那么这次测验他应得( )分. A.84 B.75 C.82 D.87 4.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么所求出的平均数与实际平均数的差是( ) A.3.5 B.3 C.0.5 D.-3 5.(2014·天津中考)某公司欲招聘一名公关人员,对甲、乙、丙、丁四位候选人进行了面试和笔试,他们的成绩如下表: 如果公司认为,作为公关人员面试的成绩应该比笔试的成绩更重要,并分别赋予它们6和4的权.根据四人各自的平均成绩,公司将录取( ) A.甲 B.乙 C.丙 D.丁 6.(2013·山东日照中考)如图是某学校全体教职工年龄的频数分布直方图(统计中采用“上限不在内”的原则,如年龄为36岁统计在36≤x <38小组,而不在34≤x <36小组),根据图形提供的信息,下列说法中错误的是( ) A.该学校教职工总人数是50 B.年龄在40≤x <42小组的教职工人数占该学校全体教职工总人数的20% C.教职工年龄的中位数一定落在40≤x <42这一组 D.教职工年龄的众数一定落在38≤x <40这一组
数据的集中趋势和离散程 度教案 It was last revised on January 2, 2021
第三章数据的集中趋势与离散程度-----第01课时 课题:平均数(1) 目标: 1、了解平均数的意义,会计算一组数据的算术平均数,并会用频数计算平均数和选取适当基数计算平均数。 2、在求实际问题的平均数的过程中,体会简化平均数算法的必要性,能灵活地用3种方法求平均数。 3、感受数学来源于实践,又为实践服务这一过程,体验转化的数学思想,养成用数学的良好意识。 重点:计算一组数据的平均数 教学过程: 一、基础训练 1、数据17,19,16,21,19,22的平均数是_____; 2、数据2、 3、x、4的平均数是3,则x=________; 3、5个数的平均数是14,3个数的平均数是6,则这8个数的平均数是_____; 4、若两组数x 1,x 2 ,…,x n 和y 1 ,y 2 ,…,y n 的平均数分别为x和y,则x 1 +y 1 ,x 2 +y2,…,x n+y n的平均数是_________; 5、一场突如其来的地震给玉树带来了巨大的灾难!“一方有难,八方支援”,某校九年级二班45名同学在学校举行的“爱心涌动校园”募捐活动中捐款情况如下表所示: 则全班平均捐款为________元; 6、强烈某食品厂为加强质量管理,对某天生产的罐头抽查了10个,样本,净重如下(单位:克) 342,348,346,340,344,341,343,350,340,342 求样本的平均数。 7、某班有50名学生,数学期中考试成绩90分有9人,84分的有12人,73分的有10人,65分有13人,56分有2人,45分有4人,计算这个班学生的数学期中考试平均成绩(保留到小数点后第一位)
海豚教育个性化简案 学生姓名:年级:科目: 授课日期:月日上课时间:时分------ 时分合计:小时 教学目标1. 巩固平均数、中位数、众数、极差、方差的概念与意义; 2. 经历数据的收集、整理、描述和分析的过程;能根据数据处理的结果,做出合理的判断和预测; 3. 综合运用上述知识复习解决具体问题。 重难点导航1. 熟悉数据的收集、整理、描述和分析,做出合理的判断和预测; 2. 对数据的收集、整理、描述和分析. 教学简案: 数据的集中趋势和离散程度 考点1:算术平均数 考点2:加权平均数 考点3:众数、中位数 考点4:从统计图中分析集中趋势考点五:方差、标准差 授课教师评价:□ 准时上课:无迟到和早退现象 (今日学生课堂表□ 今天所学知识点全部掌握:教师任意抽查一知识点,学生能完全掌握现符合共项)□ 上课态度认真:上课期间认真听讲,无任何不配合老师的情况 (大写)□ 海豚作业完成达标:全部按时按量完成所布置的作业,无少做漏做现象审核人签字:学生签字:教师签字: 备注:请交至行政前台处登记、存档保留,隔日无效(可另附教案内页)大写:壹贰叁肆签章:
海豚教育个性化教案(真题演练) 1.(2014徐州)甲、乙两人在5次打靶测试中命中的环数如下: 甲:8,8,7,8,9 乙:5,9,7,10,9 (1)填写下表: 平均数众数中位数方差 甲8 ▲8 0.4 乙▲9 ▲3.2 (2)教练根据这5次成绩,选择甲参加射击比赛,教练的理由是什么? (3)如果乙再射击1次,命中8环,那么乙射击成绩的方差.(填“变大”、“变小”或“不变”)
海豚教育个性化教案 数据的集中趋势和离散程度 考点1:算术平均数 【考点讲解】 1. 算术平均数:一般地,对于n 个数1x ,2x ,3x n x 。我们把)(1 21n x x x n x +++= 叫做这n 个数的算术平均数,简称为平均数。 2. 算术平均数的简化公式:设1x ,2x ,3x n x 的平均数为x ,,11x a x =-,,22x a x =- , n n x a x =-。,1x , ,2 x ,,3x , n x 的平均数为,x ,则a x x +=, 1.一组数1x ,2x n x 的平均数为x ,则将每个数据都乘以常数a 后再加上b ,得一组新数b ax +1,b ax +2, b ax +3 ,b ax n +,的平均数为b x a +。 【经典例题】 例1:某同学使用计算器求30个数据的平均数时,错将其中的一个数据105输入为15,那么由此求出的平均数与实际平均数的差是______。 例2:设两组数a 1,a 2,a 3……a n 和b 1,b 2,b 3……b n 的平均数为和,那么新的一组数a 1+b 1,a 2+b 2,a 3+b 3……a n +b n 的平均数是 [ ] A. (+) B. + C. (+) D. 以上都不对 例3:从鱼塘打捞草鱼240尾,从中任选9尾, 称得每尾的质量分另是1.5,1.6,1.4,1.6,6.2,1.7,1.8,1.3.1.4(单位:kg ),估计这240尾草鱼的总质量大约是( ) A .300kg B. 360kg C .36kg D. 30kg 例4:期中考试后,学习小组长算出全组5位同学数学成绩的平均分为M ,如果把M 当成另一个同学的分数,与原来的5个分数一起,算出6个分数的平均值为N ,那么M :N ( ) A 、56 B 、1 C 、6 5 D 、2 【针对性训练】 l .已知数据x 1,x 2,x 3,的平均数是a ,那么5 x 1 +7,5 x 3 +7,5 x 3 +7的平均数为( ) A .5a+7 B .a+7 C .7a D .5a 2.一组数据:4,-1,9,5,3,x 的平均数是4,那么x 等于( ) A 、3 B .4 C .5 D .6 3.2004年5月16 日是世界第14 个助残日,这天某 校老师为本区的特殊教育中心捐款情况如下:该校教师 平均每人捐款约_______元(精确到1元) 4.北京是一个严重缺水的城市,为鼓励居民节约每一滴水,某小区居委会表扬了100个节水模范用户,4月份这10 0户节约用水情况如下表:那么,4月份这100户平均每户节约用水______吨.
数据的集中趋势与离散程度——知识讲解 撰稿:杜少波 责编:张晓新 【学习目标】 1、掌握平均数、加权平均数的意义和求法,体会用样本平均数估计总体平均数的思想. 2、了解中位数和众数的意义,掌握中位数的求法,并会找一组数据的众数. 3、了解方差的意义及求法,体会用样本方差估计总体方差的思想,能用方差解决一些实际问题. 4、从事收集、整理、描述和分析数据得出结论的统计活动,经历数据处理的基本过程,体验统计与生活的联系,感受统计在生活和生产中的作用. 【要点梳理】 要点一、平均数和加权平均数 1.平均数 一般地,如果有n 个数据123n x x x x 、、、…,那么,()1231 n x x x x n ???++++就是这组数据的算术平均数,简称平均数,用“x ”表示.即()1231 n x x x x x n = ???++++. 要点诠释: (1)平均数表示一组数据的“平均水平”,反映了一组数据的集中趋势. (2)平均数的大小与一组数据里的每个数据均有关系,其中任意一个数据的变动都会引起平均数的变动,所以平均数容易受到个别特殊值的影响. 2.加权平均数 若数据1x 出现1f 次,2x 出现2f 次,3x 出现3f 次……k x 出现k f 次,这组数据的平均数为x ,则x = 1122k k 12k x f x f x f f f +f +++++……(其中1f +2f +…+k f =n ,k ≤n ) 在一组数据中,数据重复出现的次数f 叫做这个数据的权.按照上述方法求出的平均数,叫做加权平均数. 数据的权能够反映数据的相对“重要程度”. 要点诠释: (1)k f 越大,表示k x 的个数越多,“权”就越重. “权”越重,对平均数的影响就越大.加权平均数的分母恰好为各权的和. (2)加权平均数实际上是算术平均数的另一种表现形式,是平均数的简便运算. 要点二、中位数和众数 1.中位数 一般地,当一组数据按大小顺序排列后,位于正中间的一个数据(当数据的个数是奇数时)或正中间两个数据的平均数(当数据的个数是偶数时)叫做这组数据的中位数. 要点诠释: (1)一组数据的中位数是唯一的;一组数据的中位数不一定出现在这组数据中. (2)由一组数据的中位数可以知道中位数以上和以下数据各占一半. 2.众数 一组数据中出现次数最多的数据叫做这组数据的众数. 要点诠释:
第五章 离中趋势测量法 第一节 全距与四分位差 全矩与全矩的性质·四分位差 第二节 平均差 对于未分组资料·对于分组资料·平均差的性质 第三节 标准差 对于未分组资料·对于分组资料·标准差的性质及方差·标准分(Z 分数) 第四节 相对离势 变异系数(全矩系数·平均差系数·标准差系数)·异众比率 一、填空 1.对收集来的数据,数值最大者和最小者之差叫作( ),又称之为( )。 2.各变量值对其算术平均数(或中位数)离差绝对值的算术平均数,称之为( )。 3.全距由于没有度量( )之间的变异性,所以数据资料的利用率很低。 4.用绝对离势除以均值得到的相对指标,即为( )。 5.所谓( ),是指非众数的频数与总体单位数的比值。 6.偏斜系数是以标准差为单位的算术平均数与众数的离差,其取值一般在( )之间。偏斜系数为0表示( ),偏斜系数为3+或3-则表示极右或极左偏态。 二、单项选择 1.下面资料中哪个厂子的平均工资代表性意义最大( ),哪个厂子最小( )。 平均工资(元) 职工人数 工资标准差(元) A 甲厂 108 346 9.80 B 乙厂 96 530 11.40 C 丙厂 128 210 12.10 D 丁厂 84 175 9.60 2.变异指标中,以两数之差为计算基准的是( )。 A 全距 B 平均差 C 标准差 D 方差 3.比较两个性质不同的变量数列的平均数的代表性大小,必须计算( )。 A 标准差 B 平均差 C 全距 D 标准差系数 4.设有甲乙两个变量数列,甲数列的平均数和标准差分别为20和2.5,乙数列的平均数和标准差分别为50和5.2 ,这些数据说明( )。