文档库 最新最全的文档下载
当前位置:文档库 › 高中数学2015新课标步步高11.2

高中数学2015新课标步步高11.2

§11.2 用样本估计总体

1.频率分布直方图

(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的分布,另一种是用样本的数字特征估计总体的数字特征.

(2)在频率分布直方图中,纵轴表示频率

组距,数据落在各小组内的频率用各小长方形的面积

表示,各小长方形的面积总和等于1.

(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.

(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便. 2.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数

众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.

中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.

平均数:样本数据的算术平均数,即x =1

n (x 1+x 2+…+x n ).

在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差

标准差s = 1

n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],

其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.

标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.

1.判断下面结论是否正确(请在括号中打“√”或“×”)

(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. ( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.

( × )

(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.

( √ )

(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.

( × )

2.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2=________. 答案 3.2

解析 x =10+6+8+5+65

=7,

∴s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=16

5=3.2.

3.一个容量为20的样本,数据的分组及各组的频数如下:

[10,20),2;[20,30),3;[30,40),x ;[40,50),5;[50,60),4;[60,70),2;则x =________;根据样本的频率分布估计,数据落在[10,50)的概率约为________. 答案 4 0.7

解析 x =20-(2+3+5+4+2)=4, P =2+3+4+520=0.7或P =1-4+220

=0.7.

4.(2012·湖南) 如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.

(注:方差s 2=1

n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,

x n 的平均数) 答案 6.8

解析 依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为8+9+10+13+15

5

=11.

由方差公式得s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=1

5(9+4+1

+4+16)=6.8.

5.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.

答案600

解析由直方图易得数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,所以所求分数小于60分的学生数为3 000×0.2=600.

题型一频率分布直方图的绘制与应用

例1某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的

信息,回答下列问题:

(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;

(2)统计方法中,同一组数据常用该组区间的中点值作为代

表,据此估计本次考试中的平均分.

思维启迪利用各小长方形的面积和等于1求分数在[70,80)

内的频率,再补齐频率分布直方图.

解(1)设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.

(2)平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).

思维升华频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.

(2013·陕西)对一批产品的长度(单位:mm)进行抽样检测,下图为检测结果的频率分布直方图.根据标准,产品长度在区间[20,25)上的为一等品,在区间[15,20)和区间[25,30) 上的为二等品,在区间[10,15)和[30,35)上的为三等品.用频率估计概率,现从该

批产品中随机抽取一件,则其为二等品的概率为()

A.0.09 B.0.20 C.0.25 D.0.45

答案 D

解析设区间[25,30)对应矩形的另一边长为x,则所有矩形面积之和为1,即(0.02+0.04+0.06+0.03+x)×5=1,解得x=0.05.产品为二等品的概率为0.04×5+0.05×5=0.45. 题型二茎叶图的应用

例2如图是某青年歌手大奖

赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有() A.a1>a2

B.a2>a1

C.a1=a2

D.a1,a2的大小与m的值有关

思维启迪去掉的最低分和最高分就是第一行和第三行的数据,剩下的数我们只要计算其叶上数字之和,即可对问题作出结论.

答案 B

解析去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.故选B.

思维升华由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等.

(2013·山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:

则7个剩余分数的方差为

( )

A.1169

B.367 C .36

D.677

答案 B 解析 由题意知

87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=1

7

[(87-91)2

+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]

=17(16+9+1+0+1+9+0)=367. 题型三 用样本的数字特征估计总体的数字特征

例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.

(1)分别求出两人得分的平均数与方差;

(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 思维启迪 (1)先通过图象统计出甲、乙二人的成绩;

(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价. 解 (1)由题图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分;

乙:13分,14分,12分,12分,14分.

x 甲=10+13+12+14+165

=13,

x 乙=13+14+12+12+145

=13,

s 2甲=15

[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2乙=15

[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙可知乙的成绩较稳定.

从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.

思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.

(1)(2012·山东)在某次测量中得到的A 样本数据如下:

82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则

A,B两样本的下列数字特征对应相同的是() A.众数B.平均数C.中位数D.标准差

(2)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):

如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.

答案(1)D(2)甲

解析(1)对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.

(2)x甲=x乙=9环,s2甲=1

5

[(10-9)2+(8-9)2+(9-9)2+(9-9)2+(9-9)2]=2

5,

s2乙=1

5

[(10-9)2+(10-9)2+(7-9)2+(9-9)2+(9-9)2]=6

5>s

2

甲,故甲更稳定,故填甲.

高考中频率分布直方图的应用

典例:(5分)为了研究大学生就业后的收入问题,一个研究机构调查了在2009年已经就业且工作满两年的10 000人,并根据所得数据画了样本的频率分布直方图(如图所示).为了分析其收入与学历、职业、性别等方面的关系,要从这10 000人中再用分层抽样方法抽出200人作进一步调查,其中月收入低于1 500元的称为低收入者,高于3 000元的称为高收入者,则应在低收入者和高收入者中分别抽取的人数是()

A.1 000,2 000 B.40,80

C.20,40 D.10,20

思维启迪根据频率分布直方图的意义,分别计算出低收入者和高收入者的频率即可,为方便直接计算,这个频率分布直方图也可以看作是200个样本的频率分布直方图.

解析低收入者的频率是0.000 2×500=0.1,故从低收入者中抽取200×0.1=20人;

高收入者的频率是(0.000 3+0.000 1)×500=0.2,

故从高收入者中抽取200×0.2=40人.故选C.

答案 C

温馨提醒本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问

题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意.

方法与技巧

1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.

2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.

3.若取值x1,x2,…,x n的频率分别为p1,p2,…,p n,则其平均值为x1p1+x2p2+…+x n p n;

若x1,x2,…,x n的平均数为x,方差为s2,则ax1+b,ax2+b,…,ax n+b的平均数为

a x+b,方差为a2s2.

失误与防范

频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.

A组专项基础训练

一、选择题

1.(2013·重庆)下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为()

A.0.2 B.0.4 C.0.5 D.0.6

答案 B

解析10个数据落在区间[22,30)内的数据有22,22,27,29共4个,因此,所求的频率为4

10=

0.4.故选B.

2.(2013·辽宁)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次

为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )

A .45

B .50

C .55

D .60 答案 B

解析 由频率分布直方图,知低于60分的频率为 (0.01+0.005)×20=0.3.

∴该班学生人数n =15

0.3

=50.

3.(2012·陕西) 对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所

示),则该样本的中位数、众数、极差分别是

( )

A .46,45,56

B .46,45,53

C .47,45,56

D .45,47,53

答案 A 解

12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.

4.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m o ,平均值为x ,则( )

A .m e =m o =x

B .m e =m o <x

C .m e <m o <x

D .m o <m e <x

答案 D

解析 30个数中第15个数是5,第16个数是6,所以中位数m e =5+62=5.5,众数m o =

5,平均值x =

3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=179

30

.

5.若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为x ,方差为s 2,则 ( )

A.x =5,s 2<2

B.x =5,s 2>2

C.x >5,s 2<2

D.x >5,s 2>2

答案 A

解析 考查样本数据的平均数及方差. ∵1

8(x 1+x 2+…+x 8)=5, ∴1

9

(x 1+x 2+…+x 8+5)=5, ∴x =5,由方差定义及意义可知加入新数据5后,样本数据取值的稳定性比原来强, ∴s 2<2,故选A. 二、填空题

6.(2013·湖北)某学员在一次射击测试中射靶10次,命中环数如下:

7,8,7,9,5,4,9,10,7,4.

则:(1)平均命中环数为________; (2)命中环数的标准差为________.

答案 (1)7 (2)2

解析 (1)x =110(7+8+7+9+5+4+9+10+7+4)=70

10

=7.

(2)s 2=1

10[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7

-7)2+(4-7)2]=4, ∴命中环数的标准差为2.

7.(2012·山东)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.

答案 9

解析 结合直方图和样本数据的特点求解.

最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右边矩形面积为0.18×1=0.18,50×0.18=9.

8.将容量为n 的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n =________. 答案 60

解析 ∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,

∴前三组频数和为2+3+4

20·n =27,故n =60.

三、解答题

9.(2012·安徽)若某产品的直径长与标准值的差的绝对值不超过1 mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm)

(1)将上面表格中缺少的数据填在相应位置;

(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率; (3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数. 解 (1)

(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70.

(3)设这批产品中的合格品数为x 件,依题意505 000=20x +20,解得x =5 000×2050-20=1 980.

所以该批产品的合格品件数大约是1 980件.

10.(2012·广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].

(1)求图中a 的值;

(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;

(3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如

解 (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005.

(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).

(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.

由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×4

3

40,20×5

4=25.

故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.

B 组 专项能力提升

1.(2013·四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是

( )

答案 A

解析由于频率分布直方图的组距为5,排除C、D,又[0,5),[5,10)两组各一人,排除B,应选A.

2.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图所示.由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()

A.0.27,78 B.0.27,83

C.2.7,78 D.2.7,83

答案 A

解析由题意,知4.5到4.6之间的频率为0.09,4.6到4.7之间的频率为0.27,后6组的频数成等差数列,设公差为d,则有6×0.27+15d=1-0.01-0.03-0.09,解得d=-0.05,从而求得b=78.

3.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登记错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是() A.70,75 B.70,50

C.75,1.04 D.62,2.35

答案 B

解析因甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,

则由题意可得:s2=1

48

[(x1-70)2+(x2-70)2+…+(80-70)2+(70-70)2+…+(x48-70)2],

而更正前有75=1

48[(x 1-70)2+(x 2-70)2+…+(50-70)2+(100-70)2+…+(x 48-70)2],

化简整理得s 2=50.

4.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{a n },已知a 2=2a 1,且样本容量为300,则小长方形面积最大的一组的频数为________.

答案 160

解析 ∵小长方形的面积由小到大构成等比数列{a n },且a 2=2a 1, ∴样本的频率构成一个等比数列,且公比为2, ∴a 1+2a 1+4a 1+8a 1=15a 1=300,∴a 1=20, ∴小长方形面积最大的一组的频数为8a 1=160.

5.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.

答案 0.030 3

解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a =

1-0.700

10

=0.030.由题意知,身高在[120,130),[130,140),[140,150]内的学生分别为30人,20人,

10人,∴由分层抽样可知抽样比为1860=3

10,

∴在[140,150]中选取的学生应为3人.

6.某高校在2013年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,

(1)请先求出频率分布表中①、②位置相应数据,再完成下列频率分布直方图;

(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样的方法抽取6名学生进入第二轮面试,则第3、4、5组每组各抽取多少名学生进入第二轮面试?

(3)在(2)的前提下,学校决定在6名学生中随机抽取2名学生接受A 考官进行面试,求:第4组至少有一名学生被考官A 面试的概率.

解 (1)由题意可知,第2组的频数为0.35×100=35,

第3组的频率为30

100=0.300,

频率分布直方图如图所示:

(2)因为第3、4、5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,每组分别为

第3组:3060×6=3人,第4组:20

60×6=2人,

第5组:10

60×6=1人.

所以第3、4、5组分别抽取3人、2人、1人. (3)设第3组的3位同学为A 1,A 2,A 3, 第4组的2位同学为B 1,B 2, 第5组的1位同学为C 1,

则从六位同学中抽两位同学有15种可能如下:

(A 1,A 2),(A 1,A 3),(A 1,B 1),(A 1,B 2),(A 1,C 1),(A 2,A 3),(A 2,B 1),(A 2,B 2),(A 2,C 1),(A 3,B 1),(A 3,B 2),(A 3,C 1),(B 1,B 2),(B 1,C 1),(B 2,C 1).

其中第4组的2位同学至少有一位同学入选的有(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2),(B 1,C 1),(B 2,C 1)9种可能,

所以第4组的2位同学至少有一位同学入选的概率为915=3

5

.

相关文档
相关文档 最新文档