文档库 最新最全的文档下载
当前位置:文档库 › 第一章 统计案例-高中数学北师大版选修1-2单元测评

第一章 统计案例-高中数学北师大版选修1-2单元测评

第一章 统计案例-高中数学北师大版选修1-2单元测评
第一章 统计案例-高中数学北师大版选修1-2单元测评

第一章测评

(时间:120分钟满分:150分)

一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)

1.具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=3e x+3的图像附近,则当x=-2时,y的值为()

A.3e

B.e

C.3e-1

D.e-1

x=-2时,y=3e-2+3=3e.

2.一位母亲记录了儿子3~9岁的身高,由此建立的身高y(单位:cm)与年龄x(单位:岁)的回归方程为

y=7.19x+73.93.用这个方程预测这个孩子10岁时的身高,则正确的叙述是()

A.身高一定是145.83 cm

B.身高在145.83 cm以上

C.身高在145.83 cm以下

D.身高在145.83 cm左右

,故选D.

3.下列结论正确的是()

①函数关系是一种确定性关系;

②相关关系是一种非确定性关系;

③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;

④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.

A.①②

B.①②③

C.①②④

D.①②③④

4.若线性回归方程为y=2-3.5x,则变量x增加一个单位,变量y平均()

A.减少3.5个单位

B.增加2个单位

C.增加3.5个单位

D.减少2个单位

b=-3.5,则变量x增加一个单位,y减少3.5个单位,即变量y平均减少3.5个单位.

5.下表是某厂1~4月份用水量(单位:百吨)的一组数据:

月份x1234

用水量y4.5432.5

由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是y=-0.7x+a,则a等

于()

A.10.5

B.5.15

C.5.2

D.5.25

解析:样本点的中心为(2.5,3.5),将其代入线性回归方程可解得a=5.25.

答案:D

6.两个分类变量X与Y,可能的取值分别为{x1,x2}和{y1,y2},其样本频数满足a=10,b=21,c+d=35,若X 与Y有关系的可信程度为90%,则c的值可能等于()

A.4

B.5

C.6

D.7

解析:若X与Y有关系的可信程度为90%,则χ2的范围为2.706<χ2<3.841,根据计算公式

χ2=及a=10,b=21,c+d=35可估算出c值.

答案:B

7.某公司过去五个月的广告费支出x与销售额y(单位:万元)之间有下列对应数据:

x24568

y▲40605070

工作人员不慎将表格中y的第一个数据丢失.已知y对x呈线性相关关系,且回归方程为y=6.5x+17.5,则下列说法:①销售额y与广告费支出正相关;②丢失的数据(表中▲处)为30;③该公司广告费支出每增加1万元,销售额一定增加6.5万元;④若该公司下月广告投入8万元,则销售额为70万元.其中,正确说法有()

A.1个

B.2个

C.3个

D.4个

解析:由回归直线方程为y=6.5x+17.5,可知b=6.5,则销售额y与广告费支出x正相关,所以①是正确的;由表中的数据可得=5,,把点代入回归方程,可得=6.5×5+17.5,解得a=30,所以②是正确的;该公司广告费支出每增加1万元,销售额应平均增加6.5万元,所以③不正确;若该公司下月广告投入8万元,则销售额为y=6.5×8+17.5=69.5万元,所以④不正确,故选B.

答案:B

8.观察下列散点图,其中两个变量的相关关系判断正确的是()

A.a为正相关,b为负相关,c为不相关

B.a为负相关,b为不相关,c为正相关

C.a为负相关,b为正相关,c为不相关

D.a为正相关,b为不相关,c为负相关

解析:根据散点图,由相关性可知:图a各点散步在从左下角到右上角的区域内,是正相关;图b中各点分布不成带状,相关性不明确,所以不相关;图c中各点分布从左上角到右下角的区域里,是负相关,故选D.

答案:D

9.某商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:

月平均气温x(℃)171382

月销售量y(件)24334055

由表中数据算出线性回归方程y=bx+a中的b=-2,气象部门预测下个月的平均气温为6 ℃,据此估计该商场下个月毛衣销售量约为()

A.58件

B.40件

C.38件

D.46件

解析:由表格得()为(10,38),因为()在回归方程y=bx+a上,且b=-2,

代入,得38=10×(-2)+a,解得a=58.

所以y=-2x+58,当x=6时,y=-2×6+58=46,故选D.

答案:D

10.某调查机构调查教师工作压力大小的情况,部分数据如表:

喜欢教师职业不喜欢教师职业总计

认为工作压力大533487

认为工作压力不大12113

总计6535100

则有()的把握认为“工作压力大与不喜欢教师职业有关系”.

A.99%

B.95%

C.90%

D.99.5%

解析:χ2=

=

≈4.9>3.841,

因此,有95%的把握认为工作压力大与不喜欢教师职业有关系.

答案:B

11.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表2,则与性别有关联的可能性最大的变量是()

表1

成绩

不及格及格总计

性别

男61420

女102232

总计163652

表2

视力

好差总计

性别

男41620

女122032

总计163652

表3

智商

偏高正常总计

性别

男81220

女82432

总计163652

表4

阅读量

丰富不丰富总计

性别

男14620

女23032

总计163652

A.成绩

B.视力

C.智商

D.阅读量

解析:因为,

,

,

,

则,所以阅读量与性别有关联的可能性最大.答案:D

12.

以下关于线性回归的判断,正确的个数是()

①若散点图中所有点都在一条直线附近,则这条直线为回归直线;

②散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;

③已知直线方程为y=0.50x-0.81,则x=25时,y的估计值为11.69;

④回归直线方程的意义是它反映了样本整体的变化趋势.

A.0

B.1

C.2

D.3

解析:∵能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数b,a得到的直线y=bx+a才是回归直线,∴①不对;②正确;∵将x=25代入y=0.50x-0.81,得

y=11.69,∴③正确;④正确,故选D.

答案:D

二、填空题(本大题共4小题,每小题5分,共20分.将答案填在题中的横线上)

13.许多因素都会影响贫穷,教育也许是其中之一.在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的线性回归方程为y=0.8x+4.6.斜率的估计值为0.8说明.

答案:美国一个地区的成年人受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线

的人数占本州人数的百分比将增加0.8%左右

14.在2017年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:

价格x99.51010.511

销售量y1110865

通过分析,发现销售量y对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线

方程为.

解析:x i y i=392,=10,=8,(x i-)2=2.5,代入公式,得b=-3.2,所以,a=-b=40,故回归直线方程为y=-3.2x+40.

答案:y=-3.2x+40

15.下面是一个2×2列联表:

y1y2总计

x1a2170

x25c30

总计b d100

则b-d=.

解析:∵a=70-21=49,c=30-5=25,

∴b=49+5=54,d=21+25=46.

∴b-d=8.

答案:8

16.下列说法:

①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;

②线性回归方程y=bx+a必过点();

③曲线上的点与该点的坐标之间具有相关关系;

④在一个2×2列联表中,由计算得χ2=13.079,则其两个变量间有关系的可能性是90%.

其中错误的是.(填序号)

解析:①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确.

答案:③④

三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)

17.(10分)在某化学反应的中间阶段,压力保持不变,温度从1 ℃变化到5 ℃,反应结果如下表所示(x代表温度,y代表结果):

x12345

y3571011

(1)求化学反应的结果y对温度x的线性回归方程y=bx+a;

(2)判断变量与y之间是正相关还是负相关,并预测当温度达到10 ℃时反应结果为多少?

附:线性回归方程y=bx+a中,b=,a=-b.

解:(1)由题意:n=5,x i=3,y i=7.2,

又-5=55-5×9=10,x i y i-5=129-5×3×7.2=21,

∴b==2.1,a=-b=7.2-2.1×3=0.9,

故所求的回归方程为y=2.1x+0.9.

(2)由于变量y的值随温度的值增加而增加(b=2.1>0),故x与y之间是正相关.

当x=10时,y=2.1×10+0.9=21.9.

18.(12分)电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.

根据已知条件完成下面的2×2列联表,并据此资料,你是否认为“体育迷”与性别有关?

非体育迷体育迷合计

女1055

合计

解:(1)由所给的频率分布直方图知,

“体育迷”人数为100×(10×0.020+10×0.005)=25.

“非体育迷”人数为75,则据题意完成2×2列联表:

非体育迷体育迷合计

男301545

女451055

合计7525100

将2×2列联表的数据代入公式计算:

χ2=≈3.030>2.706.

所以有90%的把握可以认为“体育迷”与性别有关.

19.(12分)某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如表所示:

喜欢甜品不喜欢甜品合计

南方学生602080

北方学生101020

合计7030100

根据表中数据,问是否能有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.

附:

P(χ2≥k0)0.1000.0500.010

k02.7063.8416.635

χ2=

解:(1)将2×2列联表中的数据代入计算公式,

得χ2=≈4.762.

由于4.762>3.841,所以能有95%的把握可以认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.

20.导学号18334011(12分)某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从该部门内随机抽选了10个企业为样本,有如下资料:

产量x(千件)生产费用(千元)

40150

42140

48160

55170

65150

79162

88185

100165

120190

140185

(1)计算x与y的相关系数;

(2)对这两个变量之间是否线性相关进行检验;

(3)设回归方程为y=bx+a,求回归系数.

解:(1)根据数据可得:

=77.7,=165.7,=70 903,

=277 119,

x i y i=132 938,所以r≈0.808,

即x与y之间的相关系数r≈0.808.

(2)因为r>0.75,所以可认为x与y之间具有线性相关关系.

(3)b=0.398,a=134.8.

21.导学号18334012(12分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:

日期12月1日12月2日12月3日12月4日12月5日

温差x(℃) 101113128

发芽数y(颗) 2325302616

该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.

(1)求选取的2组数据恰好是不相邻2天数据的概率;

(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x 的线性回归方程y=bx+a;

(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?

解:(1)设事件A表示“选取的2组数据恰好是不相邻2天的数据”,则表示“选取的数据恰好是相邻2天的数据”.

基本事件总数为10,事件包含的基本事件数为4.

易得P()=,

故P(A)=1-P()=.

(2)计算得=12,=27,x i y i=977,=434,

所以b==2.5,

a=-b=27-2.5×12=-3,

即y=2.5x-3.

(3)由(2)知:当x=10时,y=22,误差不超过2颗;

当x=8时,y=17,误差不超过2颗.

故所求得的线性回归方程是可靠的.

22.导学号18334013(12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.

(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到1名“25周岁以下组”工人的概率;

(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?

P0.1000.0500.0100.001

χ22.7063.8416.63510.828

解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.

所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为

A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.

从中随机抽取2名工人,所有的可能结果共有10种,它们

是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).

其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们

是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=.

(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手

60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可得2×2列联表如下:

生产能手非生产能手合计

25周岁以上组154560

25周岁以下组152540

合计3070100

所以得χ2==≈1.79.

因为1.79<2.706.所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.

相关文档