文档库 最新最全的文档下载
当前位置:文档库 › 线性回归的问题

线性回归的问题

线性回归的问题

1.内容概述

(1)考点动态

对线性回归问题的考查往往贴近生活实际,富有时代气息,已成为近几年高考的热点,主要以解答题形式出现,属于基础题。

(2)考点分析

重点:①回归直线的性质:回归直线过样本中心 回归分析:最小二乘法

难点:①回归模型的建立 ②数据处理

(3)考点误区

①回归方程的前提:首先要根据散点图或折线图来判断它们是否线性相关,只有具备线性相关关系时再求回归方程,否则即使求出回归方程也是毫无意义的,而且用其估计和预测也是不可信的。

②回归预测结果的文字表述.因为回归方程所求的量大都是估计数值,所以要注意一些关键词的使用,如“估计”“约为”,这是易忽视的问题。

2.例题示范

例1为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 7.5

根据上表可得回归直线方程 ,其中 ,据此估计,该社区一户收入为15万元家庭年支出为( )

A .11.4万元

B .11.8万元

C .12.0万元

D .12.2万元 解:由已知得(万元),(万元),

故,所以回归直线方程为,当社区一户收入为15万元家庭年支出为(万元),故选B . 评析:本题主要考查线性回归直线性质:回归直线过样本点的中心。

解答本题时,所求目标为一个回归预测,则需要求出回归直线方程,而回归直线方程只需求出回归系数a 即可。所以此题解题的关键是通过回归直线过样本中心这一性质求出回归系数a 。

在求回归系数a 时,容易犯以下错误:直接将样本数据的其中一组数据代入回归直线方程,错因:样本不一定在回归直线上,只有样本中心在回归直线上。

例2下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图

???y

bx a =+???0.76,b a y bx ==-8.28.610.011.311.9105x ++++=

= 6.27.58.08.59.8

85

y ++++==80.76100.4a =-?=?0.760.4y x =+?0.76150.411.8y

=?+=

(I )由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;

(II )建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量. 附注: 参考数据:

7

1

9.32i

i y

==∑,7

1

40.17i i i t y ==∑

0.55=,7≈2.646.

参考公式:相关系数()()

n

i

i

t t y y r --=

∑ 回归方程 中斜率和截距的最小二乘估计公式分别为: 1

2

1

()()

()n

i

i i n

i

i t

t y y b t

t ==--=

-∑∑,a y bt =-.

解:(Ⅰ)由折线图这数据和附注中参考数据得

4=t ,28)(7

1

2

=-∑=i i t t ,

55.0)(7

1

2

=-∑=i i y y , 89.232.9417.40))((71

7

1

7

1

=?-=-=

--∑∑∑===i i i

i i i i i

y

t y t y y t t

99.0646

.2255.089

.2≈??≈

r .

因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关相当高 从而可以用线性回归模型拟合y 与t 的关系.

(Ⅱ)由331.17

32.9≈=y 及(Ⅰ)得103.028

89

.2)()

)((?7

1

2

7

1

≈=

---=∑∑==i i

i i i

t t

y y t

t

b , 92.04103.0331.1??≈?-≈-=t b y a

, ???y

bx a =+

所以,y 关于t 的回归方程为:t y

10.092.0?+=. 将2016年对应的9=t 代入回归方程得:82.1910.092.0?=?+=y

, 所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨. 评析:本题主要考查线性相关与线性回归方程的求法与应用

解答本题第(1)问时,根据相关系数r 公式求出相关数据后,然后代入公式即可求得r 的值,最后根据其值大小回答即可;第(2)问时利用最小二乘法的原理提供的回归方程,准确求得相关数据即可建立y 关于t 的回归方程,然后把9=t 代入回归方程求得预测值。

此题在运算过程中,要善于对参考公式与数据的合理处理,提高运算的准确率。本题是一道典型的用最小二乘法来解决线性回归问题题,可以归纳出解决的五个步骤:第一步,确定变量;第二步,确定关系;第三步,确定回归系数;第四步,求回归方程;第五步,进行回归预测。

例3某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的宣传费和年销售量数据作了初

步处理,得到下面的散点图及一些统计量的值.

(I )根据散点图判断,与哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由);

(II )根据(I )的判断结果及表中数据,建立y 关于x 的回归方程;

(III )已知这种产品的年利润z 与x ,y 的关系为 ,根据(II )的结果回答下列问题:(i )当年宣传费49=x 时,年销售量及年利润的预报值时多少?

(ii )当年宣传费为何值时,年利润的预报值最大?附:对于一组数据

,,……,

其回归线

的斜率和截距的最小二乘估计分别为:,

i x ()1,2,,8i y i =y a bx =

+y c =+0.2z y x =-x 11(,)u v 22(,)u v (,)n n u v v u αβ=+1

2

1

()()

=()

n

i

i

i n

i

i u u v v u u β==---∑∑=v u αβ-

相关文档
相关文档 最新文档