文档库 最新最全的文档下载
当前位置:文档库 › (完整版)第十二章相关和回归分析练习试题

(完整版)第十二章相关和回归分析练习试题

(完整版)第十二章相关和回归分析练习试题
(完整版)第十二章相关和回归分析练习试题

第十二章相关与回归分析

一、填空

1. 如果两变量的相关系数为0,说明这两变量之间__ 。

2.相关关系按方向不同,可分为_____ 和________ 。

3. 相关关系按相关变量的多少,分为和复相

关。

4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为(变化根据)的变

量,因

变量是随(自变量)的变化而发生相应变化的变量。

5.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性)变量。

6.变量间的相关程度,可以用不知Y与 X有关系时预测 Y的全部误差 E1,减去知道 Y与 X有关系时预测

Y的联系误差

E2,再将其化为比例来度量,这就是(削减误差比例)。

7.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个

1)实际观察值 Y 围绕每个估计值 Y c是服假定:

从();(2)分布中围绕每个可能的 Y c 值的()是相同的。

7. 已知:工资(元)倚劳动生产率(千元)的回归方程为yc 10 80x,因此,当劳动生产率每增长 1 千元,工资

就平均增加 80 元。

8.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量

变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。这

种分析方法,通常又称为(回归分析)。

9.积差系数 r 是(协方差)与 X 和 Y 的标准差的乘积之比。

二、单项选择

1.欲以图形显示两变量 X 和 Y 的关系,最好创建( D )。A 直方图 B 圆形图 C 柱形图 D 散点图

2.在相关分析中,对两个变量的要求是(A )。

A 都是随机变量

B 都不是随机变量

C 其中一个是随机变量,一个是常数

D 都是常数

3.相关关系的种类按其涉及变量多少可分为()。

A. 正相关和负相关

B. 单相关和复相关

C. 线性相关和非线性相关

D. 不相关、不完全相关、完全相关

4.关于相关系数,下面不正确的描述是(B )。

A当0 r 1时,表示两变量不完全相关; B 当 r=0 时,表示两变量间无相关;

C 两变量之间的相关关系是单相关;

D 如果自变量增长引起因变量的相应增长,就形成正相关关系。

5. 当变量 X按一定数量变化时,变量 Y 也随之近似地以固定的数量发生变化,这说明 X与 Y之间存在

()。

A. 正相关关系

B. 负相关关系

C. 直线相关关系

D. 曲线相关关系

6.当 x 按一定数额增加时, y 也近似地按一定数额随之增加,那么可以说 x 与 y 之间存在( A )关系。

A 直线正相关

B 直线负相关

C 曲线正相关

D 曲线负相关 7.评价直线相关关系的密切程度,当r 在

0.5 ~ 0.8 之间时,表示( C )。

A 无相关

B 低度相关

C 中等相关

D 高度相关

8. 两变量的相关系数为 0.8, 说明()

A. 两变量不相关

B. 两变量负相关

C.两变量不完全相关

D. 两变量完全正相关 9.两变量的线性相关系数为 0,表明两变量之间( D )。

A 完全相关

B 无关系

C 不完全相关

D 不存在线性相关

10. 兄弟两人的身高之间的关系是()A. 函数关系 B. 因果关系 C. 互为因果关系 D. 共变关系 11.身高和体重之间的关系是( C )。 A 函数关系 B 无关系 C 共变关系 D 严格的依存关系

12

.下列关系中,属于正相关关系得是( A )。

A 身高与体重

B 产品与单位成本

C 正常商品的价格和需求量

D 商品的零售额和流通费率 13 如果变量 x 和变量 y 之间的皮尔逊相关系数为 -1 ,说明这两个变量之间是( ) A. 低度相关 B. 完全相关 C. 高度相关 D. 完全不相关

28. 定类变量的相关分析可以使用 ( )A. λ系数 B. ρ系数 C. r 系数 D. τα系数 14.相关分析和回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不是随机的; B 在回归分析中,自变量是随机的,因变量不是随机的; C 在回归分析中,因变量和自变量都是随机的; D 在相关分析中,相关的两变量都是随机的。

15. 一元一次回归方程 Y=a+bx 中的 a 表示 ( ) 。 A. 斜率 B. 最小平均法 C. 回归直线 D. 截距

16. 当所有的观察值 y

都落在直线 y

c a bx

上时,则 x 与 y

之间的相关系数为( B )。

A 、r =0

B 、r =1

C 、 -1< r <1

D 、 0

A.可以根据 Y 值推断 X

B. 可以根据 X 值推断 Y

C. 可以互相推断

D. 不能进行推断 18.对于有线性相关关系的两变量建立的直线回归方城 Y=a+bx 中,回归系数 b ( B )。

A .肯定是正数

B .显著不为 0

C .可能为 0

D .肯定为负数

19. 年劳动生产率 x (千元)和工人工资 y (元)之间的回归方程为 y=10+70x ,这意味着年劳动生产率每提高 工人工资平均( )

A.增加 70元

B.减少 70 元

C.增加 80 元

D.减少 80 元

20 产量 X (千件 )与单位成本 Y (元) 之间的回归方程为 Y=77-3X, 这表示产量每提高 1000 件, 单

位成本平均 ( )

A.增加 3 元

B. 减少 3000 元

C.增加 3000 元

D. 减少 3 元

21.两变量 X 和 Y 的相关系数为 0.8 ,则其回归直线的判定系数为( C )。A 0.50 B 0.80 C 0.64 22.在完成了构造与评价一个回归模型后,我们可以( D )。 A 估计未来所需样本的容量 B 计算相关系数和判定系数

C 以给定的因变量的值估计自变量的值

D 以给定的自变量的值估计因变量的值 23. 对相关系数的显著性检验,通常采用的是( ① ) ① T 检验 ② F 检验 ③ Z 检验 24. 回归估计标准误差的计量单位与 ( )

A. 自变量相同

B. 因变量相同

C.相关系数相同

D. 自变量、因变量及相关系数均不同 25.在回归分析中,两个变量( D )。

A 都是随机变量

B 都不是随机变量

C 自变量是随机变量

D 因变量是随机变量 26. 已知变量 X 和 Y 之间的关系如图所示,则变量 X 和 Y 的相关系数为( D )。

A 因变量

B 自变量

C 相关系数

D 判定系数 28.以下指标恒为正的是( D )。A 相关系数 r B 截距 a C 斜率 b D 复相关系数 29. 对两变量进行回归分析时, ( )

A.前提是两变量之间存在较高的相关关系

B.其中任一变量都可以成为自变量或因 ( 依) 变量

C.两变量都是随机变量

D. 一变量是随机变量,另一变量是非随机变量

1 千元时, D 0.90

WORD 格式可编辑E.一变量是自变量,另一变量是因(依)变量

三、多项选择

1. 判定现象之间有无相关系数的方法是( ABC )。

A、对客观现象作定性分析

B、编制相关表

C、绘制相关图

D、计算相关系数

E、计算估计标准误2.回归分析和相关分析的关系是( ABE )。

A 回归分析可用于估计和预测

B 相关分析是研究变量之间的相互依存关系的密切程度

C 回归分析中自变量和因变量可以互相推导并进行预测

D 相关分析需区分自变量和因变量

E 相关分析是回归分析的基础 3.关于积差系数,下面正确的说法是(ABCD )。

A 积差系数是线性相关系数

B 在积差系数的计算公式中,变量 X和 Y 是对等关系

C 积差系数具有 PRE性质

D 在积差系数的计算公式中,变量 X和 Y 都是随机的

4.关于皮尔逊相关系数,下面正确的说法是( ACE )。

A 皮尔逊相关系数是线性相关系数

B 积差系数能够解释两变量间的因果关系

C r 公式中的两个变量都是随机的

D r 的取值在 1 和 0 之间

E 皮尔逊相关系数具有 PRE性质,但这要通过r 2加以反映 5.简单线性回归分析的特点是(

ABE )。

A 两个变量之间不是对等关系

B 回归系数有正负号

C 两个变量都是随机的

D 利用一个回归方程,两个变量可以互相推算

E 有可能求出两个回归方程 6.反映某一线性回归方程

y=a+bx 好坏的指标有( ABD )。

A 相关系数

B 判定系数

C b 的大小

D 估计标准误

E a 的大小 7.模拟回归方程进行分析适用

于( ACDE )。

A 变量之间存在一定程度的相关系数

B 不存在任何关系的几个变量之间

C 变量之间存在线性相关

D 变量之间存在曲线相关

E 时间序列变量和时间之间 8.判定系数 r 2=80%

和含义如下( ABC )。

A 自变量和因变量之间的相关关系的密切程度

B 因变量 y 的总变化中有 80%可以由回归直线来解释和说明

C 总偏差中有 80%可以由回归偏差来解释

D 相关系数一定为 0.64

E 判定系数和相关系数无关

9.以下指标恒为正的是( BC )。

A 相关系数

B 判定系数

C 复相关系数

D 偏相关系数

E 回归方程的斜率 10.一元线性回归分析中的回归系数 b 可以表示为( BC )。

A 两个变量之间相关关系的密切程度

B 两个变量之间相关关系的方向

C 当自变量增减一个单位时,因变量平均增减的量

D 当因变量增减一个单位时,自变量平均增减的量

E 回归模型的拟合优度

11.关于回归系数b,下面正确的说法是( AE )。

A b 也可以反映 X和 Y之间的关系强度。;

B 回归系数不解释两变量间的因果关系;

C b 公式中的两个变量都是随机的;

D b 的取值在 1 和 -1 之间;

E b 也有正负之分。 12、如果两个变量之间有一定的相关性,则以下结论中正确的是(①②③ )

①、回归系数b的绝对值大于零②、判定系数R2大于零③、相关系数 r 的绝对值大于 0.3

13、当所有的观察值都落在回归直线y 0 1x 上时,下述备选答案成立的有(②③ )

①r=0 ② ∣r∣= 1 ③ s y =0

五、判断题

1. 相关关系和函数关系都属于完全确定性的依存关系。() 2.不管相关关系表现形式如何,当r =1 时,变量 X和变量 Y都是完全相关。(√ )

3.不管相关关系表现形式如何,当r =0时,变量 X和变量 Y都是完全不相关。(× )

4.若 x 与 y 之间的相关系数 r=-0.9 ,表示二者“不相关” 。() 5.通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布的比较进行的。而如果两变量间是相关的话,必然存在着Y 的相对频数条件分布相同,且和它的相对频数边际分布相同。(× ) 6.如果众数频数集中在条件频数分布列联表的同一行中,系数便会等于 0,从而无法显示两变量之间的相关性。

(√ ) 7.由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。(√ )

8. 不论是相关分析还是回归分析,都必须确定自变量和因变量。() 9.从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。(× )

10、在回归分析中,通常假定~N (0, 2)。(√ )

11. 只有当两个变量之间存在较高程度的相关关系时,回归分析才有意义。()

六、计算题

1.对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为 200 人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。

解:①相对频数的联合分布列联表

两边同除以 n 并移项后得

bx

解:估计标准误差的计算公式为:

将已知数据代入公式有:

4.某市有 12 所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质

解: r s 1-6

2d

2

0.94 s

n(n 2

-1)

请计算婚姻美满与文化程度之 Gamma 系数和肯德

尔相关系数 τ

c

③民族音乐的态度与被调查者的年岁

有关系

2.已知直线回归方程 y

c a bx

中, b =17.5 ;又知 n =30, y 13500

, x 12, 则可知 a =

。答案: 240

解:根据正规方程组中的一个方程: y na 13500 a 将已知数据代入方程: 30

17.5 12 240 3.已知回归方程 y c 10 0.5x , n =40 ,

460 xy 7800

2

y 8652

, 试计算估计标准误差。

S y

y 2

a y

b xy n2

S y

8652 10 460 0.5 7800 2

40 2

1n

s n d

0.83 1

2

n(n 1)

5.以下是婚姻美满与文化程度的抽样调查的结果,

已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的斯皮尔曼等级相关系数。 ( 10 分)

解: n s =9×(30+18+4+7)+16×(18+7) +8×(4+7)+30 ×7=1229 n d =5×(30+8+3+4)+18 ×(3+4)+16 ×(8+3)+30 ×3=617

n s n d 1

n 2

(m 1)/m

0.18

6 d

2

解: r

s 1-

n 6(n 2-d 1)

0.95

7.根据下述假设资料,试用积差法求相关系数。

解:

n xy x y

0.70

n x 2

(

x) 2

n y 2

( y) 2

8 .下面是对 50 名被调查者的英语成绩和法语成绩的抽样调查:求 Gamma 系数。

解: G

n s n d n s n d

390 164

0.41 390 164

9.青年歌手大奖赛评委会对 10 名决赛选手的演唱水平( X )和综合素质( Y )进行打分,评价结果如下表(表中 6.以下为两位评判员对 10 名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员

6 d

2

解:

r s 1 2

s

n n 2

1

10.某原始资料为:

yx a= b 11.477 y=a+bx=-11.477+0.267x nn

11.已知十名学生身高和体重资料如下表, ( 1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关 系数;( 2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量) 。 身高( cm ) 171 167 177 154 169 体重( kg )

53 56 64 49 55 身高( cm ) 175 163 152 172 162 体重( kg )

66

52

47

58

50

解:

编号

身高( cm ) 体重

x

2

2

(kg )y

y

2

x

y

1

171

53

29241

2809

9

063

2

167

56

27889 3136

9

352

3

177

64 31329

4096

1

1328

4

154 49

23716 2401

7

546

5

169

55 28561

3025

9

295

6

175 66

30625 4356

1

1550

7

163

52 26569

2704

8

476

8

152 47

23104 2209

7

144

9

172

58 29584

3364

9

976

10

162 50

26244

2500

8

100

合计

1662

550

276862 30600

9

1830

n xy x y

n x 2

( x) 2

n y 2

(

y)

2

6 36

2

10102

1

0.78

n xy x y b

2 2 0.89 n x 2 ( x)2 0.659

54.479 y=a+bx=-54.479+0.659x

皮尔逊相关系数: 0.889

,斯皮尔曼相关系数: 0.94 ,回归方程: Y=-54.48+0.66X 】 12.根据下述假设资料求回归方程。

n xy x y y x 解: b 2 2 0.782 a= b 22.014 y=a+bx=22.014+0.782x n x 2 ( x) 2

n n

13.某 10 户家庭样本具有下列收入(元)和食品支出(元 / 周)数据:

要求: 1)写出最小平方法计算的回归直线方程;

2 )在 95.46 %把握下,当 X =45 时,写出 Y 的预测区间。

14要求: ①、利用最小二乘法求出估计的回归方程; ② 、计算判定系数 R 。

① 计算估计的回归方程:

x

1

144.2 – 0.567 ×58=111.314 1

n

估计的回归方程为: y =111.314+0.567 x

② 计算判定系数:

y

a= n

斯皮尔曼相关系数 r s 1- 6 d 2

1-

n(n 2

-1) 0.94 解: b

n xy x y

22

n x ( x)

0.196

y

a=

n

2.585 y=a+bx=2.585+0.196x

附:

5

i 1 (

x i

2

x)

2 1080

5

i1

(y i

i1

2

y)2

392.8 58 y

144.2

5

2

i 1

x i

17900

i1

2

y i 104361

i1

x i

y

i

42430

xy x y 5 42430 290 721

2

( x)2

2

5 17900

290

3060

=0.567

5400

22

12(x x)20.56721080

1

20.884 (y y)2392.8

R2

1回归分析测试题

回归分析测试题 A 卷 一、 选择题: 1.炼钢时钢水的含碳量和冶炼时间有( ) A.确定性关系 B.相关关系 C.函数关系 D.无任何关系 2.对相关性的描述正确的是( ) A .相关性是一种因果关系 B .相关性是一种函数关系 C .相关性是变量和变量之间带有随机性的关系 D .以上都不正确 3.∑=n i i i y x 1等于( ) A.121)(y x x x n +++ B.121)(x y y y n +++ C. ++2211y x y x D.n n y x y x y x +++ 2211 4.设有一个回归方程为x y 5.22-=,则变量x 增加一个单位时( ) A .y 平均增加2.5个单位 B.y 平均增加2个单位 C.y 平均减少2.5个单位 D.y 平均减少2个单位 5.x 与y 之间的线性回归方程a bx y +=必定过( ) A.(0,0)点 B.(0,x )点 C.(0,y ) D.(y x ,) 6.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8对观测值,计算得 528 1 =∑=i i x , 2288 1 =∑=i i y ,

4788 1 2=∑=i i x ,18498 1 =∑=i i i y x ,则y 和x 的回归方程是( ) A.x y 62.247.11+= B.x y 62.247.11+-= C.62.247.11+=x y D.x y 62.247.11-= 7.线性回归方程a bx y +=有一组独立的观测数据),(11y x ,),(,),,(22n n y x y x ,则系数b 的值为( ) A. ∑∑==---n i i n i i i y y y y x x 1 2 1 )() )(( B. ∑∑==--n i i n i i i x y y x x 1 21 ) )(( C. ∑∑==---n i i n i i i x x y y x x 1 21 )() )(( D. ∑∑==--n i i n i i y y x x 12 12 )()( 8.已知x 、y 之间的一组数据: 则y 和x 的线性回归方程 a bx y +=必过点( ) A .(2,2) B.(1.5, 0) C. (1, 2) D.(1.5, 4) 二、填空题: 9.线性回归方程a bx y +=中,b 的意义是 . 10.有下列关系:(1)人的年龄和他(她)拥有的财富之间的关系;(2)曲线上的点和该点的坐标之间的关系;(3)苹果的产量和气候之间的关系;(4)森林中的同一种树木,其断面直径和高度之间的关系;(5)学生和他(她)的学号之间的关系.其中有相关关系的是 . 11.若施化肥量x 和水稻产量y 的回归直线方程为2505+=x y , 当施化肥量为80kg 时,预计的水稻产量为 . 12.已知线性回归方程{}),19,13,7,5,1(455.1∈+=x x y 则=y . 13.对于线性回归方程25775.4+=x y ,当28=x 时,y 的估计值是 . 三、解答题: 14.为了研究三月下旬的平均气温(x C 0)和四月二十号前棉花害虫化蛹高峰 x 0 1 2 3 y 1 3 5 7

应用回归分析第章课后习题答案

第6章 6.1 试举一个产生多重共线性的经济实例。 答:例如有人建立某地区粮食产量回归模型,以粮食产量为因变量Y,化肥用量为X1,水浇地面积为X2,农业投入资金为X3。由于农业投入资金X3与化肥用量X1,水浇地面积X2有很强的相关性,所以回归方程效果会很差。再例如根据某行业企业数据资料拟合此行业的生产函数时,资本投入、劳动力投入、资金投入与能源供应都与企业的生产规模有关,往往出现高度相关情况,大企业二者都大,小企业都小。 6.2多重共线性对回归参数的估计有何影响? 答:1、完全共线性下参数估计量不存在; 2、参数估计量经济含义不合理; 3、变量的显著性检验失去意义; 4、模型的预测功能失效。 6.3 具有严重多重共线性的回归方程能不能用来做经济预测? 答:虽然参数估计值方差的变大容易使区间预测的“区间”变大,使预测失去意义。但如果利用模型去做经济预测,只要保证自变量的相关类型在未来期中一直保持不变,即使回归模型中包含严重多重共线性的变量,也可以得到较好预测结果;否则会对经济预测产生严重的影响。 6.4多重共线性的产生于样本容量的个数n、自变量的个数p有无关系? 答:有关系,增加样本容量不能消除模型中的多重共线性,但能适当消除多重共线性造成的后果。当自变量的个数p较大时,一般多重共线性容易发生,所以自变量应选择少而精。 6.6对第5章习题9财政收入的数据分析多重共线性,并根据多重共线性剔除变量。将所得结果与逐步回归法所得的选元结果相比较。 5.9 在研究国家财政收入时,我们把财政收入按收入形式分为:各项税收收入、企业收入、债务收入、国家能源交通重点建设收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。为了建立国家财政收入回归模型,我们以财政收入y(亿元)为因变量,自变量如下:x1为农业增加值(亿元),x2为工业增加值(亿元),x3为建筑业增加值(亿元),x4为人口数(万人),x5为社

26、回归分析测试题及答案

中级经济师基础知识 第 1题:单选题(本题1分) 某公司产品当产量为1000单位时,其总成本为4000元;当产量为2000单位时,其总成本为5000,则设产量为x,总成本为y,正确的一元回归方程表达式应该是( )。 A、y = 3000 + x B、y = 4000 + 4x C、y = 4000 + x D、y = 3000 + 4x 【正确答案】:A 【答案解析】: 本题可列方程组:设该方程为y = a + bx,则由题意可得:4000 = a + 1000b5000 = a + 2000b 解该方程,得b=1,a=3000,所以方程为y = 3000 + x 第 2题:单选题(本题1分) 在回归分析中,估计回归系数的最小二乘法的原理是( )。 A、使得因变量观测值与均值之间的离差平方和最小 B、使得因变量估计值与均值之间的离差平方和最小 C、使得观测值与估计值之间的乘积和最小 D、使得因变量观测值与估计值之间的离差平方和最小 【正确答案】:D 【答案解析】: 较偏较难的一道题目。最小二乘法就是使得因变量的观测值与估计值之间的离差平方和最小来估计参数的一种方法 第 3题:多选题(本题2分) 关于相关分析和回归分析的说法,正确的的有() A、相关分析可以从一个变量的变化来推测另一个变量的变化 B、相关分析研究变量间相关的方向和相关的程度 C、相关分析中需要明确自变量和因变量 D、回归分析研究变量间相互关系的具体形式 E、相关分析和回归分析在研究方法和研究目的有明显区别 【正确答案】:BDE 【答案解析】: 相关分析与回归分析在研究目的和方法上具有明显的区别。 (1)、相关分析研究变量之间相关的方向和相关的程度,无法从一个变量的变化来推测另一变量的变化情况。 (2)、回归分析是研究变量之间相关关系的具体形式

回归分析模拟试题分解

(1)根据给定的模型,考察当x趋向于无穷大时y的变化,确定参数C0的初始值; (2)求给定的模型关于参数C0、C1、C2的导数; (3)若取参数的初始值C0=100,C1=4to7搜索步长0.1,C2=3to5搜索步长0.1,利用高斯-牛顿迭代法进行参数估计,得到结果如下: 请写出完成该运算的SAS程序(数据集sta7)、拟合所得的模型,计算所得的相关指数R2。Data its_4; Input x y@@; Cards; 1 0.5 2 2.5 3 3.5 4 24 5 54.7 6 82.1 7 94.8

8 96.2 9 96.4 ; ________________________________ Proc qplot; Plot y*x=’*’/grtd; Run; ______________________________ Proc nlin; Paras c0=100 c1=3 to 6 by 0.02 c2=3 to 6 by 0.02; Model y=c0-c0/(1+(x/c2)**c1); Run; 多重共线性对回归参数的估计有何影响? 1.对参数的估计值不精确,也不稳定。样本观测值稍有变动,增加或减少解释变量都会使参数估计值发生较大变化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响。 2.参数估计的标准差较大,使参数的显著性t检验增加了接受原假设的可能,从而舍去对被解释变量有显著影响的解释变量。 主成分回归的思想和分析步骤: 有偏估计的方法:参数的有偏估计方法有岭回归、主成分回归和偏最小二乘。 主成分回归的思想和方法: (1)主成分回归是利用主成分分析的思想,在损失信息很少的前提下把原变量利用正交旋转变化转化为较少个数的主成分(综合指标),计算样品在所选主成分上的得分,将原因变量对原来各分析样品主成分得分进行回归,并将各主成分分别对原自变量进行回归后再代入原因变量对主成分的回归方程就得到主成分回归方程。 (2)分析步骤: 1.求原自变量集的相关系数矩阵及其特征值和相应的标准正交特征向量; 2.按从大到小排列特征值,以累计方差贡献率>=85%选取前面较大的若干个特征值,利用其相应的特征向量构成主成分; 3.计算各样品在所选主成分上的得分; 4.利用原因变量对所选主成分得分进行回归,各主成分分析对原自变量进行回归并将所得的回归结果代入原因变量对所选主成分的回归方法既得结果 该方法的主要用途是消除自变量间的多重共线性,它与回归参数的普通最小二重估计的主

应用回归分析,第7章课后习题参考答案

第7章岭回归 思考与练习参考答案 7.1 岭回归估计是在什么情况下提出的? 答:当自变量间存在复共线性时,|X’X|≈0,回归系数估计的方差就很大,估计值就很不稳定,为解决多重共线性,并使回归得到合理的结果,70年代提出了岭回归(Ridge Regression,简记为RR)。 7.2岭回归的定义及统计思想是什么? 答:岭回归法就是以引入偏误为代价减小参数估计量的方差的一种回归方法,其统计思想是对于(X’X)-1为奇异时,给X’X加上一个正常数矩阵 D, 那么X’X+D接近奇异的程度就会比X′X接近奇异的程度小得多,从而完成回归。但是这样的回归必定丢失了信息,不满足blue。但这样的代价有时是值得的,因为这样可以获得与专业知识相一致的结果。 7.3 选择岭参数k有哪几种方法? 答:最优 是依赖于未知参数 和 的,几种常见的选择方法是: 岭迹法:选择 的点能使各岭估计基本稳定,岭估计符号合理,回归系数没有不合乎经济意义的绝对值,且残差平方和增大不太多;

方差扩大因子法: ,其对角线元 是岭估计的方差扩大因子。要让 ; 残差平方和:满足 成立的最大的 值。 7.4 用岭回归方法选择自变量应遵循哪些基本原则? 答:岭回归选择变量通常的原则是: 1. 在岭回归的计算中,我们通常假定涉及矩阵已经中心化和标准化了,这样可以直接比较标准化岭回归系数的大小。我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量; 2. 当k值较小时,标准化岭回归系数的绝对值并不很小,但是不稳定,随着k的增加迅速趋近于零。像这样岭回归系数不稳定、震动趋于零的自变量,我们也可以予以剔除; 3. 去掉标准化岭回归系数很不稳定的自变量。如果有若干个岭回归系数不稳定,究竟去掉几个,去掉那几个,要根据去掉某个变量后重新进行岭回归分析的效果来确定。

应用回归分析,第8章课后习题参考答案

第8章 非线性回归 思考与练习参考答案 8.1 在非线性回归线性化时,对因变量作变换应注意什么问题? 答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。如: (1) 乘性误差项,模型形式为 e y AK L αβε =, (2) 加性误差项,模型形式为y AK L αβ ε = + 对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。 一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。 8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。 表8.15 生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%) 5.2 6.5 6.8 8.1 10.2 10.3 13.0 解:先画出散点图如下图: 5000.00 4000.003000.002000.001000.00x 12.00 10.00 8.006.00 y

从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。 (1)二次曲线 SPSS 输出结果如下: Model Summ ary .981 .962 .942 .651 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x. ANOVA 42.571221.28650.160.001 1.6974.424 44.269 6 Regression Residual Total Sum of Squares df Mean Square F Sig.The independent variable is x. Coe fficients -.001.001-.449-.891.4234.47E -007.000 1.417 2.812.0485.843 1.324 4.414.012 x x ** 2 (Constant) B Std. E rror Unstandardized Coefficients Beta Standardized Coefficients t Sig. 从上表可以得到回归方程为:72? 5.8430.087 4.4710y x x -=-+? 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。 由x 2的系数检验P 值小于0.05,得到x 2的系数通过了显著性检验。 (2)指数曲线 Model Summ ary .970 .941 .929 .085 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x.

模拟试题(卷)

在概率抽样中,样本量相同时,设计效应小于1的抽样方法是()。 A. 简单随机抽样 B. 分层抽样 C. 整群抽样 D. 系统抽样 正确答案:B 问卷调查法的应用程序中,首当其冲的是要()。 A. 设计调查问卷 B. 选择、确定调查对象 C. 发放调查问卷 D. 回收、审查调查问卷 正确答案:B 试题解析: 时间数列编制的主要原则是()。 A. 可加性 B. 可比性 C. 完整性 D. 连续性 正确答案:B

某大学调查研究该大学本科生平均每月的生活费支出,为此,抽取了300名学生进行调查,发现他们每月平均生活费支出是900元。该研究的总体是()。 A. 该大学的所有学生 B. 该大学所有大学生的总生活费支出 C. 所调查的300名学生 D. 该大学所有的在校本科生 正确答案:D 由于抽取样本的随机性造成的误差是()。 A. 无回答误差 B. 测量误差 C. 抽样框误差 D. 抽样误差 正确答案:D 如果时间数列共有15年的年度资料,若使用4项移动平均法进行修匀,则修匀之后的时间数列有()。 A. 15项 B. 14项 C. 12项 D. 11项 正确答案:C 下列哪种情况不适合用文案调研法?()。

A. 市场供求趋势分析 B. 市场覆盖率分析 C. 相关和回归分析 D. 顾客满意度分析 正确答案:D 统计调查的继续和统计分析的前提是()。 A. 数据处理 B. 统计设计 C. 撰写报告 D. 统计准备 正确答案:A 构成统计总体的个别事物称为()。 A. 调查对象 B. 总体单位 C. 标志值 D. 品质标志 正确答案:B 试题解析: 对具有因果关系的现象进行回归分析时,以下说法正确的是()。

西南财经_计量经济学期末试题

西南财经大学2007 - 2008 学年第一学期 各专业本科 2005 级(三年级一学期)学号评定成绩(分)学生姓名担任教师 《计量经济学》期末闭卷考试题 (下述一 - 四题全作计100分,两小时完卷) 考试日期: 试题全文: 一、单选题答案 二、多选题答案

一、 单项选择题(每小题1分,共30分) 1、以下模型中属于线性回归模型是( ) A. 212()i i i E Y X X ββ=+ B. 1()i i i E Y X β= C. 212()i i i E Y X X ββ=+ D. 12 i i i X Y u ββ=+ + 2、半对数模型01ln Y X ααμ=++中,参数1α的含义是( ) A . X 的绝对量发生一定变动时,引起因变量Y 的相对变化率 B .Y 关于X 的弹性 C .X 的相对变化,引起Y 的期望值绝对量变化 D .Y 关于X 的边际变化 3、在模型12233t t t t Y X X u βββ=+++的回归分析结果报告中,设F 统计量对应p 值为 F p ,给定显著性水平0.05α=,则下列说法正确是表明( ) A 、若F p α<,解释变量2t X 对t Y 的影响是显著的 B 、若F p α≥,解释变量2t X 和3t X 对t Y 的联合影响是显著的 C 、若F p α< ,则解释变量2t X 和3t X 对t Y 的影响均不显著 D 、以上说法均不对 4、对被解释变量Y 个别值作的区间预测,不具有的特点是( ) A. 对Y 的预测区间是随F X 的变化而变化的 B. 对Y 的预测区间上下限与样本容量有关 C. 对Y 的预测区间只决定于随机扰动i u 的方差 D. 对Y 的预测区间不仅受抽样波动影响,而且还受随机扰动项的影响 5、对多元线性回归方程的显著性检验,所用的F 统计量可表示为( )

应用回归分析填空题和答案

应用回归分析填空题和答案

应用回归分析:填空 (1) 回归分析是处理变量间_______关系的一种数理统计方法,若变量间具有线性关系,则称相应的回归分析为____________;若变量间不具有线性关系,就称相应的回归分析为___________________。 (2) 现代统计学中研究统计关系的两个重要分支是_________和_____________。 (3) 回归模型的建立是基于回归变量的样本统计数据,常用的样本数据分为___ ___________________和______________________。 (4) 回归模型通常应用于______________________、____________________和_____________________等方面。 (5) 最小二乘法的基本特点是使回归值与_________________________平方和为最小,最小二乘法的理论依据是___________________________。 (6) 多元线性回归模型εβ+=X Y ,回归参数β的最小二乘估计为 β?=_________________________。 (7) 设线性回归模型参数向量β(p+1维)的最小二乘估计为β ?,c 为p+1维常数向量,则______________是____________的最小方差线性无偏估计。 (8) 在线性回归分析中,最小二乘估计的性质有______________; _____ _____________和____________________等。 (9) 多元线性回归模型n i x x y i ip p i i ,,2,1,110 =++++=εβββ,误差项()n i i ,,2,1, =ε需满足的markov Gauss -假设为: (a):________________________________________; (b):________________________________________; (c):_________________________________________。 (10) 对回归方程做显著性检验时,可以用P 值代替检验统计量值,作出拒绝或接受原假设的决定:当P_______α时,接受0H ;当P________α时,拒绝0H 。 (11) 在p 元线性回归中,确定随机变量y 与自变量12,,,p x x x 间是否有线性

回归分析练习试题和参考答案解析

1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 α=)。 (5)检验回归方程线性关系的显著性(0.05 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 解:(1)

可能存在线性关系。 (2)相关系数: 系数a 模型非标准化系数标准系数 t Sig. 相关性 B标准误差试用版零阶偏部分 1(常量).003 人均GDP.309.008.998.000.998.998.998 a. 因变量: 人均消费水平 有很强的线性关系。 (3)回归方程:734.6930.309 y x =+ 系数a 模型非标准化系数标准系数t Sig.相关性

回归系数的含义:人均GDP没增加1元,人均消费增加元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。 系数(a) 模型非标准化系数标准化系数 t显著性B标准误Beta 1(常量) 人均GDP(元) %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4) 模型汇总 模型R R 方调整 R 方标准估计的误 差 1.998a.996.996 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。 模型摘要 模型R R 方调整的 R 方估计的标准差

回归分析练习题及参考答案

1 下面是7个地区2000年的人均国生产总值(GDP)和人均消费水平的统计数据: 地区人均GDP/元人均消费水平/元 22460 11226 34547 4851 5444 2662 4549 7326 4490 11546 2396 2208 1608 2035 求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 (5)检验回归方程线性关系的显著性(0.05 α=)。 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 解:(1) 可能存在线性关系。 (2)相关系数:

(3)回归方程:734.6930.309 y x =+ 回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 系数(a) 模型非标准化系数标准化系数 t 显著性B 标准误Beta 1 (常量)734.693 139.540 5.265 0.003 人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% (4) 模型汇总 模型R R 方调整 R 方标准估计的误 差 1 .998a.996 .996 247.303 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到99.6%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 模型摘要 模型R R 方调整的 R 方估计的标准差 1 .998(a) 0.996 0.996 247.303 a. 预测变量:(常量), 人均GDP(元)。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

应用回归分析,第4章课后习题参考答案

第4章违背基本假设的情况 思考与练习参考答案 4.1 试举例说明产生异方差的原因。 答:例4.1:截面资料下研究居民家庭的储蓄行为 Y i=β0+β1X i+εi 其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。 由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。 例4.2:以某一行业的企业为样本建立企业生产函数模型 Y i=A iβ1K iβ2L iβ3eεi 被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。 4.2 异方差带来的后果有哪些? 答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果: 1、参数估计量非有效 2、变量的显著性检验失去意义 3、回归方程的应用效果极不理想 总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。 4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。 答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。然而在异方差

的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。 加权最小二乘法的方法: 4.4简述用加权最小二乘法消除多元线性回归中异方差性的思想与方法。 答:运用加权最小二乘法消除多元线性回归中异方差性的思想与一元线性回归的类似。多元线性回归加权最小二乘法是在平方和中加入一个适当的权数i w ,以调整各项在平方和中的作用,加权最小二乘的离差平方和为: ∑=----=n i ip p i i i p w x x y w Q 1211010)( ),,,(ββββββ (2) 加权最小二乘估计就是寻找参数p βββ,,,10 的估计值pw w w βββ?,,?,?10 使式(2)的离差平方和w Q 达极小。所得加权最小二乘经验回归方程记做 22011 1 ???()()N N w i i i i i i i i Q w y y w y x ββ===-=--∑∑22 __ 1 _ 2 _ _ 02 222 ()() ?()?1 11 1 ,i i N w i i i w i w i w w w w w kx i i i i m i i i m i w x x y y x x y x w kx x kx w x σβββσσ==---=-= = ===∑∑1N i =1 1表示=或

多元线性回归模型习题及答案

多元线性回归模型 一、单项选择题 1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定 系数为,则调整后的多重决定系数为( D ) A. B. C. 下列样本模型中,哪一个模型通常是无效 的(B ) A. i C (消费)=500+i I (收入) B. d i Q (商品需求)=10+i I (收入)+i P (价格) C. s i Q (商品供给)=20+i P (价格) D. i Y (产出量)=0.6i L (劳动)0.4i K (资本) 3.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后,在的显著性水平上对 1b 的显著性作t 检验,则1b 显著地不等于零的条件是其统计量t 大于等于( C ) A. )30(05.0t B. )28(025.0t C. )27(025.0t D. )28,1(025.0F 4.模型 t t t u x b b y ++=ln ln ln 10中,1b 的实际含义是( B ) A.x 关于y 的弹性 B. y 关于x 的弹性 C. x 关于y 的边际倾向 D. y 关于x 的边际倾向 5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明 模型中存在( C ) A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度 6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...) t H b i k ==时,所用的统计量 服从( C ) (n-k+1) (n-k-2) (n-k-1) (n-k+2) 7. 调整的判定系数 与多重判定系数 之间有如下关系( D ) A.2 211n R R n k -=-- B. 22111 n R R n k -=--- C. 2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=---- 8.关于经济计量模型进行预测出现误差的原因,正确的说法是( C )。 A.只有随机因素 B.只有系统因素 C.既有随机因素,又有系统因素 、B 、C 都不对 9.在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数):( C ) A n ≥k+1 B n

回归分析测试题

测试题 1.下列说法中错误的是() A.如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点 (i=1,2,3,…,n)将散布在一条直线附近 B.如果两个变量x与y之间不存在线性相关关系,那么根据试验数据不能写出一个线性方程。 C.设x,y是具有线性相关关系的两个变量,且回归直线方程是,则叫回归系数 D.为使求出的回归直线方程有意义,可用线性相关性检验的方法判断变量x与y之间是否存在线性相关关系 2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程是() A.B.C.D. 3.回归直线必过点() A.(0,0)B.C.D. 4.在画两个变量的散点图时,下面叙述正确的是() A.预报变量在轴上,解释变量在轴上 B.解释变量在轴上,预报变量在轴上 C.可以选择两个变量中任意一个变量在轴上 D.可以选择两个变量中任意一个变量在轴上 5.两个变量相关性越强,相关系数r() A.越接近于0B.越接近于1C.越接近于-1 D.绝对值越接近1 6.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为()A.0B.1 C.-1 D.-1或1 由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高,

则下面的叙述正确的是() A.她儿子10岁时的身高一定是145.83 B.她儿子10岁时的身高在145.83以上 C.她儿子10岁时的身高在145.83左右 D.她儿子10岁时的身高在145.83以下 8.两个变量有线性相关关系且正相关,则回归直线方程中,的系数()A.B.C.D. 能力提升: (1)画出散点图; (2)求每月产品的总成本y与该月产量x之间的回归直线方程。 10.某工业部门进行一项研究,分析该部分的产量与生产费用之间的关系,从这个工业 (1)计算x与y的相关系数; (2)对这两个变量之间是否线性相关进行相关性检验; (3)设回归直线方程为,求系数,。 综合探究: 11.一只红铃虫的产卵数y和温度x有关。现收集了7对观测数据列于表中,试建立y 参考答案: 基础达标: 1.B

应用回归分析试题套

应用回归分析试题(一) 1、对于一元线性回归y 0i X i i(i 1,2,..., n),E(J 0 , var( J cov( i, j) 0(i j),下列说法错误的是 (A) 0,1的最小一乘估计? '0, ?都是无偏估计; (B) 0,1的最小一乘估计? 0, Q ?对y,y2,... ,y n是线性的; (C) 0,1的最小一乘估计 ? , ?之间是相关的; (D)若误差服从正态分布,0,1的最小二乘估计和极大似然估计是不一样的 2、在回归分析中若诊断出异方差,常通过方差稳定化变化对因变量进行变换.如果误差方差与因变量y的期望成正比,则可通过下列哪种变换将方差常数化 1 (A) - ;(B) “ ;(C) ln( y 1) ;(D) In y. y 、 3、下列说法错误的是 (A) 强影响点不一定是异常值; (B) 在多元回归中,回归系数显着性的t检验与回归方程显着性的F检验是等价的; (C) 一般情况下,一个定性变量有k类可能的取值时,需要引入k-1个0-1型自变量; (D) 异常值的识别与特定的模型有关. 4、下面给岀了4个残差图,哪个图形表示误差序列是自相关的 (A) (B) (C) (D) 5、下列哪个岭迹图表示在某一具体实例中最小二乘估计是适用的 (A) (B) (C)(D) 二、填空题(每空2分,共20分)

2 2 1、考虑模型y X ,var( ) I n,其中X : n p,秩为p,0不一定

已知,则 ? ________________ , var ( ?) _________ ,若 服从正态分布,则 2、下表给岀了四变量模型的回归结果: 则残差平方和= ___________ ,总的观察值个数 = ___________ ,回归平方和的自由度 = ________ . 3、已知因变量 y 与自变量X i ,X 2, X 3,X 4,下表给岀了所有可能回归模型的 AIC 值,则最 优子集是 _______________________ . 4、 在诊断自相关现象时,若 DW 0.66,则误差序列的自相关系数 的估计值= _______ ,若 存在自相关现象,常用的处理方法有迭代法、 _____________ 、科克伦-奥克特迭代法. 5、 设因变量y 与自变量X 的观察值分别为 y 「y 2,..., y n 和x 1, x 2 ,..., x n ,则以x *为折点的折 线模型可表示为 ________________________ . 三、(共45分)研究货运总量y (万吨)与工业总产值x 1 (亿元)、农业总产值x 2 (亿元)、 居民非商品支岀X 3 (亿元)的线性回归关系.观察数据及残差值e i 、学生化残差SRE i 、删除 学生化残差SRE (i )、库克距离D i 、杠杆值ch ii 见表 (n P)?2 ___________ ,其中?2是2的无偏估计

回归分析练习题(有答案)

1.1回归分析的基本思想及其初步应用 一、选择题 1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+,已知:数据x 的平 均值为2,数据 y 的平均值为3,则 ( ) A .回归直线必过点(2,3) B .回归直线一定不过点(2,3) C .点(2,3)在回归直线上方 D .点(2,3)在回归直线下方 2. 在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y 与X 之间的回归直线方程为( )A . y x 1=+ B . y x 2=+ C . y 2x 1=+ D. y x 1=-3. 在对两个变量x ,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据(i x 、i y ) ,1,2i =,…,n ; ③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图 如果根据可行性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③① 4. 下列说法中正确的是( ) A .任何两个变量都具有相关关系 B .人的知识与其年龄具有相关关系 C .散点图中的各点是分散的没有规律 D .根据散点图求得的回归直线方程都是有意义的 5. 给出下列结论: (1)在回归分析中,可用指数系数2 R 的值判断模型的拟合效果,2 R 越大,模型的拟合效果越好; (2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,r 越小,模型的拟合效果越好; (4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有( )个. A .1 B .2 C .3 D .4 6. 已知直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A.y 平均增加1.5个单位 B.y 平均增加2个单位 C.y 平均减少1.5个单位 D. y 平均减少2个单位 7. 下面的各图中,散点图与相关系数r 不符合的是( )

第十二章相关与回归分析练习题

第十二章相关与回归分析 一、填空 1.如果两变量的相关系数为0,说明这两变量之间_____________。 2.相关关系按方向不同,可分为__________和__________。 3.相关关系按相关变量的多少,分为______和复相关。4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。 5.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性)变量。 6.变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是(削减误差比例)。 7.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值 c Y是 服从();(2)分布中围绕每个可能的 c Y值的()是相同的。 7.已知:工资(元)倚劳动生产率(千元)的回归方程为 x y c 80 10+ =,因此,当劳动生产率每增长1千元,工资就平 均增加80 元。 8.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。这种分析方法,通常又称为(回归分析)。 9.积差系数r是(协方差)与X和Y的标准差的乘积之比。 二、单项选择 1.欲以图形显示两变量X和Y的关系,最好创建(D )。A 直方图 B 圆形图 C 柱形图 D 散点图2.在相关分析中,对两个变量的要求是(A )。 A 都是随机变量 B 都不是随机变量 C 其中一个是随机变量,一个是常数 D 都是常数 3. 相关关系的种类按其涉及变量多少可分为( )。 A. 正相关和负相关 B. 单相关和复相关 C. 线性相关和非线性相关 D. 不相关、不完全相关、完全相关4.关于相关系数,下面不正确的描述是(B )。 A当0≤ ≤r1时,表示两变量不完全相关;B当r=0时,表示两变量间无相关; C两变量之间的相关关系是单相关;D如果自变量增长引起因变量的相应增长,就形成正相关关系。 5. 当变量X按一定数量变化时,变量Y也随之近似地以固定的数量发生变化,这说明X与Y之间存在( )。 A. 正相关关系 B. 负相关关系 C. 直线相关关系 D. 曲线相关关系 6.当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在(A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 7.评价直线相关关系的密切程度,当r在~之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 8.两变量的相关系数为,说明( ) A.两变量不相关 B.两变量负相关 C.两变量不完全相关 D.两变量完全正相关 9.两变量的线性相关系数为0,表明两变量之间(D )。 A 完全相关 B 无关系 C 不完全相关 D 不存在线性相关 10.兄弟两人的身高之间的关系是( )A.函数关系 B.因果关系 C.互为因果关系 D.共变关系 11.身高和体重之间的关系是(C )。A 函数关系 B 无关系 C 共变关系 D 严格的依存关系12.下列关系中,属于正相关关系得是(A )。

应用回归分析试题二

应用回归分析试题(二) 一、选择题 1. 在对两个变量x , y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释;②收集数据(X i 、),1,2,…, n ;③ 求线性回归方程;④求未知参数; ⑤根据所搜集的数据绘制 散点图。 如果根据可行性要求能够作出变量x ,y 具有线性相关结论,则在下列 操作中正确的是(D ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③① 2. 下列说法中正确的是(B ) A .任何两个变量都具有相关关系 B .人的知识与其年龄具有相关关系 C .散点图中的各点是分散的没有规律 D .根据散点图求得的回归直线方程都是有意义的 3. 下面的各图中,散点图与相关系数r 不符合的是(B ) \ 4 yi i .? — |

5. 在画两个变量的散点图时,下面哪个叙述是正确的 (B ) (A) 预报变量在x 轴上,解释变量在y 轴上 (B) 解释变量在x 轴上,预报变量在y 轴上 (C) 可以选择两个变量中任意一个变量在 X 轴上 (D) 可以选择两个变量中任意一个变量 二、 填空题 m 丄 1. y 关于m 个自变量的所有可能回归方程有-一1个。 2. H 是帽子矩阵,贝S tr(H)=p+1。 3. 回归分析中从研究对象上可分为一元和多元。 4. 回归模型的一般形式是 y ° 1X 1 2X 2 p X p 。 5. Cov(e) 2(l H) (e 为多元回归的残差阵)。 三、 叙述题 1.引起异常值消除的方法(至少5个)? 答案:异常值消除方法: (1) 重新核实数据; (2) 重新测量数据; (3) 删除或重新观测异常值数据; (4) 增加必要的自变量; 则正确的叙述是(D ) A .身咼一定是145.83cm C .身高低于145.00cm B .身高超过146.00cm D .身高在145.83cm 左右

相关文档
相关文档 最新文档