文档库 最新最全的文档下载
当前位置:文档库 › 第5章 方差分析

第5章 方差分析

第5章  方差分析
第5章  方差分析

第5章 方差分析

5.1 方差分析的意义

方差分析是数理统计的基本方法之一,是工农业生产和科学研究中分析数据的一种工具。方差分析的目的是确定观测对象的影响因子。如在化工生产或实验中,原料的组成、反应温度、压力、反应时间、反应器类型、催化剂配方等都可能影响产品的收率和质量。在这些因素中,有的影响大一些,有的影响小一些。为了使生产过程得以稳定,保证优质高产,确定最佳操作条件,就有必要找出对产品收率或质量有显著影响的那些因素,然后加以控制。方差分析就是鉴别各因素效应的一种有效方法。

5.2 单因素试验的方差分析及其Excel 程序 5.2.1 问题的提出

例5-1 考察温度对某一化工产品收率的影响,选了5种不同的温度,同一温度下做了3次试验,测得结果如表5-l 。试问温度的变化是否显著影响产品的收率?

这个实验的目的是确定各温度水平间产品的收率有无显著差异。从表5-1的数据中可以看出,不同温度下的收率是不同的,即使在同一温度下,收率也不一样。产生这些差异的原因是由于偶然因素的干扰及测量误差所造成的?还是由于实验条件的变化而影响的呢?换句话说,这些差异是试验误差(随机误差)还是条件误差(系统误差)呢?这个问题可以通过方差分析的方法得出结论。

表5-1 例5-1的实验数据表

温度(℃)

60 65 70 75

80

收率(%)

90 97 96 84

84

92 93 96 83

86

88 92 93 88

82

平均收率

90 94 95 85

84

5.2.2 单因素试验的方差分析方法

如果在一项实验中,只有一个因素在改变,而其他因素保持不变的话,我们称之为单因素试验。因素所处的状态称为水平。在例5-1中,考察的因素是温度,有5个温度等级,即5个水平。

为不失一般性,设因素A 有J 个水平A 1, A 2,…A j ,…,A J ,在每个水平下都做了I 次测试,水平A j 下第i 次试验数据用j i x ,表示。单因素多水平试验安排表如表5-2所示。

若把每一水平下的实验数据(表5-2的每一列)看做是一个子样的话,可得J 个子样,设这J 个子样相互独立,且它们来自的J 个总体的方差都相同,即

21σ=22σ= … =2j σ= … =2J σ=2

σ

这叫做方差齐性。方差齐性的假设是方差分析的前提。 我们的任务是检验J 个总体的均值是否相等,亦即假设 ==210:μμH …==j μ… μμ==J

检验这一假设是否成立。这就是单因素试验的方差分析所要解决的问题。那么如何确定检验的统计量呢?看下面的推导。

定义总变差或总平方和 ∑∑

==-=

J

j I

i ij T x x Q 11

2

..)( (5-1)

其中..x 叫做总平均值。整批数据的个数是因素水平的个数J 与测定次数I 的乘积,令n=IJ ,则有

∑∑===

J

j I

i ij

x n

x 11

1

.. (5.2)

总变差Q T 包括了试验误差和条件变差,若能将二者分开,然后加以比较,问题就好解决了。事实上是可以分开的。记在水平A j 下的子样平均值,即表5-2中列数据的平均值 ∑==

I

i ij

j x I

x 1

1

. (j=1,2,…,J) (5.3) 从式(5.1)出发进行推导

∑∑==-=J

j I

i ij

T x x

Q 112

..)(

∑∑==-+-=

J

j I i j j ij

x x x x

112

..)].().[(

∑∑==-+--+-=J

j I

i j j j ij j ij

x x x x x x x x

112

2

]..).(..).)(.(2).[(

因交叉乘积项求和

∑∑==--J

j I

i j j ij

x x x x

11..).)(.(

∑∑==--=J

j I

i j ij j

x x x x 11)].(..).

[(

=

∑∑==--J

j I

i j ij j

x I x x x 1

1

)]...)(.

[(

0]0..).

[(1

=?-=

∑=J

j j

x x

所以 ∑∑∑∑====-+

-=

J

j I

i j

J

j I

i j ij

T x x x x

Q 11

2

112

..).

().(

若令 ∑∑==-=

J

j I i j ij

E x x

Q 11

2

).( (5.4)

∑∑==-=

J

j I

i j

A x x Q 11

2

..).

( (5.5)

于是可得 T Q =E Q +A Q (5.6)

E Q 反映了子样内的随机波动,即试验误差。亦称组内平均误差或误差平方和。A Q 反映了子样之间的差异(由于因素水平不同而引起的差异),即条件变差,亦称组间平方和。 若判断因素A 对实验结果的影响是否显著,就要判断条件变差与试验误差相差的程度,可用

F 检验来进行。令

1-=J f A (5.7 ) J n f E -= (5.8 )

A A A f Q S /2

= (5.9 )

E E E f Q S /2= (5.10)

F 检验的统计量为 2

2

E

A S S F =

(5.11)

可以证明,统计量F 服从第一自由度A f 、第二自由度E f 的F 分布。于是我们可以用下式来检验原假设0H ,即若

22/E A S S F = > )

,(,E A

f f

F α (5.12)

则在显著性水平α下拒绝原假设0H ,即因素A 对试验结果影响显著;否则接受原假设0H ,即因素A 对试验结果无显著影响,实验数据的差异是由试验误差(随机误差)引起的。 式(5.12)中的F α,(f A ,f E )可从F 分布表(附录B-4)中查到。 上述分析常用排表的形式进行,称方差分析表,如表5-3所示。

表5-3 单因素试验的方差分析表

差异源 Q f

MS F 值 F 0.01 F 0.05 F 0.10 显著性 组间 组内 A Q E Q J -1 n -J 2

A S 2E

S F

F 0.01(fA ,fE ) F 0.05(fA ,fE ) F 0.10(fA ,fE )

总和

T Q

n -1

方差分析表中的显著性结论,是根据计算的F 值与临界值F α,(f A ,f E )相比较,然后作出的,通常分4种情况:

(1)F > F 0.01,因素A 的影响特别显著,记为“**”; (2)F 0.01≥F >F 0.05,因素A 的影响显著,记为“*”; (3)F 0.05≥F >F 0.10,因素A 有一定影响,记为“(*)”;

(4)F ≤ F 0.10,因素A 的影响不显著,记为“(O)”。

上面的前三种情况是在不同的显著性水平下,否定原假设;而后面一种情况则是在显著

性水平α=0.10下,接受原假设。

方差分析表中各有关平方和的计算,可按表5-4进行。

表5-4的上半部是试验数据,下半部第一行“∑”是各列数据之和;第二行是第一行对应数据的平方;第三行“∑2”是各列数据的平方和。这三行数据的和列在最后一列。表5-4中的

∑==

I

i ij

j x x 1

. (j=1,2,…,J) (5.13)

令 ∑

∑∑====

=J j I

i ij

J

j j x

n

x n

P 12

1

2

1

)(1).(1 (5.14)

∑∑∑====

=J

j I

i ij

J

j j

x I

x I

Q 1

21

12

)(1

).(1

(5.15)

∑∑===

J j I i ij

x

R 11

2 (5.16)

将式(5.5)、(5.4)和(5.1)展开,很容易推导出

P Q Q A -= (5.17) Q R Q E -= (5.18) P R Q Q Q E A T -=+= (5.19)

综合上面的讨论,现给出方差分析的步骤如下: (1)提出原假设,即

==210:μμH …==j μ… μμ==J (2)由原始数据按表5-4及式(5-14)~(5-19)计算各平方和; (3)按表5-3计算和填写方差分析表;

(4)比较F 值与临界值)

,(,E A

f f

F ,作出相应的分析结论。

5.2.3 单因素试验方差分析的Excel 程序

打开一个新工作簿,以“程序13”为文件名存盘。在工作表Sheet1中开始操作。 输入文本数据:

输入粗体字文本和斜体字数据,见图5-1。

命名:

F0.01 =$F$31 F0.05 =$G$31 F0.10 =$H$31 fA =$C$31 fE =$C$32 F 值 =$E$31

JIE1 ="因素A 影响高度显

著"

JIE2 ="因素A 影响显著" JIE3 ="因素A 有一定影响" JIE4

="因素A 影响不显著"

公式清单: B31: =B33-B32

C31: =COUNT(B3:K3)-1 D31: =B31/fA E31: =D31/D32

F31: =FINV(0.01,fA,fE) G31: =FINV(0.05,fA,fE) H31: =FINV(0.1,fA,fE)

I31: =IF(F 值>F0.01,"**",IF(F 值>F0.05,"*",IF(F 值>F0.10,"(*)","'(0)"))) B32: =SUM(B27:K27) C32: =C33-fA D32: =B32/fE

B33: =DEVSQ(B3:K24) C33: =COUNT(B3:K24)-1

B25: =IF(LEN(B3)<>0,COUNT(B3:B24),"") B26: =IF(LEN(B3)<>0,A VERAGE(B3:B24),"")

B27: =IF(LEN(B3)<>0,DEVSQ(B3:B24),"") 选中B25:B27,向右填充至K 列

C35: =IF(F 值>F0.01,JIE1,IF(F 值>F0.05,JIE2,IF(F 值>F0.10,JIE3,JIE4)))

显示结果: 见图5-1。

5.4 双因素试验的方差分析及其Excel程序

通过本章前几节的介绍,对单因素试验的方差分析解决问题的基本思想和方法,我们已经比较清楚了。现在要讨论的是有两个因素在改变,而其他因素保持不变的双因素试验的方差分析,其解决问题的基本思想与单因素试验的方差分析是一样的,故这里重点讨论方法,对理论问题不作深入的讨论。本节讨论无重复测定情况。

5.4.1 双因素试验的方差分析方法

考虑两个因素A和B,因素A分成I个水平A1,A2,…,A i,…,A I;因素B分成J 个水平B1,B2,…,B j,…,B J。实验安排是让因素A和因素B的每个水平都碰到,即在A i×B j的条件下做一次试验,共有I×J种配合,得I×J个试验数据,如表5-10所示。

表5-10 双因素试验安排表(无重复测试)

A1A2…A j…A J

B1x

11

x12…x1j…x1J

B2x

21

x22…x2j…x2J

……………

B i x

i1

x i2…x ij…x iJ

……………

B I x I1x I2…x Ij…x IJ

定义双因素试验的总平方和

∑∑==-

=

J

i

I

i

ij

T

x x

Q

11

2

..)

((5.29)

可以证明总平方和可分解为

E B A T Q Q Q Q ++= (5.30) 其中

∑=-=I

i i A x x J Q 12..).( (5.31)

∑=-=J

j j B x x I Q 1

2..).( (5.32)

∑∑==+--=

J j I

i j i ij

E x x x x Q 11

2

..)

..((5.33)

∑∑===J j I

i ij

x

IJ x 111.. (5.34)

∑==J

j ij

i x

J

x 11. (i=1,2,…,I) (5.35)

∑==

I i ij

j x I

x 1

1

. (j=1,2,…,J) (5.36) 各平方和的自由度分别为

1-=I f A (5.37)

1-=J f B (5.38) )1)(1(--=J I f E (5.39) E B A T f f f IJ f ++=-=1 (5.40)

各平方和除以相应的自由度得各方差估计值,即

A A A f Q S /2

= (5.41)

B B B f Q S /2

= (5.42)

E E E f Q S /2

= (5.43)

检验因素A 和因素B 对实验结果有无显著影响所用的统计量分别为

22

E A A S S

F = (5.44) 22

E

B

B S

S F =

(5.45)

最后将以上结果列方差分析表如表5-11所示。

表5-11 无重复测定的双因素全面试验方差分析表

差异源

Q

f MS F 值 F 0.01

F 0.05 F 0.10 显著性

因素A(行间) Q A f A S 2A F A F 0.01(fA ,fE ) F 0.05(fA ,fE ) F 0.10(fA ,fE ) 因素B(列间) Q B f B S 2B F B F 0.01(fB ,fE )

F 0.05(f B ,fE )

F 0.10(f B ,fE )

误 差 Q E f E S 2E 总 和

Q T

f T

实际计算各平方和时,采用下面的计算公式,令

∑∑===

J

j I

i ij

x

IJ

P 12

1

)(1 (5.46)

∑∑===I i J

j ij

x

J Q 12

11)(1 (5.47)

∑∑===J

j I

i ij

x I

Q 12

1

2)(1

(5.48) ∑∑===

J

j I

i ij x

R 11

2 (5.49)

P Q Q A -=1 (5.50) P Q Q B -=2 (5.51) P Q Q R Q E +--=21 (5.52) P R Q T -= (5.53)

手算各平方和时,采用列表法,列表格式在下一小节的例题中给出。

5.4.2 双因素试验方差分析的Excel 程序

打开一个新工作簿,以“程序15”为文件名存盘。在工作表Sheet1中开始操作。

命名: MS =$D$30:$D$31 JIE2 ="影响显著" f =$C$30:$C$31 JIE3 ="有一定影响" F0.01 =$F$30:$F$31 JIE4 ="影响不显著" F0.05 =$G$30:$G$31 QA =$B$30 F0.10 =$H$30:$H$31 QB =$B$31 fE =$C$32 QE =$B$32 F 值 =$E$30:$E$31 SE =$D$32 JIE1 ="影响高度显著"

公式清单:

L3: =IF(LEN(B3)<>0,A VERAGE(B3:K3),"")

填充至L24 B25: =IF(LEN(B3)<>0,COUNT(B3:B24),"") B26: =IF(LEN(B3)<>0,A VERAGE(B3:B24),"") 选中B25:B26填充至列K

B30: =DEVSQ(L3:L24)*COUNT(B3:K3)

B31: =DEVSQ(B26:K26)*COUNT(B3:B24) B32: =B33-QA-QB

B33: =DEVSQ(B3:K24)

C30: =COUNT(B3:B22)-1

C31: =COUNT(B3:K3)-1

C32: =C33-C30-C31

C33: =COUNT(B3:K24)-1

D30: =QA/f

D31: =QB/f

D32: =QE/fE

E30: =MS/SE

F30: =FINV(0.01,f,fE)

G30: =FINV(0.05,f,fE)

H30: =FINV(0.1,f,fE)

I30: =IF(F 值>F0.01,"**",IF(F 值>F0.05,"*",IF(F 值>F0.10,"(*)","(0)"))) 选中E30:I30填充至行31

K30: =IF(F 值>F0.01,JIE1,IF(F 值>F0.05,JIE2,IF(F 值>F0.10,JIE3,JIE4))) 填充至K31

显示结果: 见图5-3。

习题五

1某项化工实验在5个温度水平下测得转化率数据如左边的表。试用方差分析方法分析温度对转化率的影响。

A 1 A 2 A 3 A 4 A 5 1 24.3 26.1 26.5 29.3 29.5 2 27.8 27.3 28.3 28.7 28.8 3 23.2 24.2 28.6 27.2 31.4

4

26.5

24.1

28.2

30.1

27.8

4 试验某种钢不同的含铜量在4种温度下的冲击值如左边的表。试分析铜含量(因素B)、试验温度(因素A)对钢的冲击值有无显著影响?

全国各地区可支配收入与消费性支出异方差检验综合案例分析

全国各地区可支配收入与消费性支出异方差检验综合案例分析 小组成员:翟丽萍孙琴令穆小斌 张丹冶贵花王淏珑 指导老师:毛锦凰

2009年全国各地区城镇居民平均每人全年家庭可支配收入与消费性支出 地区 可支配消费性收入(x)支出(y) 北京26738.48 17893.30 天津21402.01 14801.35 河北14718.25 9678.75 山西13996.55 9355.10 内蒙古15849.19 12369.87 辽宁15761.38 12324.58 吉林14006.27 10914.44 黑龙江12565.98 9629.60 上海28837.78 20992.35 江苏20551.72 13153.00 浙江24610.81 16683.48 安徽14085.74 10233.98 福建19576.83 13450.57 江西14021.54 9739.99 山东17811.04 12012.73 河南14371.56 9566.99 湖北14367.48 10294.07 湖南15084.31 10828.23 广东21574.72 16857.50 广西15451.48 10352.38 海南13750.85 10086.65 重庆15748.67 12144.06 四川13839.40 10860.20 贵州12862.53 9048.29 云南14423.93 10201.81 西藏13544.41 9034.31 陕西14128.76 10706.67 甘肃11929.78 8890.79 青海12691.85 8786.52 宁夏14024.70 10280.00 新疆12257.52 9327.55

《应用数理统计》吴翊李永乐第五章方差分析课后作业参考答案

《应用数理统计》吴翊李永乐第五章方差分析课后作业 参考答案 标准化文件发布号:(9312-EUATWW-MWUB-WUNN-INNUL-DQQTY-

第五章 方差分析 课后习题参考答案 下面给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活日数: 设小白鼠存活日数服从方差相等的正态分布,试问三种菌型的平均存活日数有无显著差异(01.0=α) 解:(1)手工计算解答过程 提出原假设:() 3,2,10:0==i H i μ 记 167.20812 11112 =??? ? ??-=∑∑∑∑====r i n j ij r i n j ij T i i X n X S 467.70112 112 11=???? ??-???? ??=∑∑∑∑====r i n j ij r i n j ij i A i i X n X n S 7 .137=-=A T e S S S 当 H 成立时, ()() ()r n r F r n S r S F e A ----= ,1~/1/ 本题中r=3 查表得 ()()35 .327,2,195.01==---F r n r F α且F=>,在95%的置信度下,拒绝原假 设,认为不同菌型伤寒杆菌对小白鼠的存活日数有显著影响。 (2)软件计算解答过程

组建效应检验 Dependent Variable: 存活日数a 70.429235.215 6.903 .004 137.73727 5.101 208.167 29 方差来源菌型误差总和 平方和自由度 均值F 值P 值R Squared = .338 (Adjusted R Squared = .289) a. 从上表可以看出,菌种不同这个因素的检验统计量F 的观测值为,对应的检验概率p 值为,小于,拒绝原假设,认为菌种之间的差异对小白鼠存活日数有显著影响。 现有某种型号的电池三批,他们分别是甲、乙、丙三个工厂生产的,为评论其质量,各随机抽取6只电池进行寿命试验,数据如下表所示: 工厂 寿命(小时) 甲 40 48 38 42 45 乙 26 34 30 28 32 丙 39 40 43 50 50 试在显著水平0.05α=下,检验电池的平均寿命有无显著性差异并求 121323,μμμμμμ---及的95%置信区间。这里假定第i 种电池的寿命 2i X (,)(1,2,3) i N i μσ=。 解:手工计算过程: 1.计算平方和 其检验假设为:H0:,H1:。 2.假设检验: 所以拒绝原假设,即认为电池寿命和工厂显著相关。 6 .615])394.44()3930()396.42[(*4)()(4 .216)3.28108.15(*4*))(1()(832 429.59*14*))(1()(2221 22 1 21 22 222=-+-+-=-=-==++=-==-===-==-=∑∑∑∑∑∑∑∑∑===r i i i i A r i i i r i i i i ij e ij T X X n X X S S n S n X X S s n ns X X S 0684 .170333 .188 .30712/4.2162/6.615)/()1/(===--= r n S r S F e A 89 .3)12,2(),1(95.01==-->-F r n r F F α

试验一异方差的检验与修正-时间序列分析

案例三 ARIMA 模型的建立 一、实验目的 了解ARIMA 模型的特点和建模过程,了解AR ,MA 和ARIMA 模型三者之间的区别与联系,掌握如何利用自相关系数和偏自相关系数对ARIMA 模型进行识别,利用最小二乘法等方法对ARIMA 模型进行估计,利用信息准则对估计的ARIMA 模型进行诊断,以及如何利用ARIMA 模型进行预测。掌握在实证研究如何运用Eviews 软件进行ARIMA 模型的识别、诊断、估计和预测。 二、基本概念 所谓ARIMA 模型,是指将非平稳时间序列转化为平稳时间序列,然后将平稳的时间序列建立ARMA 模型。ARIMA 模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA )、自回归过程(AR )、自回归移动平均过程(ARMA )以及ARIMA 过程。 在ARIMA 模型的识别过程中,我们主要用到两个工具:自相关函数ACF ,偏自相关函数PACF 以及它们各自的相关图。对于一个序列{}t X 而言,它的第j 阶自相关系数j ρ为它的j 阶自协方差除以方差,即j ρ=j 0γγ ,它是关于滞后期j 的函数,因此我们也称之为自相关函数,通常记ACF(j )。偏自相关函数PACF(j )度量了消除中间滞后项影响后两滞后变量之间的相关关系。 三、实验内容及要求 1、实验内容: (1)根据时序图的形状,采用相应的方法把非平稳序列平稳化; (2)对经过平稳化后的1950年到2007年中国进出口贸易总额数据运用经典B-J 方法论建立合适的ARIMA (,,p d q )模型,并能够利用此模型进行进出口贸易总额的预测。 2、实验要求: (1)深刻理解非平稳时间序列的概念和ARIMA 模型的建模思想; (2)如何通过观察自相关,偏自相关系数及其图形,利用最小二乘法,以及信息准则建立合适的ARIMA 模型;如何利用ARIMA 模型进行预测; (3)熟练掌握相关Eviews 操作,读懂模型参数估计结果。 四、实验指导 1、模型识别 (1)数据录入 打开Eviews 软件,选择“File”菜单中的“New --Workfile”选项,在“Workfile structure type ”栏选择“Dated –regular frequency ”,在“Date specification ”栏中分别选择“Annual ”(年数据) ,分别在起始年输入1950,终止年输入2007,点击ok ,见图3-1,这样就建立了一个工作文件。点击File/Import ,找到相应的Excel 数据集,导入即可。

《计量经济学》(庞浩第一版)第五章异方差性eviews上机操作

第五章异方差性 案例分析 一、问题的提出和模型设定 为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口 数量的关系,建立卫生医疗机构数与人口数的回归模型。 假定医疗机构数与人口数之间满足线性约束,则理论模型设定为: i i i u X b b Y ++=21 其中i Y 表示卫生医疗机构数,i X 表示人口数。 数据搜集 四川省2000年各地区医疗机构数与人口数 地区 人口数(万人) 医疗机构数(个)Y 地区 人口数(万人) 医疗机构数(个)Y X X 成都 1013.3 6304 眉山 339.9 827 自贡 315 911 宜宾 508.5 1530 攀枝花 103 934 广安 438.6 1589 泸州 463.7 1297 达州 620.1 2403 德阳 379.3 1085 雅安 149.8 866 绵阳 518.4 1616 巴中 346.7 1223 广元 302.6 1021 资阳 488.4 1361 遂宁 371 1375 阿坝 82.9 536 内江 419.9 1212 甘孜 88.9 594 乐山 345.9 1132 凉山 402.4 1471 南充 709.2 4064

二、参数估计 Eviews上机具体操作: 利用eviews3.0进行分析 第一步:建立数据 1新建工作文档:file-new-workfile,在打开的workfile range对话框中的workfile frequency 中选择undated or irregular,start observation输入1,end observation输入21,点击ok。 2输入数据(先是data y x2 x3······然后是将excel中的数据复制过来即可)并保存 本题在命令窗口输入data y x,并点击name命名为GROUP01. 第二步:做回归 1最小二乘估计(ls y c x2 x3 ······) 本题在命令窗口输入ls y c x ,并点击name命名为EQ01. Dependent Variable: Y Method: Least Squares Date: 12/04/12 Time: 12:29 Sample: 1 21 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C -562.9074 291.5642 -1.930646 0.0686 X 5.372828 0.644239 8.339811 0.0000 R-squared 0.785438 Mean dependent var 1588.143 Adjusted R-squared 0.774145 S.D. dependent var 1310.975

异方差完整案例分析

20世纪70年代中期,美国能源 部门试 图基于各地过去的汽油消耗量和人口变动情况 以及其他一些因素给各地区、 各州甚至 各零售点直接分配汽油。实现这种分配必须将大量因素作为各州 (各地区)的燃油消耗量(应 变量)的函数而建立模型。 而对于这样的横截面 模型,即使是估计的模型,也很可能会具有异 方差问题。 在模型中,应变量为各州的燃油消耗量,可能的解释变量包括:与各州规模大小相关 的变量(例如公路里程数、注册的机动车数量和人口),以及与各州规模大小无关的变量(例 如燃油税率和最高限速)。因为在模型中反映各州规模大小的变量不应多于一个(如果包含 过多变量容易导致多重共线性),因为有许多州的最高限速相同(但在时间序列模型中,它 将是一个有用的变量)。因此,一个合理的模型为: PCON i f (REG,TAX ) i o i REG i 2 TAX i i ( 10-20) 式中 PCON i ――第i 个州的燃油消耗量(百万 BTU ), REG i ――第i 个州的注册机动车数量(千辆), TAX i ――第i 个州的燃油税率(美分/加仑), i ――经典误差项。 我们可以认为一个州注册的汽车数量越多, 该州所消耗的燃油也越多; 而一个州的燃油 税率越高则该州的燃油消耗量越小 (10-20),得到: 二我们搜集那一时期的数据(见表 10-1 )用于估计方程 PCON i 551.7 0.1861REG i 53.59TAX i ( 10-21) (0.0117) ( 16.86) t 15.88 3.18 R 1 2 0.861 N 50 表10-1燃油消费例子中的数据 PCON UHM TAX REG POP e state 270 2.2 9 743 1136 62.335 Maine 122 2.4 14 774 948 176.52 New Hampshire 58 0.7 11 351 520 30.481 Vermont 821 20.6 9.9 3750 5750 101.87 Massachusetts 1 在方程中我们也可用TAX * REG 或者TAX * POP ( POP 代表第i 个州的人口)取代TAX 作为方程的解 释变量。我们在第7.5节中讨论虚拟变量斜率时曾介绍了一个关于交互项的更为复杂的例子。对于一个给 定的税率,它对一个大州的燃油消耗的影响要比对一个小州的影响大得多,而用反映州的规模大小的变量 乘以TAX 会使所得到的新变量(交互项)能够更好地 度量这一效应。 10.5 —个更完整的例子 让我们来看一个更完整的基于横殿面的异方差的例子。

第五章方差分析

单因素方差分析 单因素方差分析也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。One-Way ANOVA过程要求因变量属于正态分布总体。如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果几个因变量之间彼此不独立,应该用Repeated Measure过程。 [例子] 调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表5-1所示。 表5-1 不同水稻品种百丛中稻纵卷叶螟幼虫数 数据保存在“DATA5-1.SAV”文件中,变量格式如图5-1。 图5-1 分析水稻品种对稻纵卷叶螟幼虫抗虫性是否存在显著性差异。

1)准备分析数据 在数据编辑窗口中输入数据。建立因变量“幼虫”和因素水平变量“品种”,然后输入对应的数值,如图5-1所示。或者打开已存在的数据文件“DATA5-1.SAV”。 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“Compare Means”项,在右拉式菜单中点击“0ne-Way ANOVA”项,系统 打开单因素方差分析设置窗口如图5-2。 图5-2 单因素方差分析窗口 3)设置分析变量 因变量:选择一个或多个因子变量进入“Dependent List”框中。本例选择“幼虫”。 因素变量:选择一个因素变量进入“Factor”框中。本例选择“品种”。 4)设置多项式比较

单击“Contrasts”按钮,将打开如图5-3所示的对话框。该对话框用于设置均值的多项式比较。 图5-3 “Contrasts”对话框 定义多项式的步骤为: 均值的多项式比较是包括两个或更多个均值的比较。例如图5-3中显示的是要求计算“1.1×mean1-1×mean2”的值,检验的假设H0:第一组均值的1.1倍与第二组的均值相等。单因素方差分析的“0ne-Way ANOVA”过程允许进行高达5次的均值多项式比较。多项式的系数需要由读者自己根据研究的需要输入。具体的操作步骤如下: ① 选中“Polynomial”复选项,该操作激活其右面的“Degree”参数框。 ② 单击Degree参数框右面的向下箭头展开阶次菜单,可以选择“Linear”线性、“Quadratic”二次、“Cubic”三次、“4th”四次、“5th”五次多项式。 ③ 为多项式指定各组均值的系数。方法是在“Coefficients”框中输入一个系数,单击Add按钮,“Coefficients”框中的系数进入下面的方框中。依次输入各组均值的系数,在方形显示框中形成—列数值。因素变量分为几组,输入几个系数,多出的无意义。如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。 可以同时建立多个多项式。一个多项式的一组系数输入结束,激话“Next”按钮,单击该按钮后“Coefficients”框中清空,准备接受下一组系数数据。

计量经济学课后答案第五章 异方差性汇总

第五章课后答案 5.1 (1)因为22()i i f X X =,所以取221i i W X =,用2i W 乘给定模型两端,得 31232222 1i i i i i i i Y X u X X X X βββ=+++ 上述模型的随机误差项的方差为一固定常数,即 2 2221 ()()i i i i u Var Var u X X σ== (2)根据加权最小二乘法,可得修正异方差后的参数估计式为 ***12233???Y X X βββ=-- ()()()() ()()() ***2*** *22232322 322*2*2** 2223223?i i i i i i i i i i i i i i i i i i W y x W x W y x W x x W x W x W x x β-= -∑∑∑∑∑∑∑ ()()( )()()( )( )** *2 ** ** 232222223 3 2 *2 *2** 2223223?i i i i i i i i i i i i i i i i i i W y x W x W y x W x x W x W x W x x β-= -∑∑ ∑ ∑ ∑∑∑ 其中 2223 2***23222, , i i i i i i i i i W X W X W Y X X Y W W W = = = ∑∑∑∑∑∑ ***** *222333 i i i i i x X X x X X y Y Y =-=-=- 5.2 (1) 22222 11111 ln()ln()ln(1)1 u ln()1 Y X Y X Y u u X X X u ββββββββββ--==+≈=-∴=+ [ln()]0 ()[ln()1][ln()]11 E u E E u E u μ=∴=+=+=又 (2) [ln()]ln ln 0 1 ()11 i i i i P P i i i i P P i i E P E μμμμμμμ===?====∑∏∏∑∏∏不能推导出 所以E 1μ()=时,不一定有E 0μ(ln )= (3) 对方程进行差分得: 1)i i βμμ--i i-12i i-1lnY -lnY =(lnX -X )+(ln ln 则有:1)]0i i μμ--=E[(ln ln

第五章方差分析练习

方差分析练习 1、 一家管理咨询公司为不同的客户进行人力资源管理讲座。每次讲座的内容基本上是 一样的,但讲座的听课者有时是高级管理者,有时是中级管理者,有时是低级管理者。该咨询公司认为,不同层次的管理者对两座的满意度是不同的。对听完讲座后随机抽取的不同层次管理者的满意度评分如下(评分标准是从1~10,10代表非常满意)。取显著性水平05.0=α,检验管理者的水平不同是否会导致评分的显著性 差异。 2、 某家电制造公司准备购进一批5#电池,现有A 、B 、C 三个电池生产企业愿意供货, 为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(单位:h )数据如下。试分析三个企业生产的电池的平均寿命之间有无显著差异(α=005.)。如果有差异,试用多重比较检验哪些企业之间有差异? 3、 一家产品制造公司管理者想比较A 、B 、C 三种不同的培训方式对产品组装时间的多 少是否有显著影响,将20名新员工随机分配给每种培训方式。在培训结束后,参加培训的员工组装一件产品所花的时间(单位:min )如下。取显著性水平05.0=α,确定不同培训方式对产品组装的时间是否有显著影响。 4、一家汽车制造商准备购进一批轮胎。考虑的因素主要有轮胎供应商和耐磨程度。为了对磨损程度进行测试,分别在低速(40km/h )、中速(80km/h )、高速(120km/h )下进行测试。下表是对5家供应商抽取的轮胎随机样本在轮胎使用1000km 后磨损程度。取显著性水平01.0=α,检验:

(1) 用单因素方差分析分析不同车速对磨损程度是否有显著影响。 (2) 用单因素方差分析分析不同供应商生产的轮胎之间磨损程度是否有显著差异; (3) 用双因素方差分析分析这两个因素是否显著,与前面的分析是否有矛盾,为什么会产生这这种矛盾? 5.一家超市连锁店的老板进行一项研究,确定超市所在的位置和竞争者的数量对销售额是否有显著影响。获得的月销售额数据(单位:万元)见下表。取显著性水平01.0=α,检验: (1) 竞争者的数量对销售额是否有显著影响。 (2) 超市的位置对销售额是否有显著影响。 (3)竞争者的数量和超市的位置对销售额是否有交互影响。 6.为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项试验,考察三种广告方案和两种广告媒体,获得的销售量数据见下表。检验广告方案、广告媒体或其交互作用对销售量的影响是否显著。(α=005.)

《应用数理统计》吴翊李永乐第五章方差分析课后作业参考答案资料

第五章 方差分析 课后习题参考答案 5.1 下面给出了小白鼠在接种三种不同菌型伤寒杆菌后的存活日数: 设小白鼠存活日数服从方差相等的正态分布,试问三种菌型的平均存活日数有无显著差异?(01.0=α) 解:(1)手工计算解答过程 提出原假设:()3,2,10:0==i H i μ 记 167.20812 11112 =???? ??-=∑∑∑∑====r i n j ij r i n j ij T i i X n X S 467.7011 2 11211=???? ??-???? ??=∑∑∑ ∑====r i n j ij r i n j ij i A i i X n X n S 7.137=-=A T e S S S 当 0H 成立时, ()()()r n r F r n S r S F e A --- -= ,1~/1/ 本题中r=3 经过计算,得方差分析表如下: 查表得 ()()35.327,2,195.01==---F r n r F α且F=6.909>3.35,在95%的置信度下,拒绝原 假设,认为不同菌型伤寒杆菌对小白鼠的存活日数有显著影响。 (2)软件计算解答过程

从上表可以看出,菌种不同这个因素的检验统计量F 的观测值为6.903,对应的检验概率p 值为0.004,小于0.05,拒绝原假设,认为菌种之间的差异对小白鼠存活日数有显著影响。 5.2 现有某种型号的电池三批,他们分别是甲、乙、丙三个工厂生产的,为评论其质量,各随机抽取6只电池进行寿命试验,数据如下表所示: 试在显著水平0.05α=下,检验电池的平均寿命有无显著性差异?并求 121323,μμμμμμ---及的95%置信区间。这里假定第i 种电池的寿命 2i X (,)(1,2,3)i N i μσ=。 解:手工计算过程: 1.计算平方和 其检验假设为:H0:,H1:。 2.假设检验: 所以拒绝原假设,即认为电池寿命和工厂显著相关。 3.对于各组之间的均值进行检验。 6 .615])394.44()3930()396.42[(*4)()(4 .216)3.28108.15(*4*))(1()(832 429.59*14*))(1()(2221 22 1 21 22 222=-+-+-=-=-==++=-==-===-==-=∑∑∑∑∑∑∑∑∑===r i i i i A r i i i r i i i i ij e ij T X X n X X S S n S n X X S s n ns X X S 0684 .170333 .188 .30712/4.2162/6.615)/()1/(===--= r n S r S F e A 89 .3)12,2(),1(95.01==-->-F r n r F F α

异方差案例分析

异方差案例分析 中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入除从事农业经营的收入外,还包括从事其他产业的经营性收入以及工资性收入、财产收入和转移支付收入等。为了考察从事农业经营的收入和其他收入对中国农村居民消费支出增长的影响,可使用如下双对数模型: 1122ln ln ln Y X X βββμ0=+++ 其中,Y 表示农村家庭人均消费支出,X 1表示从事农业经营的收入,X 2表示其他收入。下表列出了中国2001年各地区农村居民家庭人均纯收入及消费支出的相关数据。 中国2001年各地区农村居民家庭人均纯收入与消费支出 单位:元

资料来源:《中国农村住户调查年鉴》(2002)、《中国统计年鉴》(2002)。 我们不妨假设该线性回归模型满足基本假定,采用OLS 估计法,估计结果如下: 12?ln 1.6550.3166ln 0.5084ln Y X X =++ (1.87) (3.02) (10.04) R 2=0.7831 R 2=0.7676 D.W.=1.89 F=50.53 RSS=0.8232

图1 估计结果显示,其他收入而不是从事农业经营的收入的增长,对农户消费支出的增长更具有刺激作用。下面对该模型进行异方差性检验。 1.图示法。 首先做出Y与X1、X2的散点图,如下:

图2 可见1X 基本在其均值附近上下波动,而2X 散点存在较为明显的增大趋势。 再做残差平方项2 ?i e 与1ln X 、2ln X 的散点图:

图3 图4 可见图1中离群点相对较少而图2呈现较为明显的单调递增的

异方差性。故初步判断异方差性主要是2X引起的。 2.G-Q检验 根据上述分析,首先将原始数据按X2升序排序,去掉中间7个数据,得到两个容量为12的子样本,记数据较小的样本为子样本1,数据较大的为子样本2。对子样本1进行OLS回归,结果如下: 图5 得到子样本1的残差平方和RSS1=0.064806; 再对子样本2进行OLS回归,结果如下:

R案例分析_异方差

第五章 案例分析 一、问题的提出和模型设定 为了分析不同省份或城市的交通和通讯支出的规划提供依据,分析交通和通讯支出与可支配收入的关系,建立交通和通讯支出与可支配收入的回归模型。假定交通和通讯支出与可支配收入满足线性约束,则理论模型设定为 i i i cum income u αβ=+?+ (1) 其中i cum 表示交通和通讯支出,i income 表示可支配收入。 由1999年《中国统计年鉴》得到如下数据 注:见数据文件cumexp_income.csv 二、参数估计 利用最小二乘法估计模型(1)的参数: mydata.lm <- lm(cumexp ~ income) summary(mydata.lm) R 软件输出的结果为: Call: lm(formula = cumexp ~ income) Residuals: Min 1Q Median 3Q Max -97.465 -19.986 -5.111 15.532 184.115

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -56.91798 36.20624 -1.572 0.127 income 0.05808 0.00648 8.962 1.02e-09 *** --- Signif. codes : 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 50.48 on 28 degrees of freedom Multiple R-squared: 0.7415, Adjusted R-squared: 0.7323 F-statistic: 80.32 on 1 and 28 DF, p-value: 1.021e-09 估计结果为: ?56.920.06(36.21)(0.01) cum income =-+ 20.74 ..504880.32R s e F === 括号内为标准差。 三、检验模型的异方差 (一)图示法 par(mfrow=c(1,2)) plot(cumexp ~ income, col="red") abline(mydata.lm) plot(residuals(mydata.lm)^2 ~ income,col="blue") 从上图可以看出,残差平方对解释变量X 的散点图主要分布在图形中的下三角部分,大40006000 8000200300400500 600 a.散点图及回归线income c u m e x p 4000600080000500010000200003000 0 b.残差平方的散点图 income r e s i d u a l s (m y d a t a .l m )^2

第五章:异方差性(作业)

5.3 为了研究中国出口商品总额EXPORT 对国内生产总值GDP 的影响,搜集了1990~2015年相关的指标数据,如表5.3所示。 资料来源:《国家统计局网站》 (1) 根据以上数据,建立适当线性回归模型。 (2) 试分别用White 检验法与ARCH 检验法检验模型是否存在异方差? (3) 如果存在异方差,用适当方法加以修正。 解:(1) 100,000 200,000300,000400,000500,000600,000700,000X Y Dependent Variable: Y Method: Least Squares Date: 04/18/20 Time: 15:38

Sample: 1991 2015 Included observations: 25 Variable Coefficient Std. Error t-Statistic Prob. C -673.0863 15354.24 -0.043837 0.9654 X 4.061131 0.201677 20.13684 0.0000 R-squared 0.946323 Mean dependent var 234690.8 Adjusted R-squared 0.943990 S.D. dependent var 210356.7 S.E. of regression 49784.06 Akaike info criterion 24.54540 Sum squared resid 5.70E+10 Schwarz criterion 24.64291 Log likelihood -304.8174 Hannan-Quinn criter. 24.57244 F-statistic 405.4924 Durbin-Watson stat 0.366228 Prob(F-statistic) 0.000000 模型回归的结果: ^ 673.0863 4.0611i X i Y =-+ ()(0.043820.1368)t =- 20.9463,25R n == (2)white: 该模型存在异方差 Heteroskedasticity Test: White F-statistic 4.493068 Prob. F(2,22) 0.0231 Obs*R-squared 7.250127 Prob. Chi-Square(2) 0.0266 Scaled explained SS 8.361541 Prob. Chi-Square(2) 0.0153 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 04/18/20 Time: 17:45 Sample: 1991 2015 Included observations: 25 Variable Coefficient Std. Error t-Statistic Prob. C -1.00E+09 1.43E+09 -0.700378 0.4910 X^2 -0.455420 0.420966 -1.081847 0.2910 X 102226.2 60664.19 1.685117 0.1061 R-squared 0.290005 Mean dependent var 2.28E+09

异方差性习题与答案

第五章 异方差性习题与答案 1、产生异方差的后果是什么? 2、下列哪种情况是异方差性造成的结果? (1)OLS 估计量是有偏的 (2)通常的t 检验不再服从t 分布。 (3)OLS 估计量不再具有最佳线性无偏性。 3、已知模型:i i i i u X X Y +++=22110βββ 式中,i Y 为某公司在第i 个地区的销售额;i X 1为该地区的总收入;i X 2为该公司在该地区投入的广告费用(i=0,1,2……,50)。 (1)由于不同地区人口规模i P 可能影响着该公司在该地区的销售,因此有理由怀疑随机误差项u i 是异方差的。假设i σ依赖于总体i P 的容量,逐步描述你如何对此进行检验。需说明:A 、零假设和备择假设;B 、要进行的回归;C 、要计算的检验统计值及它的分布(包括自由度);D 、接受或拒绝零假设的标准。 (2)假设i i P σσ=。逐步描述如何求得BLUE 并给出理论依据。 4、下表数据给出按学位和年龄划分的经济学家的中位数工薪: 表1 经济学家的工资表 年 龄 中位数工薪(以千美元计算) 硕士 博士 25-29 8.0 8.8 30-34 9.2 9.6 35-39 11.0 11.0 40-44 12.8 12.5 45-49 14.2 13.6 50-54 14.7 14.3 55-59 14.5 15.0 60-64 13.5 15.0 65-69 12.0 15.0 (1)有硕士学位和有博士学位经济学家的中位数工薪的方差相等么? (2)如果相等,你会怎样检验两组平均中位数工薪相等的假设? (3)在年龄35至5岁之间的经济学家,有硕士学位的比有博士学位的赚更多的钱,那么你会怎样解释这一发现? 5、为了解美国工作妇女是否受到歧视,可以用美国统计局的“当前人口调查”中的截面数据,研究男女工资有没有差别。这项多元回归分析研究所用到的变量有: W —雇员的工资率(美元/小时) 1表示雇员为女性, 0表示女性意外的雇员。ED :受教育的年数。AGE :年龄

计量经济学第五章练习题及参考解答

第五章练习题及参考解答 5.1 设消费函数为 i i i i u X X Y +++=33221βββ 式中,i Y 为消费支出;i X 2为个人可支配收入;i X 3为个人的流动资产;i u 为随机误差 项,并且222)(,0)(i i i X u Var u E σ==(其中2 σ为常数)。试解答以下问题: (1)选用适当的变换修正异方差,要求写出变换过程; (2)写出修正异方差后的参数估计量的表达式。 练习题5.1参考解答: (1)因为2 2()i i f X X =,所以取221 i i W X = ,用2i W 乘给定模型两端,得 312322221i i i i i i i Y X u X X X X βββ=+++ 上述模型的随机误差项的方差为一固定常数,即 22221 ( )()i i i i u Var Var u X X σ== (2)根据加权最小二乘法,可得修正异方差后的参数估计式为 ***12233???Y X X βββ=-- ()()()() ()()() ***2**** 2223232232 2*2 *2**2223223?i i i i i i i i i i i i i i i i i i W y x W x W y x W x x W x W x W x x β-= -∑∑∑∑∑∑∑ ()()()()()()() ***2**** 2322222233 2*2 *2**2223223?i i i i i i i i i i i i i i i i i i W y x W x W y x W x x W x W x W x x β-= -∑∑∑∑∑∑∑ 其中 22232***23222, , i i i i i i i i i W X W X W Y X X Y W W W = = = ∑∑∑∑∑∑ **** **222333 i i i i i x X X x X X y Y Y =-=-=- 5.2 下表是消费Y 与收入X 的数据,试根据所给数据资料完成以下问题:

统计学教案习题05方差分析

统计学教案习题05方 差分析 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

第五章 方差分析 一、教学大纲要求 (一)掌握内容 1.方差分析基本思想 (1) 多组计量资料总变异的分解,组间变异和组内变异的概念。 (2) 多组均数比较的检验假设与F 值的意义。 (3) 方差分析的应用条件。 2.常见实验设计资料的方差分析 (1)完全随机设计的单因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (2)随机区组设计资料的两因素方差分析:适用的资料类型、总变异分解(包括自由度的分解)、方差分析的计算、方差分析表。 (3)多个样本均数间的多重比较方法: LSD-t 检验法;Dunnett-t 检验法;SNK-q 检验法。 (二)熟悉内容 多组资料的方差齐性检验、变量变换方法。 (三)了解内容 两因素析因设计方差分析、重复测量设计资料的方差分析。 二、教学内容精要 (一) 方差分析的基本思想 1. 基本思想 方差分析(analysis of variance ,ANOVA )的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean ,SS )和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。 2.分析三种变异 (1)组间变异:各处理组均数之间不尽相同,这种变异叫做组间变异(variation among groups ),组间变异反映了处理因素的作用(处理确有作用时 ),也包括了随机误差( 包括个体差异及测定误差 ), 其大小可用组间均方(MS 组间)表示,即 MS 组间= 组间组间ν/SS , 其中,SS 组间=21)(x x n k i i i -∑= , 组间ν=k -1为组间自由度。k 表示处理组数。 (2)组内变异:各处理组内部观察值之间不尽相同,这种变异叫做组内变异(variation within groups),组内变异反映了随机误差的作用,其大小可用组内均方 (组内MS ) 表示, 组内组内组内ν/SS MS = ,其中∑∑==?? ????-=k i n j i ij i x x SS 112)(组内 , k N -=组内ν,为组内均方自由度。

精选-《计量经济学》第五章精选题及答案

第五章 异方差 二、简答题 1.异方差的存在对下面各项有何影响? (1)OLS 估计量及其方差; (2)置信区间; (3)显著性t 检验和F 检验的使用。 2.产生异方差的经济背景是什么?检验异方差的方法思路是什么? 3.从直观上解释,当存在异方差时,加权最小二乘法(WLS )优于OLS 法。 4.下列异方差检查方法的逻辑关系是什么? (1)图示法 (2)Park 检验 (3)White 检验 5.在一元线性回归函数中,假设误差方差有如下结构: () i i i x E 22σε= 如何变换模型以达到同方差的目的?我们将如何估计变换后的模型?请列出估计步骤。 三、计算题 1.考虑如下两个回归方程(根据1946—1975年美国数据)(括号中给出的是标准差): t t t D GNP C 4398.0624.019.26-+= e s :(2.73)(0.0060) (0.0736) R 2=0.999 t t t GNP D GNP GNP C ??? ???-+=??????4315.06246.0192.25 e s : (2.22) (0.0068)(0.0597) R 2=0.875 式中,C 为总私人消费支出;GNP 为国民生产总值;D 为国防支出;t 为时间。 研究的目的是确定国防支出对经济中其他支出的影响。 (1)将第一个方程变换为第二个方程的原因是什么? (2)如果变换的目的是为了消除或者减弱异方差,那么我们对误差项要做哪些假设? (3)如果存在异方差,是否已成功地消除异方差?请说明原因。

(4)变换后的回归方程是否一定要通过原点?为什么? (5)能否将两个回归方程中的R2加以比较?为什么? 2.1964年,对9966名经济学家的调查数据如下: 资料来源:“The Structure of Economists’Employment and Salaries”, Committee on the National Science Foundation Report on the Economics Profession, American Economics Review, vol.55, No.4, December 1965. (1)建立适当的模型解释平均工资与年龄间的关系。为了分析的方便,假设中值工资是年龄区间中点的工资。 (2)假设误差与年龄成比例,变换数据求得WLS回归方程。 (3)现假设误差与年龄的平方成比例,求WLS回归方程。 (4)哪一个假设更可行? 3.参考下表给出的R&D数据。下面的回归方程给出了对数形式的R&D费用支出和销售额的回归结果。 1988年美国研究与发展(R&D)支出费用单位:百万美元

第五章 异方差性 思考题

第五章 异方差性 思考题 5.1 简述什么是异方差 ? 为什么异方差的出现总是与模型中某个解释变量的变化有关 ? 5.2 试归纳检验异方差方法的基本思想 , 并指出这些方法的异同。 5.3 什么是加权最小二乘法 , 它的基本思想是什么 ? 5.4 产生异方差的原因是什么 ? 试举例说明经济现象中的异方差性。 5.5 如果模型中存在异方差性 , 对模型有什么影响 ? 这时候模型还能进行应用分析吗 ? 5.6 对数变化的作用是什么 ? 进行对数变化应注意什么 ? 对数变换后模型的经济意义有什么变化 ? 5.7 怎样确定加权最小二乘法中的权数 ? 练习题 5.1 设消费函数为 12233i i i i Y X X u βββ=+++ 其中,i Y 为消费支出;2i X 为个人可支配收入;3i X 为个人的流动资产;i u 为随机误差项 , 并且 E(i u )=0,Var(i u )= 222i X σ( 其中2 σ为常数) 。试回答以下问题 : 1) 选用适当的变换修正异方差 , 要求写出变换过程 ; 2) 写出修正异方差后的参数估计量的表达式。 5.2 根据本章第四节的对数变换 , 我们知道对变量取对数通常能降低异方差性 , 但需对这种模型的随机误差项的性质给予足够的关注。例如 ,设模型为 21Y X u ββ=,对该模型中 的变量取对数后得 12ln ln ln ln Y X u ββ=++ 1) 如果ln u 要有零期望值 ,u 的分布应该是什么 ? 2) 如果 E(u )=1, 会不会 E(ln u )=0? 为什么 ? 3) 如果 E(ln u ) 不为零 , 怎样才能使它等于零 ? 5.3 表 5.8 给出消费 Y 与收入 X 的数据 , 试根据所给数据资料完成以下问题 : 1) 估计回归模型12Y X u ββ=++中的未知参数1β和2β, 并写出样本回归模型的书写格式; 2) 试用 GOMeld-Quandt 法和 White 法检验模型的异方差性 3 3) 选用合适的方法修正异方差。

相关文档
相关文档 最新文档