文档库 最新最全的文档下载
当前位置:文档库 › (新)计量作业第2章-第4章

(新)计量作业第2章-第4章

(新)计量作业第2章-第4章
(新)计量作业第2章-第4章

第二章一元线性回归模型

1、最小二乘法对随机误差项u作了哪些假定?说明这些假定条件的意义。

答:假定条件:

(1)均值假设:E(u i)=0,i=1,2,…;

(2)同方差假设:Var(u i)=E[u i-E(u i)]2=E(u i2)=σu2 ,i=1,2,…;

(3)序列不相关假设:Cov(u i,u j)=E[u i-E(u i)][u j-E(u j)]=E(u i u j)=0,i≠j,i,j=1,2,…;

(4)Cov(u i,X i)=E[u i-E(u i)][X i-E(X i)]=E(u i X i)=0;

(5)u i服从正态分布, u i~N(0,σu2)。

意义:有了这些假定条件,就可以用普通最小二乘法估计回归模型的参数。

2、阐述对样本回归模型拟合优度的检验及回归系数估计值显著性检验的步骤。答:样本回归模型拟合优度的检验:可通过总离差平方和的分解、样本可决系数、样本相关系数来检验。

回归系数估计值显著性检验的步骤:

(1)提出原假设H0 :β1=0;

(2)备择假设H1 :β1≠0;

(3)计算t=β1/Sβ1;

(4)给出显著性水平α,查自由度v=n-2的t分布表,得临界值tα/2(n-2);

(5)作出判断。如果|t|tα/2(n-2),拒绝H0 ,接受H1:β1≠0,表明X对Y有显著

影响。

4、试说明为什么∑e i2的自由度等于n-2。

答:在模型中,自由度指样本中可以自由变动的独立不相关的变量个数。当有约束条件时,自由度减少,其计算公式:自由度=样本个数-受约束条件的个数,即df=n-k。一元线性回归中SSE残差的平方和,其自由度为n-2,因为计算残差时用到回归方程,回归方程中有两个未知参数β0和β1,而这两个参数需要两个约束条

件予以确定,由此减去2,也即其自由度为n-2。

5、试说明样本可决系数与样本相关系数的关系及区别,以及样本相关系数与β

^1的关系。

答:样本相关系数r的数值等于样本可决系数的平方根,符号与β1相同。但样本相关系数与样本可决系数在概念上有明显的区别,r建立在相关分析的理论基础之上,研究两个随机变量X与Y之间的线性相关关系;样本可决系数r2建立在回

归分析的理论基础之上,研究非随机变量X对随机变量Y的解释程度。

6、已知某市的货物运输量Y(万吨),国内生产总值GDP(亿元,1980年不变

价)1985~1998年的样本观测值见下表(略)。

Dependent Variable: Y

Method: Least Squares

Date: 10/28/13 Time: 10:25

Sample: 1985 1998

Included observations: 14

Variable Coefficient Std. Error t-Statistic Prob.

GDP 26.95415 4.120300 6.541792 0.0000

C 12596.27 1244.567 10.12101 0.0000

R-squared 0.781002 Mean dependent var 20168.57

Adjusted R-squared 0.762752 S.D. dependent var 3512.487

S.E. of regression 1710.865 Akaike info criterion 17.85895

Sum squared resid 35124719 Schwarz criterion 17.95024

Log likelihood -123.0126 Hannan-Quinn criter. 17.85050

F-statistic 42.79505 Durbin-Watson stat 0.859998

Prob(F-statistic) 0.000028

(1) 一元线性回归方程Y t=12596.27+26.95415GDPt

(2) 结构分析β^1=26.95425是样本回归方程的斜率,它表示某市货物运输量的情况,说明货物运输量每增加1亿元,将26,95425用于国内生产总值;β^0=12596.27是样本回归方程的截距,它表示不受货物运输量影响的国内生产总值。

(3)统计检验r2=0.78 说明总离差平方和的78%被样本回归直线解释,有22%没被解释,说明样本回归直线对样本点的拟合优度还是比较高的。

显著性水平α=0.05,查自由度v=14-2=12的t分布表,得临界值t0.025(12)=2.18

(4)预测区间1980~2000

obs GDP RESID Y YF YFSE 1980

1981

1982

1983

1984

1985 161.69 1294.51817047138 18249 16954.48182952862 1837.805042947807 1986 171.07 1317.688263830489 18525 17207.31173616951 1827.852********* 1987 184.07 842.2843420467398 18400 17557.71565795326 1815.329074565951 1988 194.75 -1152.585956772524 16693 17845.58595677253 1806.164743584577 1989 197.86 -2386.413356522331 15543 17929.41335652233 1803.689193053205 1990 208.55 -2288.553196819888 15929 18217.55319681989 1795.851377857323 1991 221.06 -246.7495861671741 18308 18554.74958616718 1788.013873793755 1992 246.92 -1729.78384903854 17522 19251.78384903854 1776.450315989464 1993 276.8 1582.826213815424 21640 20057.173******** 1770.995648870701 1994 316.38 2658.981042723055 23783 21124.01895727694 1776.926294021264 1995 363.52 1645.362514039523 24040 22394.63748596048 1803.310480128086 1996 415.51 337.0163683828214 24133 23795.98363161718 1855.694986909933 1997 465.78 -60.96864300710876 25090 25150.96864300711 1927.747214173007

1998 509.1

-1813.62232698188

24505 26318.62232698188 2004.982737266598

1999

2000

620

29307.83732127556 2255.639096466328

单个值预测区间 Y 2000∈[29307.84-2.10×2255.64,29307.84+2.10×2255.64] 均值预测区间 E(Y 2000)∈[29307.84-2.10×2255.64,29307.84+2.10×2255.64] 8、查中国统计年鉴,利用1978~2000的财政收入和GDP 的统计资料,要求以手工和EViews 软件。 (1)散点图

20,000

40,00060,000

80,000

100,000

Y

G D P

Dependent Variable: Y Method: Least Squares Date: 10/29/13 Time: 16:40 Sample: 1978 2000 Included observations: 23

Variable Coefficient Std. Error t-Statistic Prob. GDP 0.986097 0.001548 637.0383 0.0000 C

174.4171

50.39589

3.460939

0.0023

R-squared 0.999948 Mean dependent var 22634.30 Adjusted R-squared 0.999946 S.D. dependent var 23455.82 S.E. of regression 172.6972 Akaike info criterion 13.22390 Sum squared resid 626310.6 Schwarz criterion 13.32264 Log likelihood -150.0748 Hannan-Quinn criter. 13.24873 F-statistic 405817.8 Durbin-Watson stat 0.984085

Prob(F-statistic)

0.000000

一元线性回归方程Y=174.4174+0.98GDP t

经济意义国名收入每增加1亿元,将有0.98亿元用于国内生产总值。

(2)检验r2=99%,说明总离查平方和的99%被样本回归直线解释,仅有1%未被解释,所以说样本回归直线对样本点的拟合优度很高。

显著性水平α=0.05,查自由度v=23-2=21的t分布表,得临界值t0.025(21)=2.08。

(3)预测值及预测区间

obs Y YF YFSE GDP

1978 3645.2 3768.93952756

0003

178.879907887

3616 3645.2

1979 4062.6 4180.53660248

6764

178.774077728

9417 4062.6

1980 4545.60000000

0001

4656.82167002

3003

178.654453123

7366

4545.60000000

0001

1981 4889.5 4998.01138714

0059

178.570634469

0318

4891.60000000

0001

1982 4889.5 4998.01138714

0059

178.570634469

0318

4891.60000000

0001

1983 5330.5 5423.80826532

2558

178.468230113

8803

5323.39999999

9999

1984 5985.6 6054.22036403

0461

178.321108326

6242 5962.7

1985 7243.8 7282.30612616

2203

178.049950484

8901 7208.1

1986 9040.70000000

0001

9065.07170297

124

177.692806300

9931 9016

1987 12050.6 12065.3717992

1504

177.189939863

8916 12058.6

1988 10274.4 10306.7656098

8973

177.469705227

4058 10275.2

1989 12050.6 12065.3717992

1504

177.189939863

8916 12058.6

1990 15036.8 15008.0838044

7724

176.817239439

1318 15042.8

1991 17000.9 16930.4807799

6771

176.638587454

0277 16992.3

1992 18718.3 18582.6870546

1982

176.526126442

3878 18667.8

1993 35260 35017.0857379

8564

177.479184885

4038 35333.9

1994 21826.2 21653.0986794

3883

176.418239372

4463 21781.5

1995 26937.3 26723.6117586

7555

176.528268981

9769 26923.5

1996 35260 35017.0857******* 177.479184885

4038 35333.9 1997 48108.5 47702.24331311228 180.7470770711596 48197.9 1998 59810.5 60122.92955260078 185.9681357044579 60793.7 1999 88479.2 88604.77659126783 204.5612478858191 89677.1 2000 70142.5

70361.48074871261 191.6614042102092 71176.6 2001

104413.7922729122

218.176634678

1298

105709

单个值的预测区间 Y 2000∈[104413.8-2.07×218.2,104413.8+2.07×218.2] 均值预测区间 E(Y 2000)∈[104413.8-2.07×218.2,104413.8+2.07×218.2]

第三章 多元线性回归模型

2、试对二元线性回归模型Y i =β0+β1X 1i +β2X 2i +u i ,i=1,2,3,……n 作回归分析: (1)求出未知参数β0,β1,β2的最小二乘估计量β^0,β^1,β^2; (2)求出随机误差项u 的方差σ2的无偏估计量; (3) 对样本回归方差拟合优度检验;

(4) 对总体回归方程的显著性进行F 检验; (5) 对β1,β2的显著性进行t 检验;

(6) 当X 0=(1,X 10,X 20)时,写出E(Y 0/X 0)的置信度为95%的预测区间。

答:(1)由公式

1

='X X X Y β∧

-(')可得出012βββ∧∧∧,和。其中0

12={}

ββββ∧

,1i 2i

21i

1i 2i 1i 22i 1i

2i

1i 3

'[]

X

X X X X X X X X

X X

X

??

?

= ? ??

?∑∑∑∑∑∑∑∑,

i 1i i 2i i '{}Y X Y X Y X Y =∑∑∑ (2) 随机误差项的方差2

σ

的无偏差估计量为 2

i

e =n-k-1n-k-1ESS ∑

(3) 求出样本可决系数2

R =R-squared ,修正样本可决系数为

2R =Adjusted-squared,比较2R 和2

R 值大小关系,即可得出样本回归方差

拟合优度。

(4) 提出检验的原假设

0i 2==0H ββ:,

对立假设为 1H :至少有一个i β不等于

零(i=1,2),由题意得F 的统计量为 F-statistic 。对于给定的显著性水平α,;

从附录4的表1中,查出分子自由度为1f ,分母自由度为2f

的F 分布上侧位

0.0512f ,f F (,)。由F-statistic 与0.0512f ,f F (,)

的值大小关系,可得显著性关系。

(5)提出检验的原假设0i =0i=1,2H β:,,求出t 统计量 i t

-statistic 。对于给定的显著性水平α=0.05,;从附录4的表1中,查出t 分布的自由度为f

的t 分布双侧位数

0.05t f ()。比较i t

-statistic 与0.05t f ()值的大小关系,可得检

验结果的显著性关系。

(6)E(Y O |X O )的预测区间:(Y 0-t α/2(v)?S(Y 0),Y 0+t α/2(v)?S(Y 0)) ; Y O 的预测区间:(Y 0-t α/2(v)?S(e 0),Y 0+t α/2(v)?S(e 0) 3、经研究发现,学生用于购买书籍及课外读物的支出与本人受教育年限和其家庭收入水平有关,对18名学生进行调查的统计资料如下表所示(略)。

Dependent Variable: Y Method: Least Squares Date: 10/29/13 Time: 22:18 Sample: 1 18

Included observations: 18

Variable Coefficient Std. Error t-Statistic Prob. X2 0.402289 0.116359 3.457319 0.0035 X1 104.3081 6.409709 16.27345 0.0000 C

-0.962980

30.32507 -0.031755

0.9751

R-squared 0.979722 Mean dependent var 755.1556 Adjusted R-squared 0.977019 S.D. dependent var 258.6819 S.E. of regression 39.21512 Akaike info criterion 10.32701 Sum squared resid 23067.39 Schwarz criterion 10.47541 Log likelihood -89.94312 Hannan-Quinn criter. 10.34748 F-statistic 362.3656 Durbin-Watson stat 2.561545

Prob(F-statistic)

0.000000

回归方程 Y^=-0.96+104.3X1+0.4X2 (2)检验设原假设 H0:βi =0 i=1,2

根据上表中的计算结果知:S(β^1)=6.409709 S(β^2)=0.116359 将S(β^1)和S(β^2)的值代入检验统计量式中,得

T1=β^1÷S(β^1)=16.2735 t2=β^2÷S(β^2)=3.4561

对于给定的显著水平α=0.05,自由度为v=15的双侧分位数t 0.05/2=2.13。因为 t 1>t 0.05/2 t 2>t 0.05/2,所以否定H 0:β1≠0,H 0:β2≠0,即可以认为受教育年限和家庭收入对学生购买书籍以及课外读物有显著性影响。 (3) R 2=RSS/TSS=0.979722 R 2=1-(1-R 2)n-1/n-k-1=0.97702 (4)预测区间 obs

Y

YF

YFSE

X2

X1

ˉ

1 450.5 485.141174769

2648

42.1736550662

4408 171.2 4

2 507.7 486.348041790

1021

42.1036382828

7697 174.2 4

3 613.9 602.765010184

4977

41.6023430378

6757 204.3 5

4 563.4 504.249902599

1888

41.3981428967

1567 218.7 4

5 501.5 504.531504904

0509

41.3921241782

7067 219.4 4

6 781.5 825.903781905

8965

42.9792448369

0921 240.4 7

7 541.799999999

9999

526.295340179

8169

41.4117973376

9013 273.5 4

8 611.1 639.172165313

09

40.5574828341

8582 294.8 5

9 1222.1 1174.95354258

5611

47.4768632431

9662 330.2 10

10 793.2 863.195972849

7693

40.6897005289

6574 333.1 7

11 660.8 667.815142607

6286

41.6323221694

1219 366 5

12 792.7 766.048647888

0758

40.4127190197

3422 350.9 6

13 580.9 560.248532366

0397

43.3098732208

7763 357.9 4

14 612.7 664.999119559

0084

41.4545591551

4781 359 5

15 890.8 878.804786319

2651

40.5530798828

6174 371.9 7

16 1121 1112.92604793

0283

42.4958860743

6637 435.3 9

17 1094.2 1044.26078466

035

43.6391801181

4712 523.9 8

18 1253 1285.14050158

8057

46.3991586393

9679 604.1 10

19 1235.21643582

6087

44.1250725573

2823 480 10

单个值的预测区间Y∈[1235.216-2.13×44.125,1235.216+2.13×44.125] 均值的预测区间E(Y)∈[1235.216-2.13×44.125,1235.216+2.13×44.125]

4、假设投资函数模型估计的回归方程为:

I t=5.0+0.4Y t+0.6I t-1,R2=0.8,DW=2.05,n=24其中I t和Y t分别为第t期投资和国民收入

(1)对总体参数?1,?2的显著性进行检验(α=0.05)

(2)若总离差平方和TSS=25,试求随机误差项u t方差的估计量

(3)计算F统计量,并对模型总体的显著性进行检验(α=0.05)

答:(1)首先提出检验的原假设H0:?1=0,i=1,2,。由题意知t的统计量值为

t1=4.0,t2=3.2。对于给定的显著性水平α=0.05,;从附录4的表1中,查出t分布的自由度为v=21的双侧分数位t0.05/2(21)=1.72。因为t1=4.0> t0.05/2(21)=1.72,所以否定H0,?1显著不等于零即可以认为第t期投资对国民收入有显著影响;t2=3.2 >

t0.05/2(21)=1.72。所以否定H0,?2显著不等于零即可以认为第t期投资对第t-1期投资有显著影响。

(2)R2 =RSS=R2×TSS=0.8×25=20.u t的方差估计量为:

(3)提出检验的原假设H0:?1=?2=0,F===42,对于给定的显著性水平α=0.05,从附录4的表3中,查出分分子自由度为2,分母自由度为21的F分布上侧位数

F0.05/2(21)=3.47。因为F=42>3.47,所以否定H0,总体回归方程存在显著的线性关系,即第t期投资与第t-1期投资和第t期国民收入的线性关系是显著的。

6、已知某地区某农产品收购量Y,销售量X1,出口量X2,库存量X3的1955~1984年的样本观测值见下表。试建立以收购量Y为被解释变量的多元线性回归模型并预测。

根据题意可设方程为Y=β0+β1X1+β2X2+β3X3,利用Eview可知,

Dependent Variable: Y

Method: Least Squares

Date: 10/29/13 Time: 22:55

Sample: 1955 1984

Included observations: 30

Variable Coefficient Std. Error t-Statistic Prob.

X3 0.150971 0.083318 1.811984 0.0816

X2 2.924095 1.655324 1.766480 0.0891

X1 0.919120 0.235896 3.896288 0.0006

C 0.437272 4.050575 0.107953 0.9149

R-squared 0.600052 Mean dependent var 22.13167

Adjusted R-squared 0.553904 S.D. dependent var 14.47259

S.E. of regression 9.666307 Akaike info criterion 7.498736

Sum squared resid 2429.375 Schwarz criterion 7.685562

Log likelihood -108.4810 Hannan-Quinn criter. 7.558503

F-statistic 13.00281 Durbin-Watson stat 1.153567

Prob(F-statistic) 0.000022

回归方程Y=0.437+0.919X1+2.924X2+0.151X3

第四章非线性回归模型的线性化

1.某商场1990年~1998年间皮鞋销售额(万元)的统计资料如下表所示。(表略)

考虑指数模型lnY=α+βt+ut,试利用上表的数据进行回归分析,并预测1999年该商场皮鞋的销售额。

答:

Dependent Variable: Y

Method: Least Squares

Date: 10/30/13 Time: 21:52

Sample: 1990 1998

Included observations: 9

Variable Coefficient Std. Error t-Statistic Prob.

T 4.088333 0.419507 9.745574 0.0000

C -4.186111 2.360696 -1.773253 0.1195

R-squared 0.931357 Mean dependent var 16.25556

Adjusted R-squared 0.921550 S.D. dependent var 11.60163

S.E. of regression 3.249485 Akaike info criterion 5.388000

Sum squared resid 73.91406 Schwarz criterion 5.431828

Log likelihood -22.24600 Hannan-Quinn criter. 5.293420

F-statistic 94.97621 Durbin-Watson stat 0.542289

Prob(F-statistic) 0.000025

根据上表建立回归模型为Y = 4.0883********T - 4.1861111111

根据回归模型知道1999年该商场皮鞋销售量为Y=36.694

2.美国在1790年~1990年间每10年的人口总数Y(百万人)的统计资料如下表所示。(表略)

考虑指数增长模型:Y=Aeαt+u,试利用上表的数据进行回归分析,并预测美国2000年的人口总数。

答:

3.印度在1948年~1964年间的名义货币存量(现金余额)Mt(n),名义国民收入Yt(n),内含价格缩减指数(Implic it Price Deflator,也称综合价格换算系数)Pt,长期利率rt的统计资料如下表所示。用内含价格缩减指数分别除名义货币存量和名义国民收入,得实际货币存量和实际国民收入,记为Mt,Yt。(表略)(1)考虑货币需求函数模型

M t(n)= α0Y tα1r tα2P tα3e ut

利用最小二乘法估计该模型,判断α3估计值的符号是否合理,并对估计的回归方程解释其经济意义。

(2)考虑货币需求函数模型

M t(n)= β0(Y t(n)) β1r tβ2P tβ3e ut

利用最小二乘法估计该模型,说明β1和α1之间的关系。

(3) 考虑货币需求函数模型

M t=λ0Y tλ1r tλ2e ut

利用最小二乘法估计该模型,确定实际货币存量关于实际国民收入及长期利率的弹性。

(4) 考虑货币需求函数模型

()t=αr tβe ut

利用最小二乘法估计该模型,并对估计的回归方程解释其经济意义。

(5)对上述4个模型进行显著性检验,并加以比较。

相关文档