文档库 最新最全的文档下载
当前位置:文档库 › 计量经济学例题

计量经济学例题

第二章 经典单方程计量经济学模型:一元线性回归模型

例1.令kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数.生育率对教育年数的简单回归模型为μββ++=educ kids 10

(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?

(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释.

解答:

(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中.有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等.

(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ 相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足.

例2.已知回归模型μβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年).随机扰动项μ的分布未知,其他所有假设都满足.

(1)从直观及经济角度解释α和β.

(2)OLS 估计量α

?和β?满足线性性、无偏性及有效性吗?简单陈述理由. (3)对参数的假设检验还能进行吗?简单陈述理由.

解答:

(1)N βα+为接受过N 年教育的员工的总体平均起始薪金.当N 为零时,平均薪金为α,因此α表示没有接受过教育员工的平均起始薪金.β是每单位N 变化所引起的E 的变化,即表示每多接受一年学校教育所对应的薪金增加值.

(2)OLS 估计量α

?和仍β?满足线性性、无偏性及有效性,因为这些性质的的成立无需随机扰动项μ的正态分布假设.

(3)如果t μ的分布未知,则所有的假设检验都是无效的.因为t 检验与F 检验是建立在μ的正态分布假设之上的.

例3.在例2中,如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化?

解答:首先考察被解释变量度量单位变化的情形.以E*表示以百元为度量单位的薪金,则μβα++=?=N E E 100*.

由此有如下新模型)100/()100/()100/(*μβα++=N E 或****μβα++=N E .

这里100/*αα=,100/*ββ=.所以新的回归系数将为原始模型回归系数的1/100.

再考虑解释变量度量单位变化的情形.设N*为用月份表示的新员工受教育的时间长度,则N*=12N ,于是μβαμβα++=++=)12/*(N N E 或μβα++=*)12/(N E

可见,估计的截距项不变,而斜率项将为原回归系数的1/12.

例4.对没有截距项的一元回归模型i i i X Y μβ+=1称之为过原点回归(regrission through the origin ).试证明

(1)如果通过相应的样本回归模型可得到通常的的正规方程组00

i i i e e X ?=??=??∑∑

则可以得到1β的两个不同的估计值: X Y =1~β, ()()

∑∑=21?i i i X Y X β. (2)在基本假设0)(i =μE 下,1~

β与1?β均为无偏估计量. (3)拟合线X Y 1

??β=通常不会经过均值点),(Y X ,但拟合线X Y 1~~β=则相反. (4)只有1

?β是1β的OLS 估计量. 解答:(1)由第一个正规方程 0=∑t e 得0)~(1=-∑t t X Y β或∑∑=t t X Y 1~β,

求解得X Y /~1=β.由第2个下规方程0)?(1=-∑t t t X Y X β得∑∑=21?t t

t X Y X β, 求解得)/()(?21∑∑=t t t X Y X β. (2)对于X Y /~

1=β,求期望 11111111()()[()][{)()]t t t t X X E E Y X E X E E X n X n X

βββμμββ==+=+== 这里用到了t X 的非随机性.

对于)/()(?21∑∑=t t t X Y X β,求期望

21

12211?()(/)()()()[()]t t t t t t t t t t E E X Y X E X Y E X X X X ββμ===+∑∑∑∑∑∑ 2112211()()()()t t t t t

X X E X X βμβ=+=∑∑∑∑ (3)要想拟合值X Y 1??β=通过点),(Y X ,X 1?β必须等于Y .但X X Y X X t t t

∑∑=2

1?β,通常不等于Y .

这就意味着点),(Y X 不太可能位于直线X Y 1

??β=上. 相反地,由于Y X =1~β,所以直线X Y 1

~?β=经过点),(Y X . (4)OLS 方法要求残差平方和最小Min ∑∑-==212

)?(t

t t X Y e RSS β 关于1?β求偏导得0))(?(2?11

=--=??∑t t t X X Y RSS ββ,即0)?(1=-∑t t t X Y X β

()()∑∑=2

1?i i i X Y X β.可见1

?β是OLS 估计量. 例5.假设模型为t t t X Y μβα++=.给定n 个观察值),(11Y X ,),(22Y X ,…,),(n n Y X ,按如下步骤建立β的一个估计量:在散点图上把第1个点和第2个点连接起来并计算该直线的斜率;同理继续,最

终将第1个点和最后一个点连接起来并计算该条线的斜率;最后对这些斜率取平均值,称之为β

?,即β的估计值.

(1)画出散点图,给出β

?的几何表示并推出代数表达式. (2)计算β

?的期望值并对所做假设进行陈述.这个估计值是有偏的还是无偏的?解释理由. (3)证明为什么该估计值不如我们以前用OLS 方法所获得的估计值,并做具体解释.

解答:

(1)散点图如下图所示.

(X n ,Y n )

首先计算每条直线的斜率并求平均斜率.连接),(11Y X 和),(t t Y X 的直线斜率为)/()(11X X Y Y t t --.由

于共有n -1条这样的直线,因此][11?21

1∑==---=n t t t t X X Y Y n β (2)因为X 非随机且0)(=t E μ,因此

βμμβμβαμβα=--+=-++-++=--][])()([][1

111111X X E X X X X E X X Y Y E t t t t t t t 这意味着求和中的每一项都有期望值β,所以平均值也会有同样的期望值,则表明是无偏的.

(3)根据高斯-马尔可夫定理,只有β的OLS 估计量是最付佳线性无偏估计量,因此,这里得到的β

?的有效性不如β的OLS 估计量,所以较差.

例6.对于人均存款与人均收入之间的关系式t t t Y S μβα++=使用美国36年的年度数据得如下估计

模型,括号内为标准差:?384.1050.067t t

S Y =+ (151.105) (0.011) 20.538R = 023.199?=σ (1)β的经济解释是什么?

(2)α和β的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可

能的原因吗?

(3)对于拟合优度你有什么看法吗?

(4)检验是否每一个回归系数都与零显著不同(在1%水平下).同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述.你的结论是什么?

解答:

(1)β为收入的边际储蓄倾向,表示人均收入每增加1美元时人均储蓄的预期平均变化量.

(2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此α符号应为负.储蓄是收入的一部分,且会随着收入的增加而增加,因此预期β的符号为正.实际的回归式中,β的符号为正,与预期的一致.但截距项为负,与预期不符.这可能与由于模型的错误设定形造成的.如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对截距项的估计产生影响;另一种可能就是线性设定可能不正确.

(3)拟合优度刻画解释变量对被解释变量变化的解释能力.模型中53.8%的拟合优度,表明收入的变化可以解释储蓄中53.8 %的变动.

(4)检验单个参数采用t 检验,零假设为参数为零,备择假设为参数不为零.双变量情形下在零假设下t 分布的自由度为n-2=36-2=34.由t 分布表知,双侧1%下的临界值位于2.750与2.704之间.斜率项计算的t 值为0.067/0.011=6.09,截距项计算的t 值为384.105/151.105=2.54.可见斜率项计算的t 值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设.

第三章 经典单方程计量经济学模型:多元线性回归模型

例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为

fedu medu sibs edu 210.0131.0094.036.10++-= 20.214

R = 式中,edu 为劳动力受教育年数,sibs 为该劳动力家庭中兄弟姐妹的个数,medu 与fedu 分别为母亲与父亲受到教育的年数.问

(1)sibs 是否具有预期的影响?为什么?若medu 与fedu 保持不变,为了使预测的受教育水平减少一年,需要sibs 增加多少?

(2)请对medu 的系数给予适当的解释.

(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少?

解答:

(1)预期sibs 对劳动者受教育的年数有影响.因此在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短.根据多元回归模型偏回归系数的含义,sibs 前的参数估计值-0.094表明,在其他条件不变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育的时间,兄弟姐妹需增加1/0.094=10.6个.

(2)medu 的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年受教育的机会,其子女作为劳动者就会预期增加0.131年的教育机会.

(3)首先计算两人受教育的年数分别为:10.36+0.131?12+0.210?12=14.452;

10.36+0.131?16+0.210?16=15.816.因此,两人的受教育年限的差别为15.816-14.452=1.364

例2.以企业研发支出(R&D )占销售额的比重为被解释变量(Y ),以企业销售额(X 1)与利润占销售额的比重(X 2)为解释变量,一个有32容量的样本企业的估计结果如下:

120.4720.32log()0.05Y X X =++ (1.37

) (0.22) (0.046) 20.099R = 其中括号中为系数估计值的标准差.

(1)解释log(X 1)的系数.如果X 1增加10%,估计Y 会变化多少个百分点?这在经济上是一个很大的影响吗?

(2)针对R&D 强度随销售额的增加而提高这一备择假设,检验它不虽X 1而变化的假设.分别在5%和

10%的显著性水平上进行这个检验.

(3)利润占销售额的比重X 2对R&D 强度Y 是否在统计上有显著的影响?

解答:

(1)log(x1)的系数表明在其他条件不变时,log(X 1)变化1个单位,Y 变化的单位数,即?Y=0.32?log(X 1)≈0.32(?X 1/X 1)=0.32?100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y 会增加0.32个百分点.由此,如果X 1增加10%,Y 会增加0.032个百分点.这在经济上不是一个较大的影响.

(2)针对备择假设H 1:01>β,检验原假设H 0:01=β.易知计算的t 统计量的值为t=0.32/0.22=1.468.在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为1.699(单侧),计算的t 值小于该临界值,所以不拒绝原假设.意味着R&D 强度不随销售额的增加而变化.在10%的显著性水平下,t 分布的临界值为

1.311,计算的t 值小于该值,拒绝原假设,意味着R&D 强度随销售额的增加而增加.

(3)对X 2,参数估计值的t 统计值为0.05/0.46=1.087,它比在10%的显著性水平下的临界值还小,因此可以认为它对Y 在统计上没有显著的影响.

例3.下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为p-值)(如果某项为空,则意味着模型中没有此变量).数据为美国40个城市的数据.模型如下:

01234567sin hou g density value income popchang unemp localtax

statetax ββββββββμ=++++++++

式中housing ——实际颁发的建筑许可证数量,density ——每平方英里的人口密度,value ——自由房屋的均值(单位:百美元),income ——平均家庭的收入(单位:千美元),popchang ——1980~1992年的人口增长

验结果,你认为应该把变量保留在模型中还是去掉?

(2)在模型A 中,在10%水平下检验联合假设H 0:0i β= (i=1,5,6,7).说明被择假设,计算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准.说明你的结论.

(3)哪个模型是“最优的”?解释你的选择标准.

(4)说明最优模型中有哪些系数的符号是“错误的”.说明你的预期符号并解释原因.确认其是否为正确符号.

解答:

(1)直接给出了P-值,所以没有必要计算t-统计值以及查t 分布表.根据题意,如果p-值<0.10,则我们拒绝参数为零的原假设.由于表中所有参数的p-值都超过了10%,所以没有系数是显著不为零的.但由此去掉

所有解释变量,则会得到非常奇怪的结果.其实正如我们所知道的,多元回去归中在省略变量时一定要谨慎,要有所选择.本例中,value 、income 、popchang 的p-值仅比0.1稍大一点,在略掉unemp 、localtax 、statetax 的模型C 中,这些变量的系数都是显著的.

(2)针对联合假设H 0:0i β=(i=1,5,6,7)的备择假设为H 1:0i β=(i=1,5,6,7),中至少有一个不为零.检验假设H 0,实际上就是参数的约束性检验,非约束模型为模型A ,约束模型为模型D ,检验统计值为

462.0)

840/()7763.4()37/()7763.47038.5()1/()/()(=-+-+-+=----=e e e k n RSS k k RSS RSS F U U R U U R 显然,在H 0假设下,上述统计量满足F 分布,在10%的显著性水平下,自由度为(4,32)的F 分布的临界值位于2.09和2.14之间.显然,计算的F 值小于临界值,我们不能拒绝H 0,所以i β(i=1,5,6,7)是联合不显著的.

(3)模型D 中的3个解释变量全部通过显著性检验.尽管R2与残差平方和较大,但相对来说其AIC 值最低,所以我们选择该模型为最优的模型.

(4)随着收入的增加,我们预期住房需要会随之增加.所以可以预期β3>0,事实上其估计值确是大于零的.同样地,随着人口的增加,住房需求也会随之增加,所以我们预期β4>0,事实其估计值也是如此.随着房屋价格的上升,我们预期对住房的需求人数减少,即我们预期β3估计值的符号为负,回归结果与直觉相符.出乎预料的是,地方税与州税为不显著的.由于税收的增加将使可支配收入降低,所以我们预期住房的需求将下降.虽然模型A 是这种情况,但它们的影响却非常微弱.

例4.在经典线性模型基本假定下,对含有三个自变量的多元回归模型:

μββββ++++=3322110X X X Y ,你想检验的虚拟假设是H 0:1221=-ββ.

(1)用2

1?,?ββ的方差及其协方差求出)?2?(21ββ-Var . (2)写出检验H 0:1221=-ββ的t 统计量.

(3)如果定义θββ=-212,写出一个涉及β0、θ、β2和β3的回归方程,以便能直接得到θ估计值θ?及其标准误.

解答:(1)由数理统计学知识易知)?(4)?,?(4)?()?2?(2

21121ββββββVar Cov Var Var +-=-. (2)由数理统计学知识易知)?2?(1?2?2

121ββββ---=se t ,其中)?2?(21ββ-se 为)?2?(21ββ-的标准差. (3)由θββ=-212知212βθβ+=,代入原模型得

02122330121233(2)(2)Y X X X X X X X βθβββμβθββμ=+++++=+++++

这就是所需的模型,其中θ估计值θ?及其标准误都能通过对该模型进行估计得到.

第四章 经典单方程计量经济学模型:放宽基本假定的模型

例1.下列哪种情况是异方差性造成的结果?

(1)OLS 估计量是有偏的。(2)通常的t 检验不再服从t 分布。

(3)OLS 估计量不再具有最佳线性无偏性。

解答: 第(2)与(3)种情况可能由于异方差性造成。异方差性并不会引起OLS 估计量出现偏误。 例2.已知模型:t t t t u X X Y +++=22110βββ,222)(t t t Z u Var σσ==。上式中Y 、X 1、X 2和Z 的数据已知。假设给定权数t w ,加权最小二乘法就是求下式中的各β,以使的该式最小:2221102)()(t t t t t t t t t X w X w w Y w u w RSS βββ---==∑∑

(1)求RSS 对β1、β2和β2的偏微分并写出正规方程。

(2)用Z 去除原模型,写出所得新模型的正规方程组。

(3)把t t Z w /1=带入(1)中的正规方程,并证明它们和在(2)中推导的结果一样。

解答:(1)由2221102)()(t t t t t t t t t X w X w w Y w u w RSS βββ---==

∑∑对各β求偏导得如下正规方程组: ∑=---0)(22110t t t t

t t t t w X w X w w Y w βββ ∑=---0)(122110t t t t t t t t t X w X w X w w Y w βββ

∑=---0)(122110t t t t t t t t t X w X w X w w Y w βββ

(2)用Z 去除原模型,得如下新模型:

t t t t t t t t t Z u Z X Z X Z Z Y +++=22110βββ; 对应的正规方程组如下所示:01)(22110=---∑t

t t t t t t t Z Z X Z X Z Z Y βββ 0)(

122110=---∑t t t t t t t t t Z X Z X Z X Z Z Y βββ 0)(

222110=---∑t t t t t t t t t Z X Z X Z X Z Z Y βββ (3)如果用1t

Z 代替(1)中的t w ,则容易看到与(2)中的正规方程组是一样的。 例3.已知模型i i i i u X X Y +++=22110βββ。式中i Y 为某公司在第i 个地区的销售额;i X 1为该地区的总收入;i X 2为该公司在该地区投入的广告费用(i=0,1,2……,50)。

(1)由于不同地区人口规模i P 可能影响着该公司在该地区的销售,因此有理由怀疑随机误差项u i 是异方差的。假设i σ依赖于总体i P 的容量,请逐步描述你如何对此进行检验。需说明:1)零假设和备择假设;

2)要进行的回归;3)要计算的检验统计值及它的分布(包括自由度);4)接受或拒绝零假设的标准。

(2)假设i i P σσ=。逐步描述如何求得BLUE 并给出理论依据。

解答:(1)如果i σ依赖于总体i P 的容量,则随机扰动项的方差2i σ依赖于2i P 。因此,要进行的回归的

一种形式为i i i P εαασ++=2102。于是,要检验的零假设H0:10α=,备择假设H1:01≠α。检验步骤

如下:第一步:使用OLS 方法估计模型,并保存残差平方项2~i

e ; 第二步:做2~i e 对常数项C 和2i

P 的回归; 第三步:考察估计的参数1α的t 统计量,它在零假设下服从自由度为2的t 分布;

第四步:给定显著性水平0.05(或其他),查相应的自由度为2的t 分布的临界值,如果估计的参数1?α

的t 统计值大于该临界值,则拒绝同方差的零假设。

(2)假设i i P σσ=时,模型除以i P 有:i

i i i i i i i i P u P X P X P P Y +++=221101βββ 由于222/)/(σσ==i i i i P P u Var ,所以在该变换模型中可以使用OLS 方法,得出BLUE 估计值。方法是对i i P Y /关于i P /1、i i P X /1、i i P X /2做回归,不包括常数项。

例4.以某地区22年的年度数据估计了如下工业就业回归方程

321ln 62.0ln 25.0ln 51.089.3X X X Y +-+-=

(-0.56) (2.3) (-1.7) (5.8) 20.996R = 147.1=DW

上式中Y 为总就业量,X 1为总收入,X 2为平均月工资率,X 3为地方政府的总支出。

(1)试证明:一阶自相关的DW 检验是无定论的。(2)逐步描述如何使用LM 检验。

解答:(1)由于样本容量n=22,解释变量个数为k=3,在5%在显著性水平下,相应的上下临界值为664.1=U d 、503.1=L d 。由于DW=1.147位于这两个值之间,所以DW 检验是无定论的。

(2)进行LM 检验:

第一步,做Y 关于常数项、lnX 1、lnX 2和lnX 3的回归并保存残差t

e ~; 第二步,做t e ~关于常数项、lnX 1、lnX 2和lnX 3和1~-t e 的回归并计算2

R ; 第三步,计算检验统计值(n-1)2R =21?0.996=20.916;

第四步,由于在不存在一阶序列相关的零假设下(n-1)2R 呈自由度为1的2

χ分布。在5%的显著性水平下,该分布的相应临界值为3.841。由于20.916>3.841,因此拒绝零假设,意味着原模型随机扰动项存在一阶序列相关。

例5.某地区供水部门利用最近15年的用水年度数据得出如下估计模型: rain price pcy pop house water 123.187.17005.0363.0305.09.326---++-=

(-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)

93.02=R 38.9

F = 式中,water —用水总量(百万立方米),house —住户总数(千户),pop ——总人口(千人),pcy —人均收入(元),price —价格(元/100立方米),rain —降雨量(毫米)。

(1)根据经济理论和直觉,请计回归系数的符号是什么(不包括常量),为什么?观察符号与你的直觉

相符吗?

(2)在10%的显著性水平下,请进行变量的t-检验与方程的F-检验。T 检验与F 检验结果有相矛盾的现象吗?

(3)你认为估计值是(1)有偏的;(2)无效的或(3)不一致的吗?详细阐述理由。

解答:(1)在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越高。所以可期望house 和pop 的符号为正;收入较高的个人可能用水较多,因此pcy 的预期符号为正,但它可能是不显著的。如果水价上涨,则用户会节约用水,所以可预期price 的系数为负。显然如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可以期望rain 的系数符号为负。从估计的模型看,除了pcy 之外,所有符号都与预期相符。

(2)t 统计量检验单个变量的显著性,F 统计值检验变量是否是联合显著的。

这里t 检验的自由度为15-5-1=9,在10%的显著性水平下的临界值为1.833。可见,所有参数估计值的t 值的绝对值都小于该值,所以即使在10%的水平下这些变量也不是显著的。

这里,F 统计值的分子自由度为5,分母自由度为9。10%显著性水平下F 分布的临界值为2.61。可见计算的F 值大于该临界值,表明回归系数是联合显著的。

T 检验与F 检验结果的矛盾可能是由于多重共线性造成的。house 、pop 、pcy 都是高度相关的,这将使它们的t-值降低且表现为不显著。price 和rain 不显著另有原因。根据经验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能够很好地被度量。可以预期水价与年降雨量在各年中一般没有太大的变化,所以它们的影响很难度量。

(3)多重共线性往往表现的是解释变量间的样本观察现象,在不存在完全共线性的情况下,近似共线并不意味着基本假定的任何改变,所以OLS 估计量的无偏性、一致性和有效性仍然成立,即仍是BLUE 估计量。但共线性往往导致参数估计值的方差大于不存在多重共线性的情况。

例6.一个对某地区大学生就业增长影响的简单模型可描述如下:

t t t t t gGDP gGDP gPOP gMIN gEMP μβββββ+++++=4132110

式中,为新就业的大学生人数,MIN1为该地区最低限度工资,POP 为新毕业的大学生人数,GDP1为该地区国内生产总值,GDP 为该国国内生产总值;g 表示年增长率。

(1)如果该地区政府以多多少少不易观测的却对新毕业大学生就业有影响的因素作为基础来选择最低限度工资,则OLS 估计将会存在什么问题?

(2)令MIN 为该国的最低限度工资,它与随机扰动项相关吗?

(3)按照法律,各地区最低限度工资不得低于国家最低工资,哪么gMIN 能成为gMIN1的工具变量吗?

解答:(1)由于地方政府往往是根据过去的经验、当前的经济状况以及期望的经济发展前景来定制地区最低限度工资水平的,而这些因素没有反映在上述模型中,而是被归结到了模型的随机扰动项中,因此 gMIN1 与μ不仅异期相关,而且往往是同期相关的,这将引起OLS 估计量的偏误,甚至当样本容量增大时也不具有一致性。

(2)全国最低限度的制定主要根据全国国整体的情况而定,因此gMIN 基本与上述模型的随机扰动项无关。

(3)由于地方政府在制定本地区最低工资水平时往往考虑全国的最低工资水平的要求,因此gMIN1与gMIN 具有较强的相关性。结合(2)知gMIN 可以作为gMIN1的工具变量使用。

相关文档
相关文档 最新文档