文档库 最新最全的文档下载
当前位置:文档库 › 计量经济面板数据模型及EVIEWs软件的实现

计量经济面板数据模型及EVIEWs软件的实现

面板数据模型的分析及Eviews实现

一、面板数据和模型概述

在经济学研究和实际应用中,我们经常需要同时分析和比较横截面观察值和时间序列观察值结合起来的数据,即:数据集中的变量同时含有横截面和时间序列的信息。这种数据被称为面板数据(panel data),它与我们以前分析过的纯粹的横截面数据和时间序列数据有着不同的特点。简单地讲,面板数据因同时含有时间序列数据和截面数据,所以其统计质既带有时间序列的性质,又包含一定的横截面特点。因而,以往采用的计量模型和估计方法就需要有所调整。

例1 表1中展示的数据就是一个面板数据的例子。

其他类似的例子还有:历次人口普查中有关不同年龄段的受教育状况;同行业不同公司在不同时间节点上的产值等。这里,不同的年龄段和公司代表不同的截面,而不同时间节点数据反映了数据的时间序列性。

研究和分析面板数据的模型被称为面板数据模型(panel data model)。它的变量取值都带有时间序列和横截面的两重性。一般的线性模型只单独处理横截面数据或时间序列数据,而不能同时分析和对比它们。面板数据模型,相对于一般的线性回归模型,其长处在于它既考虑到了横截面数据存在的共性,又能分析模型中横截面因素的个体特殊效应。当然,我们也可以将横截面数据简单地堆积起来用回归模型来处理,但这样做就丧失了分析个体特殊效应的机会。

二、一般面板数据模型介绍 符号介绍:it

y ——因变量在横截面i 和时间t 上的数值;

j it x ——第j 个解释变量在横截面i 和时间t 上的数值;

假设:有K 个解释变量,即K j ,,2,1 =;

有N 个横截面,即N i ,,2,1 =; 时间指标T t ,,2,1 =。

记第i 个横截面的数据为

??

??

?

??

??=iT i i i y y y y

21; ??

?????

??=K iT iT iT K

i i i K i i i i x x x x x x x x x X 21222121

2111;??

??

??

? ??=iT i i i μμμμ 21 其中对应的i μ是横截面i 和时间t 时随机误差项。再记

??????? ??=N y y y y 21; ??????? ??=N X X X X 21; ??????

? ??=N μμμμ 21; ???????

??=K ββββ 21 这样,y 是一个1??T N 的向量;X 是一个K T N ??的矩阵;而μ是一个1??T N 的向量。

针对这样的数据,有以下以矩阵形式表达的面板数据模型:

μβ+=X y (1) 方程(1)代表一个最基本的面板数据模型。基于对系数β和随机误差项μ的不同假设,从这个基本模型可以衍生出各种不同的面板数据模型。最简单的模型就是忽略数据中每个横截面个体所可能有的特殊效应,如假设),0(~2

σμiid ,而简单地将模型视为横截面数据堆积的模型。

但是由于面板数据中含有横截面数据,有时需要考虑个体可能存在的特殊效应及对模型估计方法的影响。例如在不同个体误差项存在不同分布的情况下,OLS 估计量虽然是一致的,但不再是有效估计量,因此往往需要采用GLS 。

一般为了分析每个个体的特殊效应,对随机误差项it μ的设定是

it i it εαμ+= (2)

其中i α代表个体的特殊效应,它反映了不同个体之间的差别。 最常见的两种面板数据模型是建立在i α的不同假设基础之上。一种假设假定i α是固定的常

数,这种模型被称为固定效应模型(fixed effect model ),另一种假设假定i α不是固定的,而是随机的,这种模型被称为随机效应模型(random effect model )。

三、检验的方法

Greene (1997)介绍了两种检验方法。一种是由Breush 和Pagan (1980)提出的拉格朗日检验法(LM test )。另一种是Hausman (1978)提出的Hausman 检验方法(Hausman test ),Hausman 检验量其实是一种Wald 检验法(Wald test )。这两种方法均可以用于验面板数据模型的设定应该是固定效应还是随机效应。

面板数据模型数据估计的Eviews 实现

1.LM test 的基本步骤:

第一,建立原假设和备择假设:

:)

;0],[(0:2

12

0≠≠==αασεεσH s t Cov H is it 或者 第二,检验统计量及其分布

)1(~1??)1(222

22

χμ

μ?????

?

????????-???

??-=∑∑∑∑i t it i t it T NT LM (34)

其中it μ

?为OLS 的误差项。 2. Hausman test

Hausman 检验的前提是如果模型包含随机效应,它应与解释变量相关。因此在原假设H 0:随机效应与解释变量不相关的假定下,内部估计量(对虚拟变量模型)和GLS 得出的估计量

均是一致的,但是内部估计量不是有效的;在备择假设H 1:随机效应与解释变量相关的假定下,GLS 不再是一致的,而内部估计量仍是一致的。因此在原假设下,w β?与GLS

β?之间的绝对值差距应该不大,而且应该随样本的增加而缩小,并渐进趋近于0。而在备择假设下,这一

点不成立。Hausman 利用这个统计特点建立了以下检验统计量: )??()??(1GLS

w GLS w W βββββ-∑'-=- (35) 注意:这里的β∑与前面提到的Σ有所不同,这里β∑表示β的两种估计量协方差矩阵之差(Hausman 的一个基本结论就是有效估计量和其与非有效估计量之差(即:)??(G LS w ββ-)的协方差等于0,所以GLS w GLS w βββββ?var ?var )??var(-=-=∑), 即:

GLS

w βββ?var ?var -=∑ (36) Hausman 统计量即Wald 统计量渐进服从自由度为K 的2

χ分布:

)(2K W d

χ?→? (37)

(1)建立合并数据库(pool)对象

首先建立工作文件。再打开工作文件的基础上,点击主功能菜单上Objects键,选NEW Object打开NEW Object对话框。

在Type of Object选择区选择Pool,单击OK,从而打开合并数据库窗口,在窗口输入不同省份标识,如下图:

(2)定义序列名并输入数据

在新建的合并数据库窗口的工具栏点击sheet键,打开Series List窗口,定义时间序列变量CONSUME?和INCOME?从而打开合并数据库窗口,输入数据。如下图:

(3)估计模型

在POOl窗口的工具栏中点击Estimate,打开Pooled Estimate窗口,如图.单机OK得到结果。

Dependent Variable: CONSUME?

Method: Pooled Least Squares

Date: 12/19/11 Time: 22:08

Dependent Variable: CONSUME?

Method: Pooled Least Squares

Date: 12/19/11 Time: 22:25

Sample: 1995 1999

Included observations: 5

Cross-sections included: 7

Total pool (balanced) observations: 35

Variable Coefficient Std. Error t-Statistic Prob.

C -2770.357 870.7418 -3.181606 0.0037

INCOME? 0.928671 0.054586 17.01307 0.0000

若单机VIEW下的representation得到回归的代数表达式:

Estimation Command:

=====================

LS(CX=F,B) CONSUME? INCOME?

Estimation Equations:

=====================

CONSUMESH = C(3) + C(1) + C(2)*INCOMESH CONSUMEJS = C(4) + C(1) + C(2)*INCOMEJS CONSUMEZJ = C(5) + C(1) + C(2)*INCOMEZJ

CONSUMEAH = C(6) + C(1) + C(2)*INCOMEAH

CONSUMEJX = C(7) + C(1) + C(2)*INCOMEJX

CONSUMEFJ = C(8) + C(1) + C(2)*INCOMEFJ

CONSUMESD = C(9) + C(1) + C(2)*INCOMESD

Substituted Coefficients:

=====================

CONSUMESH = -4080.545176 - 2770.356834 + 0.9286710261*INCOMESH CONSUMEJS = -652.7150962 - 2770.356834 + 0.9286710261*INCOMEJS CONSUMEZJ = -605.7216353 - 2770.356834 + 0.9286710261*INCOMEZJ CONSUMEAH = 1666.304521 - 2770.356834 + 0.9286710261*INCOMEAH CONSUMEJX = 1756.290577 - 2770.356834 + 0.9286710261*INCOMEJX CONSUMEFJ = 420.2914429 - 2770.356834 + 0.9286710261*INCOMEFJ CONSUMESD = 1496.095366 - 2770.356834 + 0.9286710261*INCOMESD

EVIEWS用面板数据模型预测

第8讲用面板数据模型预测 1.面板数据定义 时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到的数据;截面数据是变量在固定时点的一组数据。面板数据是同时在时间和截面上取得的二维数据。面板数据也可以定义为相同截面上的个体在不同时点的重复观测数据或者称为纵向变量序列(个体)的多次测量。所以,面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。 面板数据示意图见图1。面板数据从横截面(cross section)看,是由若干个体(entity, unit, individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列。 图1 N=15,T=50的面板数据示意图 图2是1978~2005年中国各省级地区消费性支出占可支配收入比率序列图。 图2 1978-2005年中国各省级地区消费性支出占可支配收入比率序列图(价格平减过)

面板数据用双下标变量表示。例如 y i t, i = 1, 2, …, N; t = 1, 2, …, T i对应面板数据中不同个体。N表示面板数据中含有N个个体。t对应面板数据中不同时点。T表示时间序列的最大长度。若固定t不变,y i ., ( i = 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据。 利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应回归模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。 例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。 对于面板数据y i t, i = 1, 2, …, N; t = 1, 2, …, T,如果每个个体在相同的时期内都有观测值记录,则称此面板数据为平衡面板数据(balanced panel data)。若面板数据中的个体在相同时期内缺失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。 案例1:1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)关系研究(file:5panel02) 1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)数据见file:panel02。数据是7年的,每一年都有15个数据,共105组观测值。 人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费面板数据按个体连线见图3,按截面连线见图4。人均收入面板数据按个体连线见图5,按截面连线见图6。 图3 15个省级地区的人均消费序列(个体)(file:5panel02)

面板数据的F检验固定效应检验

面板数据的F检验固定 效应检验 标准化工作室编码[XX968T-XX89628-XJ668-XT689N]

面板数据模型(P A N E L D A T A)F检验,固定效应检验1.面板数据定义。 时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 面板数据用双下标变量表示。例如 y , i= 1, 2, …, N; t= 1, 2, …, T i t N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y , ( i i . = 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t= 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 图1 N=7,T=50的面板数据示意图 例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。 对于面板数据y i t, i = 1, 2, …, N; t= 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。 注意:EViwes 、、既允许用平衡面板数据也允许用非平衡面板数据估计模型。

MATLAB空间面板数据模型操作介绍

MATLAB空间面板数据模型操作简介 MATLAB安装:在民主湖资源站上下载MA TLAB 2009a,或者2010a,按照其中的安装说明安装MATLAB。(MATLAB较大,占用内存较大,安装的话可能也要花费一定的时间) 一、数据布局: 首先我们说一下MA TLAB处理空间面板数据时,数据文件是怎么布局的,熟悉eviews的同学可能知道,eviews中面板数据布局是:一个省份所有年份的数据作为一个单元(纵截面:一个时间序列),然后再排放另一个省份所有年份的数据,依次将所有省份的数据排放完,如下图,红框中“1-94”“1-95”“1-96”“1-97”中,1是省份的代号,94,95,96,97表示年份,eviews是将每个省份的数据放在一起,再将所有省份堆放在一起。 与eviews不同,MATLAB处理空间面板数据时,面板数据的布局是(在excel中说明):先排放一个横截面上的数据(即某年所有省份的数据),再将不同年份的横截面按时间顺序堆放在一起。如图:

这里需要说明的是,MA TLAB中省份的序号需要与空间权重矩阵中省份一一对应,我们一般就采用《中国统计年鉴》分地区数据中省份的排列顺序。(二阶空间权重矩阵我会在附件中给出)。 二、数据的输入: MATLAB与excel链接:在excel中点击“工具→加载宏→浏览”,找到MA TLAB的安装目录,一般来说,如果安装时没有修改安装路径,此安装目录为:C:\Programfiles\MATLAB\R2009a\toolbox\exlink,点击excllink.xla即可完成excel与MATLAB的链接。这样的话excel中的数据就可以直接导入MATLAB中形成MATLAB的数据文件。操作完成后excel 的加载宏界面如图: 选中“Spreadsheet Link EX3.0.3 for use with MATLAB”即表示我们希望excel 与MATLAB实现链

计量经济学Eviews多重共线性实验报告

计量经济学E v i e w s多重共线性实验报告 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

实验报告课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期: 2014 年 05 月 11日 广东商学院教务处制 姓名实验报告成绩 评语: 指导教师(签名) 年月日 说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。

四、预备知识:最小二乘法估计的原理、t检验、F检验、2R值。 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据

资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。 为分析Y 与X1、X2、X3、X4、X5、X6、X7之间的关系,做如下折线图: 能源消费Y 在1986到1996年间缓慢增长,在96至98年有短暂的下跌,但是98至02年开始缓慢回升,02年到06年开始快速增长。 国民总收入X1和国内生产总值X2以相同的趋势逐年缓慢增长。 工业增加值X3在1985年-1999年期间一直是缓慢增长,但在2000年出现了急剧下降的现象,2001年又急剧增长,达到下降前的水平,2001年以后开始缓慢增长。建筑业增长值x4、交通运输邮电业增加值x5、人均生活电力消费x6、能源加工转换效率x7数值较低,但都以较平缓的方式增长。 2、设定并估计多元线性回归模型 t t t t t t t u X X X X X Y ++++++=66554433221ββββββ () 录入数据,得到图。 2.2.1)采用OLS 估计参数 在主界面命令框栏中输入 ls y c x1 x2 x3 x4 x5 x6 x7回车,即可得到参数的估计结果。 由此可见,该模型的可决系数为,修正的可决系数为,模型拟和很好,F 统计量为,回归方程整体上显着。 可是其中的lnX3、lnX4、lnX6对lnY 影响不显着,不仅如此,lnX2、lnX5的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。 3、多重共线性模型的识别

eviews面板数据实例分析

1、已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp,不变价格)与人均收入(ip,不变价格)居民,利用数据(1)建立面板数据(panel data)工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。 年人均消费(consume)与人均收入(income)数据以及消费者价格指数(p)分别见表9、1,9、2与9、3。 表9、1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据人均消费1996 1997 1998 1999 2000 2001 2002 CONSUMEAH 3607、43 3693、55 3777、41 3901、81 4232、98 4517、65 4736、52 CONSUMEBJ 5729、52 6531、81 6970、83 7498、48 8493、49 8922、72 10284、6 CONSUMEFJ 4248、47 4935、95 5181、45 5266、69 5638、74 6015、11 6631、68 CONSUMEHB 3424、35 4003、71 3834、43 4026、3 4348、47 4479、75 5069、28 CONSUMEHLJ 3110、92 3213、42 3303、15 3481、74 3824、44 4192、36 4462、08 CONSUMEJL 3037、32 3408、03 3449、74 3661、68 4020、87 4337、22 4973、88 CONSUMEJS 4057、5 4533、57 4889、43 5010、91 5323、18 5532、74 6042、6 CONSUMEJX 2942、11 3199、61 3266、81 3482、33 3623、56 3894、51 4549、32 CONSUMELN 3493、02 3719、91 3890、74 3989、93 4356、06 4654、42 5342、64 CONSUMENMG 2767、84 3032、3 3105、74 3468、99 3927、75 4195、62 4859、88 CONSUMESD 3770、99 4040、63 4143、96 4515、05 5022 5252、41 5596、32 CONSUMESH 6763、12 6819、94 6866、41 8247、69 8868、19 9336、1 10464 CONSUMESX 3035、59 3228、71 3267、7 3492、98 3941、87 4123、01 4710、96 CONSUMETJ 4679、61 5204、15 5471、01 5851、53 6121、04 6987、22 7191、96 CONSUMEZJ 5764、27 6170、14 6217、93 6521、54 7020、22 7952、39 8713、08 表9、2 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均收入(元)数据人均收入1996 1997 1998 1999 2000 2001 2002 INCOMEAH 4512、77 4599、27 4770、47 5064、6 5293、55 5668、8 6032、4 INCOMEBJ 7332、01 7813、16 8471、98 9182、76 10349、69 11577、78 12463、92 INCOMEFJ 5172、93 6143、64 6485、63 6859、81 7432、26 8313、08 9189、36 INCOMEHB 4442、81 4958、67 5084、64 5365、03 5661、16 5984、82 6679、68 INCOMEHLJ 3768、31 4090、72 4268、5 4595、14 4912、88 5425、87 6100、56 INCOMEJL 3805、53 4190、58 4206、64 4480、01 4810 5340、46 6260、16 INCOMEJS 5185、79 5765、2 6017、85 6538、2 6800、23 7375、1 8177、64 INCOMEJX 3780、2 4071、32 4251、42 4720、58 5103、58 5506、02 6335、64 INCOMELN 4207、23 4518、1 4617、24 4898、61 5357、79 5797、01 6524、52 INCOMENMG 3431、81 3944、67 4353、02 4770、53 5129、05 5535、89 6051 INCOMESD 4890、28 5190、79 5380、08 5808、96 6489、97 7101、08 7614、36 INCOMESH 8178、48 8438、89 8773、1 10931、64 11718、01 12883、46 13249、8 INCOMESX 3702、69 3989、92 4098、73 4342、61 4724、11 5391、05 6234、36 INCOMETJ 5967、71 6608、39 7110、54 7649、83 8140、5 8958、7 9337、56 INCOMEZJ 6955、79 7358、72 7836、76 8427、95 9279、16 10464、67 11715、6 表9、3 1996—2002年中国东北、华北、华东15个省级地区的消费者物价指数物价指数1996 1997 1998 1999 2000 2001 2002 PAH 109、9 101、3 100 97、8 100、7 100、5 99

计量经济学eviews实验报告

大连海事大学 实验报告 实验名称:计量经济学软件应用 专业班级:财务管理2013-1 姓名:安妮 指导教师:赵冰茹 交通运输管理学院 二○一六年十一月 一、实验目标 学会常用经济计量软件的基本功能,并将其应用在一元线性回归模型的分析中。具体包括:Eview的安装,样本数据基本统计量计算,一元线性回归模型的建立、检验及结果输出与分析,多元回归模型的建立与分析,异方差、序列相关模型的检验与处理等。二、实验环境 WINDOWSXP或2000操作系统下,基于EVIEWS5.1平台。 三、实验模型建立与分析 案例1:

我国1995-2014年的人均国民生产总值和居民消费支出的统计资料(此资料来自中华人民共和国统计局网站)如表1所示,做回归分析。 表1我国1995-2014年人均国民生产总值与居民消费水平情况

(1)做出散点图,建立居民消费水平随人均国内生产总值变化的一元线性回归方程,并解释斜率的经济意义; 利用eviews软件输出结果报告如下: Dependent Variable: CONSUMPTION Method: Least Squares Date: 06/11/16 Time: 19:02 Sample: 1995 2014 Included observations: 20

Variable Coeffici ent Std. Error t-Statisti c Prob.?? C691.0225113.3920 6.0941040.0000 AVGDP0.3527700.00490871.880540.0000 R-squared0.996528????Mean dependent var7351.300 Adjusted R-squared0.996335????S.D. dependent var4828.765 S.E. of regression292.3118????Akaike info criterion14.28816 Sum squared resid1538032.????Schwarz criterion14.38773 Log likelihood -140.881 6 ????Hannan-Quinn criter.14.30760 F-statistic5166.811????Durbin-Watson stat0.403709 Prob(F-statistic)0.000000 由上表可知财政收入随国内生产总值变化的一元线性回归方程为:

计量经济学面板数据模型讲义(4-7)

面板数据模型 1.面板数据定义。 时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 面板数据用双下标变量表示。例如 y i t, i= 1, 2, …, N; t = 1, 2, …, T N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y i ., ( i= 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 图1 N=7,T=50的面板数据示意图 例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。 对于面板数据y i t, i= 1, 2, …, N; t = 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。 注意:EViwes 3.1、4.1、5.0既允许用平衡面板数据也允许用非平衡面板数据估计模型。 例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。数据是7年的,每一年都有15个数据,共105组观测值。 人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费和收入的

面板数据的计量方法

1.什么是面板数据? 面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是截面数据与时间序列综合起来的一种数据资源,是同时在时间和截面空间上取得的二维数据。 如:城市名:北京、上海、重庆、天津的GDP分别为10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。如:2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。 如:2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为: 北京市分别为8、9、10、11、12; 上海市分别为9、10、11、12、13; 天津市分别为5、6、7、8、9; 重庆市分别为7、8、9、10、11(单位亿元)。 这就是面板数据。 2.面板数据的计量方法 利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。例如1990-2000 年30 个省份的农业总产值数据。固定在某一年份上,它是由30 个农业总产值数字组成的截面数据;固定在某一省份上,它是由11 年农业总产值数据组成的一个时间序列。面板数据由30 个个体组成。共有330 个观测值。 面板数据模型的选择通常有三种形式:混合估计模型、固定效应模型和随机效应模型 第一种是混合估计模型(Pooled Regression Model)。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。 第二种是固定效应模型(Fixed Effects Regression Model)。在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixed effects regression model)。 固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model)、时刻固定效应模型(time fixed effects regression model)和时刻个体固定效应模型(time and entity fixed effects regression model)。(1)个体固定效应模型。 个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体固定效应模型。注意:个体固定效应模型的EViwes输出结果中没有公共截距项。 (2)时刻固定效应模型。 时刻固定效应模型就是对于不同的截面(时刻点)有不同截距的模型。如果确知

Eviews面板大数据之固定效应模型

Eviews 面板数据之固定效应模型 在面板数据线性回归模型中,如果对于不同的截面或不同的时间序列,只是模型的截距项是不同的,而模型的斜率系数是相同的,则称此模型为固定效应模型。固定效应模型分为三类: 1.个体固定效应模型 个体固定效应模型是对于不同的纵剖面时间序列(个体)只有截距项不同的模型: 2 K it i k kit it k y x u λβ==++∑ (1) 从时间和个体上看,面板数据回归模型的解释变量对被解释变量的边际影响均是相同的,而且除模型的解释变量之外,影响被解释变量的其他所有(未包括在回归模型或不可观测的)确定性变量的效应只是随个体变化而不随时间变化时。 检验:采用无约束模型和有约束模型的回归残差平方和之比构造F 统计量,以检验设定个体固定效应模型的合理性。F 模型的零假设: 01231:0N H λλλλ-===???== ()1 (1,(1)1)(1) RRSS URSS N F F N N T K URSS NT N K --= ---+--+ RRSS 是有约束模型(即混合数据回归模型)的残差平方和,URSS 是无约束模型ANCOVA 估计的残差平方和或者LSDV 估计的残差平方和。 实践: 一、数据:已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp ,不变价格)和人均收入(ip ,不变价格)居民,利用数据(1)建立面板数据(panel data )工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。年人均消费(consume )和人均收入(income )数据以及消费者价格指数(p )分别见表1,2和3。 表1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据

一分钟看懂计量经济学

一分钟看完计量经济学!!!------开学后的计量笔记 建模是计量的灵魂,所以就从建模开始。 一、 建模步骤:A,理论模型的设计: a,选择变量b,确定变量关系c,拟定参数范围 B,样本数据的收集: a,数据的类型b,数据的质量 C,样本参数的估计: a,模型的识别b,估价方法选择 D,模型的检验 a,经济意义的检验1正相关 2反相关等等 b,统计检验:1检验样本回归函数和样本的拟合优度,R的平方即其修正检验 2样本回归函数和总体回归函数的接近程度:单个解释变量显著性即t检验,函数显著性即F检验,接近程度的区间检验 c,模型预测检验1解释变量条件条件均值与个值的预测

2预测置信空间变化 d,参数的线性约束检验:1参数线性约束的检验 2模型增加或减少变量的检验 3参数的稳定性检验:邹氏参数稳定性检验,邹氏预测检验----------主要方法是以 F检验受约束前后模型的差异 e,参数的非线性约束检验:1最大似然比检验 2沃尔德检验 3拉格朗日乘数检验---------主要方法使用 X平方分布检验统计量分布特征 f,计量经济学检验 1,异方差性问题:特征:无偏,一致但标准差偏误。检测方法:图示法,Park与Gleiser检验法,Goldfeld-Quandt检验法,White检验法-------用WLS修正异方差 2,序列相关性问题:特征:无偏,一致,但检验不可靠,预测无效。检测方法:图示法,回归检验法,Durbin-Waston检验法,Lagrange乘子检验法-------用GLS或广义差分法修正序列相关性 3,多重共线性问题:特征:无偏,一致但标准差过大,t减小,正负号混乱。检测方法:先检验 多重共线性是否存在,再检验多重共线性的范围-------------用逐步回归法,差分法或使用额外信息,增大样本容量可以修正。

计量经济学eviews应用习题

(单位:亿元) 年份 国民总收 入X 最终消费 年份 国民总收入 最终消费 Y X Y 1978 3645.217 2239.1 1993 35260.02 21899.9 1979 4062.579 2633.7 1994 48108.46 29242.2 1980 4545.624 3007.9 1995 59810.53 36748.2 1981 4889.461 3361.5 1996 70142.49 43919.5 1982 5330.451 3714.8 1997 78060.83 48140.6 1983 5985.552 4126.4 1998 83024.28 51588.2 1984 7243.752 4846.3 1999 88479.15 55636.9 1985 9040.737 5986.3 2000 98000.45 61516 1986 10274.38 6821.8 2001 108068.2 66878.3 1987 12050.62 7804.6 2002 119095.7 71691.2 1988 15036.82 9839.5 2003 135174 77449.5 1989 17000.92 11164.2 2004 159586.7 87032.9 1990 18718.32 12090.5 2005 184088.6 97822.7 1991 21826.2 14091.9 2006 213131.7 110595.3 1992 26937.28 17203.3 2007 251483.2 128444.6 (1)以分析国民总收入对消费的推动作用为目的,建立线性回归方案,并估计其参数。 根据散点图可以建立如下简单线性回归模型: t Y =1β+t X 2β+t u 利用EViews 可得回归结果:

EViews面板数据模型估计教程

EViews 6.0 beta在面板数据模型估计中的应用 来自免费的minixi 1、进入工作目录cd d:\nklx3,在指定的路径下工作是一个良好的习惯 2、建立面板数据工作文件workfile (1)最好不要选择EViews默认的blanaced panel 类型 Moren_panel (2)按照要求建立简单的满足时期周期和长度要求的时期型工作文件

3、建立pool对象 (1)新建对象 (2)选择新建对象类型并命名 (3)为新建pool对象设置截面单元的表示名称,在此提示下(Cross Section Identifiers: (Enter identifiers below this line )输入截面单元名称。,建议采用汉语拼音,例如29个省市区的汉语拼音,建议在拼音名前加一个下划线“_”,如图

关闭建立的pool对象,它就出现在当前工作文件中。 4、在pool对象中建立面板数据序列 双击pool对象,打开pool对象窗口,在菜单view的下拉项中选择spreedsheet (展开表) 在打开的序列列表窗口中输入你要建立的序列名称,如果是面板数据序列必须在序列名后添加“?”。例如,输入GDP?,在GDP后的?的作用是各个截面单元的占位符,生成了29个省市区的GDP的序列名,即GDP后接截面单元名,再在接时期,就表示出面板数据的3维数据结构(1变量2截面单元3时期)了。

请看工作文件窗口中的序列名。展开表(类似excel)中等待你输入、贴入数据。 (1)打开编辑(edit)窗口

(2)贴入数据 (3)关闭pool窗口,赶快存盘见好就收6、在pool窗口对各个序列进行单位根检验 选择单位根检验 设置单位根检验

面板数据的计量方法

面板数据的计量方法 1.什么是面板数据? 面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是截面数据与时间序列综合起来的一种数据资源,是同时在时间和截面空间上取得的二维数据。 如:城市名:北京、上海、重庆、天津的GDP分别为10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。如:2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。 如:2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为: 北京市分别为8、9、10、11、12; 上海市分别为9、10、11、12、13; 天津市分别为5、6、7、8、9; 重庆市分别为7、8、9、10、11(单位亿元)。 这就是面板数据。 2.面板数据的计量方法 利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。例如1990-2000 年30 个省份的农业总产值数据。固定在某一年份上,它是由30 个农业总产值数字组成的截面数据;固定在某一省份上,它是由11 年农业总产值数据组成的一个时间序列。面板数据由30 个个体组成。共有330 个观测值。 面板数据模型的选择通常有三种形式:混合估计模型、固定效应模型和随机效应模型 第一种是混合估计模型(Pooled Regression Model)。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。 第二种是固定效应模型(Fixed Effects Regression Model)。在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixed effects regression model)。 固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model)、时刻固定效应模型(time fixed effects regression model)和时刻个体固定效应模型(time and entity fixed effects regression model)。(1)个体固定效应模型。 个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体固定效应模型。注意:个体固定效应模型的EViwes输

(完整word版)计量经济学EVIEWS软件学习

实验一Eviews的基本操作与一元线性回归模型的最小二乘估计实验目的: 1、熟悉Eviews的窗口与界面 2、掌握Eviews的命令与菜单的操作 3、掌握用Eviews估计与检验一元线性回归模型 实验内容: 1、启动Eviews 双击Eviews图标,出现Eviews窗口,它由以下部分组成:标题栏“Eviews”、主菜单“File,Edit,…,Help”、命令窗口(空白处)和工作区域。 命令窗口 工作区域 图1-1 2、产生文件 Eviews的操作在工作文件中进行,故首先要有工作文件,然后进行数据输入、分析等等操作。 (1)读已存在文件:File→Open→Workfile。 (2)新建文件:File→New→Workfile,出现对话框“工作文件范围”,选取或填上数据类型、起止时间。OK后,得到一个无名字的工作文件,其中有:时间范围、当前工作文件样本范围、filter 、默认方程、系数向量C、序列RESID。 在主菜单上依次点击File/New/Workfile,即选择新建对象的类型为工作文件,将弹出一个对话框(如图所示),由用户选择数据的时间频率(frequency)、

起始期和终止期。 图1-2工作文件对话框 其中, Annual——年度 Monthly——月度 Semi-annual——半年 Weekly——周 Quarterly——季度 Daily——日 Undated or irregular——非时序数据 选择时间频率为Annual(年度),再分别点击起始期栏(Start date)和终止期栏(End date),输入相应的日前1985和1998。然后点击OK按钮,将在EViews 软件的主显示窗口显示相应的工作文件窗口(如图所示)。 图1-3工作文件窗口 工作文件窗口是EViews的子窗口,工作文件一开始其中就包含了两个对象,一个是系数向量C(保存估计系数用),另一个是残差序列RESID(实际值与拟合值之差)。 (3)命令方式新建文件 在EViews软件的命令窗口中直接键入CREATE命令,也可以建立工作文件。

EViews6.0在面板数据模型估计中的操作

EViews 6.0在面板数据模型估计中的实验操作 1、进入工作目录cd d:\nklx3,在指定的路径下工作是一个良好的习惯 2、建立面板数据工作文件workfile (1)最好不要选择EViews默认的blanaced panel 类型 Moren_panel (2)按照要求建立简单的满足时期周期和长度要求的时期型工作文件

3、建立pool对象 (1)新建对象 (2)选择新建对象类型并命名 (3)为新建pool对象设置截面单元的表示名称,在此提示下(Cross Section Identifiers: (Enter identifiers below this line )输入截面单元名称。建议采用汉语拼音,例如29个省市区的汉语拼音,建议在拼音名前加一个下划线“_”,如图

关闭建立的pool对象,它就出现在当前工作文件中。 4、在pool对象中建立面板数据序列 双击pool对象,打开pool对象窗口,在菜单view的下拉项中选择spreedsheet (展开表) 在打开的序列列表窗口中输入你要建立的序列名称,如果是面板数据序列必须在序列名后添加“?”。例如,输入GDP?,在GDP后的?的作用是各个截面单元的占位符,生成了29个省市区的GDP的序列名,即GDP后接截面单元名,再在接时期,就表示出面板数据的3维数据结构(1变量2截面单元3时期)了。

请看工作文件窗口中的序列名。展开表(类似excel)中等待你输入、贴入数据。 (1)打开编辑(edit)窗口

(2)贴入数据 (3)关闭pool窗口,赶快存盘见好就收6、在pool窗口对各个序列进行单位根检验 选择单位根检验 设置单位根检验

六步学会用做空间计量回归详细步骤

与MATLAB链接: Excel: 选项——加载项——COM加载项——转到——没有勾选项 2. MATLAB安装目录中寻找toolbox——exlink——点击,启用宏 E:\MATLAB\toolbox\exlink 然后,Excel中就出现MATLAB工具

(注意Excel中的数据:) 3.启动matlab (1)点击start MATLAB (2)senddata to matlab ,并对变量矩阵变量进行命名(注意:选取变量为数值,不包括各变量)

(data表中数据进行命名) (空间权重进行命名) (3)导入MATLAB中的两个矩阵变量就可以看见

4.将elhorst和jplv7两个程序文件夹复制到MATLAB安装目录的toolbox文件夹 5.设置路径:

6.输入程序,得出结果 T=30; N=46; W=normw(W1); y=A(:,3);

x=A(:,[4,6]); xconstant=ones(N*T,1); [nobs K]=size(x); results=ols(y,[xconstant x]); vnames=strvcat('logcit','intercept','logp','logy'); prt_reg(results,vnames,1); sige=*((nobs-K)/nobs); loglikols=-nobs/2*log(2*pi*sige)-1/(2*sige)*'* % The (robust)LM tests developed by Elhorst LMsarsem_panel(results,W,y,[xconstant x]); % (Robust) LM tests 解释 每一行分别表示:

计量经济学eviews软件案例分析

计量经济学课程案例分析论文 本小组案例:影响税收收入的因素 摘要:我国经济增长与税收增长之间是正相关的,经济增长是税收增长的源泉,而税收又是国家财政收入的主要来源,国家把税收收入用于经济建设,发展科学、教育、文化、卫生等事业,反过来又促进经济的进一步增长。 关键字:税收国内生产总值财政支出商品零售价格指数 一、引言:改革开放以来,随着经济体制的改革的深化和经济的快速增长,中国的财政收支状况发生很大的变化,为了研究中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济学模型。 二、经济理论分析:影响中国税收收入增长的主要因素可能有: 【1】从宏观经济上看经济增长是税收增长的基本源泉 【2】社会经济的发展和社会保障等对公共财政提出要求,公共财政的需求可能对当年的税收入可能会有一定的影响。 【3】物价水平。中国的税制结构以“流转税”为主,以现行价格计算的GDP和经营者的收入水平都与物价水平有关。 【4】税收政策因素 三、建立模型:以各项税收收入Y作为解释变量 以GDP表示经济增长水平 以财政支出表示公共财政的需求 以商品零售价格指数表示物价水平 税收政策因素较难用数量表示,暂时不予考虑 模型设定为Y=β1X1+β2X3+β3X3+C 其中:Y—各项税收收入(亿元)

X1—国内生产总值(亿元) X2—财政支出(亿元) X3—商品零售价格指数(%) 四、数据收集: 年份x1 x2 x3 y 1978 3645.20 1122.09 100.70 519.28 1979 4062.60 1281.79 102.00 537.82 1980 4545.60 1228.83 106.00 571.70 1981 4891.60 1138.41 102.40 629.89 1982 5323.40 1229.98 101.90 700.02 1983 5962.70 1409.53 101.50 775.59 1984 7208.10 1701.02 102.80 947.35 1985 9016.00 2004.25 108.80 2040.79 1986 10275.20 2204.91 106.00 2090.73 1987 12058.60 2262.18 107.30 2140.36 1988 15042.80 2491.21 118.50 2390.47 1989 16992.30 2823.78 117.80 2727.40 1990 18667.80 3083.59 102.10 2821.86 1991 21781.50 3386.62 102.90 2990.17 1992 26923.50 3742.20 105.40 3296.91 1993 35333.90 4642.30 113.20 4255.30 1994 48197.90 5792.62 121.70 5126.88 1995 60793.70 6823.72 114.80 6038.04 1996 71176.60 7937.55 106.10 6909.82 1997 78973.00 9233.56 100.80 8234.04 1998 84402.30 10798.18 97.40 9262.80 1999 89677.10 13187.67 97.00 10682.58 2000 99214.60 15886.50 98.50 12581.51 2001 109655.20 18902.58 99.20 15301.38 2002 120332.70 22053.15 99.70 17636.45 2003 135822.80 24649.95 99.90 20017.31 2004 159878.30 28486.89 102.80 24165.68 2005 184937.40 33930.28 100.80 28778.54 2006 216314.40 40422.73 101.00 34809.72 2007 265810.30 49781.35 103.80 45621.97 2008 314045.40 62592.66 105.90 54223.79 2009 340902.80 76299.90 98.80 59521.59 2010 401202.00 89874.16 103.10 73210.79 回归分析: 相关分析

相关文档
相关文档 最新文档