当前位置：文档库 › 关于多元线性回归的毕业论文

关于多元线性回归的毕业论文

摘要

许多现象往往不是简单的与某一因素有关而是要受多个因素的影响，此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化，这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时，所进行的回归分析就是多元性回归。

本文的研究主要从四个部分来进行。第一章从基础内容和研究对象着手，对主要研究内容进行了简单的阐述。第二章对多元线性回归的基础进行了详细分析。第三章介绍了中国经济的现状。最后通过多元线性回归模型对我国工业生产总值进行了分析。

总的来说，本文在2007年全国各省市主要工业产品的产量与工业总产值的具体数据下，选用塑料、水泥、钢筋、平板玻璃、粗钢、盘条以及原煤等工业产品的产量作为研究对象，建立多元线性回归模型，并对模型做出参数估计.在此基础上对模型做出一定的解释，对于预测工业总产值具有一定的理论指导和现实意义。

关键词：多元线性回归模型工业生产总值假设检验预测

Abstract

Many phenomena are often not simply associated with a number of factors but with varieties. At this point we need to use two or more factors as independent variables to explain changes in the dependent variable. This is also known as multiple regression. When more than one independent variable and the dependent variable are linear relationship, the regression analysis is carried out by diversity regression.

The main research work of this thesis is divided into four parts. In the first chapter, the thesis proceed from the basic content and object of study and elaborate main content simply. In the second chapter, multiple linear regression model is analyzed detail. In the third chapter, the thesis introduces status quo of china. And at last, gross industrial production is analyzed by multiple linear regression model in this article.

Over all, this article use the specific data of the output of major industrial products and industrial output in nationwide provinces in 2007, and select the output of plastics, cement, steel, plate glass, crude steel, wire rod and raw coal as study object to establish multiple linear regression model, and then make the model parameter estimation. Based on this，we make some explanations to the model. All of these are of momentous current significance and far-reaching historical significance to the forecast of industrial production.

Key Words: Multiple linear regression model Gross industrial production Hypothetical test Prediction

摘要 (1)

Abstract (2)

1 绪论 (4)

2 多元线性回归分析基础 (5)

2.1 多元线性回归定义 (5)

2.2多元线性回归模型 (6)

2.2.1模型的建立及矩阵表示 (6)

2.2.2模型的假设 (7)

2.3 多元线性回归参数估计 (7)

2.3.1 最小二乘估计和正规方程组 (7)

2.3.2 最小二乘估计的矩阵形式 (8)

2.4 回归拟合度评价和决定系数 (9)

2.4.1 离差分解和决定系数 (9)

2.4.2 决定系数的性质及修正可决系数 (10)

2.5 统计检验 (11)

2.5.1回归参数的显著性检验（t检验） (11)

2.5.2回归方程的显著性检验（F检验） (12)

2.5.3 多重共线性检验 (12)

2.5.4 异方差检验 (13)

3 中国经济现状 (15)

3.1中国经济现状 (15)

3.2 工业生产总值的概述 (15)

4 工业生产总值的多因素模型分析 (15)

4.1建立多因素分析模型 (16)

4.2数据收集 (16)

4.3 统计检验 (19)

4.4 计量经济学检验及模型修正 (20)

4.4.1 异方差检验 (21)

4.4.2 自相关检验 (21)

5 结论 (26)

致谢 (27)

参考文献 (28)

1绪论

在各个方面，变量之间的关系一般来说可分为确定性的与非确定性的两种。确定性关系是指变量之间的关系可以用函数关系来表达的。另一种非确定性的即所谓的相关关系。例如人的身高与体重之间存在着关系，一般来说，人高一些，体重也要重一些，但同样高度的人，体重往往不相同。人的血压与年龄之间也存在着关系，但同年龄的人的血压往往不相同。气象中的温度与湿度之间的关系也是这样的。这是因为我们涉及的变量（如体重、血压、适度）是随机变量，上面所说的变量关系是非确定性的。此时，便可以用到回归分析。回归分析能帮助我们从一个变量取得的值去估计另一个变量所取的值。

工业生产总值从数值上反应一个地区的工业生产规模，是衡量一个地区的经济繁荣程度的重要指标。研究研究工业总产值与格工业产出指标之间的关系具有非常重要的现实意义，对于做好一个地区的的工业产值预测以及制定国民经济发展规划都有的非常重要的作用。

工业总产值是指以货币表现的工业企业在一定时期内生产的已出售或可供出售的工业的产品的总量。它是反映一定时间内工业生产总规模和，总水平的重要指标，是计算工业生产发展速度和主要比例关系，计算工业产品销售率和其他经济指标的重要依据。工业总产值包括成品价值、工业性作业价值和自制半成品、在产品期末期初差额价值。工业，总产值采用“工厂法”计算，即以工业企业作为一个整体，按企业工业生产活动的最终成果来计算。但各企业之间、行业之间、地区之间存在着重复计算。其计算公式为：报告期工业总产值=报告期全部产品的成品价值+报告期工业性作业价值+（报告期自制半成品和在产品期末余额- 报告期自制半成品和在产品期初余额）计算工业总产值采用的价格有不变价格和现行价格。

即，工业生产总值收多个因素影响，此时便需要多个影响因素来分析工业生产总值的变化。而这些变量之间的关系是线性的，这样在分析工业生产总值是用到的回归分析方法便是多元线性回归。

2 多元线性回归分析基础

2.1多元线性回归定义

在客观世界中普遍存在着变量之间的关系。变量之间的关系一般来说可分为确定性的与非确定性的两种。确定性关系是指变量之间的关系可以用函数关系来表达的。另一种非确定性的即所谓的相关关系。例如人的身高与体重之间存在着关系，一般来说，人高一些，体重也要重一些，但同样高度的人，体重往往不相同。人的血压与年龄之间也存在着关系，但同年龄的人的血压往往不相同。气象中的温度与湿度之间的关系也是这样的。这是因为我们涉及的变量（如体重、血压、适度）是随机变量，上面所说的变量关系是非确定性的。此时，便可以用到回归分析。回归分析能帮助我们从一个变量取得的值去估计另一个变量所取的值。

在回归分析中，如果有两个或两个以上的自变量，就称为多元回归。事实上，一种现象常常是与多个因素相联系的，由多个自变量的最优组合共同来预测或估计因变量，比只用一个自变量进行预测或估计更有效，更符合实际。因此多元线性回归比一元线性回归的实用意义更大。

在研究问题是，我们考虑一个变量受其他变量的影响时，把这变量称为因变量，记为Y ，其他变量称为自变量，记为X ，这时相关系数可记作

(),ε+=x f Y 其中()x f 为当x X =时，因变量Y 的均值，即

()()x X Y E x f ==|.

称()x f 为Y 对X 的回归函数，ε为Y 与()x f 的偏差，它是随机变量，并假定()0=εE 。回归函数可以是一元函数，也可以是多元函数，即

,),,,(21ε+=m x x x f Y

其中 ),,,|(),,,(221121m m m x X x X x X Y E x x x f ==== 为m 元回归函数，统称为多元回归函数。

2.2多元线性回归模型

2.2.1 模型的建立及矩阵表示多元线性回归模型的一般形式是：

01122334455

Y Z Z Z Z Z ββββββε=++++++ (2.1)

其中j 1,2,...,j k β=（）是回归系数，Y 是被解释变量，i z 1,2i z ，ki z 是k 个对Y 有显著影响的解释变量（k ≥2），i ε是反映各种误差扰动综合影响的随机项，下标i 表示第

i 期观察值（i Y ,i z 1, i z 2,ki z ）, n i ,2,1=。

假设多元样本回归函数为：01122i i i

k ki Y z z z ββββ∧

∧

∧=++回归残差为：∧

-=i i i Y Y ε。

由于有n 期的观察值，这一模型实际上包含n 个方程

1111111101εββββ+++++=k k z z z Y

2222212102εββββ+++++=k k z z z Y

n kn k n n z z z Y εββββ+++++= 221102

写成矩阵形式：

,εβ+=Z Y (2.2) 其中

, z z z z z 1 z z 1 z z 1,kn k2k12n 1n 2212211121??

????? ??=?

?????

? ??=

Z Y Y Y Y n . , , n 10k 10k 10???????

??=?

????

? ??=??????? ??=∧∧∧∧εεεββββββββε

2.2.2 模型的假设

因为多元线性模型的建立或选择过程包含相当的主观性，所依据的理论和经验也可能不正确，因此并不能保证模型符合变量的实际关系。而如果模型本身有问题，那么分析的有效性和价值就很难有保证，为了保证所分析的变量关系符合多元线性回归分析的基本规定性，明确分析对象，保证回归分析的有效性和性质，也为了检验判断的依据，需要对多元线性回归模型作一些架设，共包括下列六条： (1)变量i Y 和i X 1, i X 2,i X k ,(i =1,2...n)之间，存在线性随机函数关系i i i 22i 110i εββββ+++++=k k X X X Y ，其中i ε是随机误差项。 (2)对应每组观测数据的误差项i ε，都为零均值的随机变量，即i ε的数学期望E(i ε)=0对i =1,2...n 都成立。

(3)误差项i ε的方差为常数，即[]22

)()()(σεεεε==-=i i i i E E E Var 对i =1,2...n 都

成立（假设（2）成立为前提）。

（4）对应不同观测数据的误差项不相关，即

[]

)0())())((()(==--=j i j j i i j i E E E E ,Cov εεεεεεεε对任意的j i ≠ 都成立（假设（1）成立为前提）。

（5）解释变量),,1(r i X i =是确定性变量而非随机变量。当存在多个解释变量（r>1）时假设不同解释变量之间不存在线性关系，包括严格的线性关系和强的近似线性关系。（6）误差项i ε服从正态分布[7]。

2.3 多元线性回归参数估计

2.3.1 最小二乘估计和正规方程组

这里直接根据回归残差平方和最小的准则，推导多元线性回归模型参数的最小二乘估计量。对于多元线性回归模型εβββ++++=k k 110z z Y ，

如果用0b ，…，k b 分别表示模型参数0β，…,k β的估计，那么样本回归方程就是

k k 110z b z b b Y +++=∧

回归残差平方和为：

∑∑+++==i

ki k i i z b z b b Y V 2110i 2

i )](-[ ε (2.3) 当V 对0b ，…，k b 的一阶偏导数都等于0，即下列方程组： ,0)](-1)(-2[110=+++∑i

ki k i i z b z b b Y

0))](-(-2[1110=+++∑i

i ki k i i z z b z b b Y ，

0))](-(-2[110=+++∑i

ki ki k i i z z b z b b Y ，

同时成立时,V 有最小值。对这个方程组整理，可得到如下的正规方程组：

, )(- 110k k z b z b Y b ++=

,101212111S b S b S b S K K =+++

,102211K K KK K K S b S b S b S =+++

其中

K ,k,i Y Y z z S i i

k ki k 1),-( )-(0==∑，

.1),-( )-(K ,k,j z z z z S j ji i

k ki kj ==∑

上述正规方程组有K+1个方程，未知数也是K+1个。只要系数矩阵非奇异即满足

解释变量矩阵Z 列满秩：k Z R =)(。此时，有k Z)R(Z ='，Z Z '可逆。可以解出0b ，…，

k b 的唯一的一组解，就是0β，…，k β的最小二乘估计[8]。

2.3.2 最小二乘估计的矩阵形式

引进参数估计量，解释变量回归值和回归残差的下列向量表示：

?????

???????=K b b b B 10， ??????????=n Y Y Y ???1 ，. n 1????? ??=εεε (2.4) 把样本数据分别带入样本回归方程，得到回归方程组为：

k1k 11101z b z b b Y +++=∧

, (2.5)

kn k 1n 10n z b z b b Y +++=∧

写成等价的向量方程，则为：.ZB Y =∧

这样回归残差向量为：.--XB Y Y Y ==∧

在利用向量，矩阵的运算法则，可以得到残差平方和为

)()(''2XB Y XB Y V i

--===∑εεε=.--XB X B XB Y Y X B Y Y ''''''+

求V 对0b ，…，k b 的偏导数，等价于V 对向量B 求梯度，因此最小二乘估计的正规方程

组为：,022''0=+-=?????

?????????????=?ZB Z Z b V b V BV n 整理得到矩阵形式：.'ZY ZB Z =

当X X '可逆，也就是X 是满秩矩阵，在上述向量方程两端左乘X X '的逆矩阵，得到：

,1Y Z Z Z B '-')(= (2.6)

这就是多元线性回归模型最小二乘估计的矩阵一般形式。

2.3.3 最小二乘估计量的性质

(1)线性性：

多元线性回归模型参数的最小二乘估计向量为：Y Z Z)(Z B '-1'=，各个参数的最小二乘估计向量为Y k z -z 'z b k 1'1)(+??????=，其中的11)(+???

???k 'z -z 'z 是矩阵'z 1-z)'(z 的k +1行元素构成的行向量，上式对k =1，…，K 都成立，k b 正是被解释变量观测值i Y 的线性组合，也就是多元线性回归参数的最小二乘估计是线性估计。 (2)无偏性：

多元线性回归的最小二乘估计也是无偏估计，即参数最小二乘估计量的数学期望都

等于相应参数的真实值，最小二乘估计向量的数学期望等于参数真实值的向量，参数真

实值是参数估计量的概率分布中心。

[][

]

)()(）(E(B)'-1-1εβ+=X X Z Z E Y Z Z Z E '''＝

[][

]

)()()()

(E '-1'-1

εβεβE Z Z Z E X X Z Z ''

++=＝

.)()('1βεβ=+=-E Z Z Z '

(3)最小方差性：

根据最小二乘估计公式和模型假设，可以直接导出包含各个参数估计量方差和不同

参数估计量协方差的，参数估计向量B 的协方差矩阵为：

()()]Var[［Var )Var(11)('-'

'-'εβ+==Z Z Z Z Y Z Z Z B ］ ()

()

]Var[]Var[εεβ'

-1

''-1

'Z Z Z Z Z Z =+=

()

]［I ]][Var[12111'-'

'-''-''-'Z Z Z Z Z Z Z Z Z Z Z Z σε== ()2

'σ

-=z z (2.7)

2.4 回归拟合度评价和决定系数

2.4.1 离差分解和决定系数

判断回归结果好坏基本标准，是回归直线对样本数据的逆合程度，称为“拟合度”。

回归直线的逆合度一方面取决于回归直线的选择，这就是由参数估计方法决定的，另一方面则取决于样本数据的分布。当参数估计方法固定时，主要取决于样本数据的分布。

样本数据的分布在本质上是由变量关系决定的。因此回归拟合度也是检验模型变量关系真实性，判断模型假设是否成立的重要方法。拟合度较好是对模型的支持，否则，可能意味着必须对模型进行修改。

首先需要从Y 的离差中分离出由解释变量决定的部分，因变量的实际观测值与其样本均值的离差即总离差（Y Y -）可以分解为两部分：一部分是因变量的理论回归值与

其样本均值的离差（?Y Y -），它可以看成是能够由回归直线解释的部分，称为可解释

离差；另一部分是实际观测值与理论回归值的离差（?Y Y -），它是不能由回归直线加以解释的残差e 。对任一实际观测值Y 总有：

??()()Y Y Y Y Y Y -=-+- (2.8)

对公式（2.8）两边平方并求和并计算，可得到：

∑∑∑??? ??-+???

??-=???

??-∧∧

_Y Y Y Y Y Y i i i i

SSE SSR SST += ()9.2

根据最小二乘估计和回归残差的相关公式，所有i Y 的离差的平方和记为

SST =2

)(∑∧

-j j Y Y 称为“总离差平方和”

，而2)(∑∧

-j j Y Y 记为SSR 称为“残差平方和”， 2)(∑∧

-j j

Y Y

记为SSE 称为“回归平方和”。

式（2.9）两边同除以 SST ，得：

SST

SSE

SST SSR +

=1 (2.10)

显而易见，各个样本观测点与样本回归直线靠的越近，SSR 在 SST 中所占的比重就

越大。（2.10）式中的

SST

SSR

正是反映解释变量（或回归直线）对被解释变量决定程度的指标，我们称它为“决定系数”（determined coefficient ），通常用2R 表示。计算公式为：

.12SST

SSE

SST SSR R -==

2.4.2 决定系数的性质及修正可决系数

决定系数是对回归模型拟合程度的综合度量，决定系数越大，模型拟合程度越高。决定系数越小，则模型对样本的拟合程度越差。决定系数2R 具有如下性质：

(1) 决定系数2R 具有非负性。

由决定系数的定义式可知，2R 的分子分母均是不可能为负值的平方和，因此其比值必大于零。

(2) 判定系数的取值范围为0≤2R ≤1。

由2R 的计算公式可以看出：当所有的观测值都位于回归直线上时，SSR =0，这时

2R =1，说明总离差可以完全由所估计的样本回归直线来解释；当观测值并不是全部位于回归直线上时， SST >0，则SSR ／SST >0，这时2R <1；当回归直线没有解释任何离差，即模型中解释变量Y 与因变量Y 完全无关时，Y 的总离差全部归于残差平方和，即

SSR ＝ SST ，这时2R ＝0。

(3) 判定系数是样本观测值的函数，它也是一个统计量。

判定系数2R 的大小受到自变量X 的个数k 的影响。可以证明，增加自变量X 的个数，回归平方和增大，从而使得2R 增大。由于增加自变量个数引起的2R 增大与拟合好坏无关，在含自变量个数k 不同的模型之间比较拟合程度时，2R 就不是一个合适的指标，必须加以调整。

调整方法为：把残差平方和与总离差平方和之比的分子分母分别除以各自的自由度，变成均方差之比，以剔除自变量个数对拟合优度的影响。调整的判定系数为：

∑∑==i

i i

i Y -Y ε*

n-K-n---R n-K-n--R 2

222)(111)1(111 (2.11)

用这个调整的决定系数作为评价多元线性回归拟合度的评价标准，可以基本消除由

于解释变量数目的差异所造成的影响，更加合理和具有可比性。

2.5 统计检验

2.5.1回归参数的显著性检验（t 检验）先要找出回归系数的分布，由上述知识得知：

~(,),j j jj N c ββσ∧

(2.12)

其中jj c 为()

-1

Z Z 的第j 行j 列的元素。将j β∧

标准化。一般有2

σ未知，用2

σ∧代替，得统计量 t ~()j j jj

t n k c ββσ∧

∧

-，以下可用t 统计量来进行回归系数的假设检验。

同一元线性回归一样，要检验解释变量j Z 对因变量Y 的线性作用是否显著，要使用

t 检验。步骤如下： (1) 提出假设。

0j H : 0β=,k ,,,j 21= 1j H : 0β≠,k ,,,j 21=

(2) 在0H 成立条件下，根据样本计算

∧

j jj

j j c c t σβσββ

(3) 给定显著性水平α，查表得临界值/2()t n k α- (4) 判断

若/2|t|()t n k α≥-，就拒绝0H ，j Z 对Y 有显著线性作用；若/2|t|()t n k α≤-，就接受0H ，j Z 对Y 线性作用不显著。

2.5.2回归方程的显著性检验（F 检验）

多元线性回归模型还可以进行模型总体显著性检验，也就是全体解释变量总体对被解释变量是否存在明显影响的检验，回归显著性检验的基本方法，是检验模型常数项以外所有参数同时为0的假设，使用F 检验。步骤如下： (1) 提出假设。

0:H 320====k βββ k ,,,βββ 321:H 不全为0

(2) 选择、（根据样本）计算统计量

/(1)

~(1,)/()

ESS k F F k n k RSS n k -=

---

(3) 给定显著性水平α，查表，得(1,)F k n k α-- (4) 判断

若(1,)F F k n k α≥--，就拒绝0H ，回归方程显著成立，所有自变量对Y 的影响是显著的；

若(1,)F F k n k α≤--，就接受0H ，回归方程不显著，所有自变量对Y 的线性作用不显著。

2.5.3 多重共线性检验

在多元线性回归模型Z Y β=中，对Z 的基本假定是：矩阵的各列向量之间是线性无关的，即有：0)(),()(≠<=Z Z n k k Z r '即如果这一假定不满足，则称模型存在多重共线性。多重共线性表现为两种情况：

(1) 完全多重共线性：k Z r <)(，也就是0)(=Z Z '，-1)(Z Z '不存在。

(2) 不完全多重共线性：（实际中多为此情况）0)(≈Z Z '，-1)(Z Z '对角线元素较大。而一般产生多重共线性的背景为：

（1）时间序列数据中经济变量在时间上常有共同的变动趋势；（2）经济变量之间本身具有内在联系（常在截面数据中出现）；（3）由于某种决定性因素的影响可能使各个变量向着同方向变化；（4）滞后变量引入模型，同一变量的逐次值一般都存在相互关系；多重共线性的检验方法有：

（1）简单相关系数矩阵法（辅助手段）

此法简单易行；但要注意两变量的简单相关系数包含了其他变量的影响，并非它们真实的线性相关程度的反映；一般在0.8以上可初步判定它俩之间有线性相关。（2）变量显著性与方程显著性综合判断；

（修正）可决系数大，F 值显著大于临界值，而t 值不显著；那么可认为存在多重共线性。

（3）辅助回归：

将每个解释变量对其余变量回归，若某个回归方程显著成立，则该解释变量和其余变量有多重共线性。

多重共线性的克服和处理方法有：

截面数据和时序数据结合，有时在时间序列数据中多重共线性严重的变量，在截面数据中不一定有严重的共线性。在假定截面数据估计出的参数在时间序列数据中变

化不大的前提下，可先用截面数据估计出一些变量的参数，再代入原模型估计另一些变量的参数。

变换模型形式（差分法）: 假设2Z 和3Z 存在高度线性相关。设原模型为：

.z z t t 3.3 t 2.21t εβββ+++=Y

将其滞后一期：

.z z Y 1-t 1- t 3.31- t 2.211-t εβββ+++=

将上述两式相减，得：

1-t t 1-t 3.t 3.31-t .2t 2.21-t t -)z (z )z -(z Y -Y εεββ++=

,z -z z ,Y -Y Y 1- t 2. t 2. t 2.1-t t t =?=?令 1-t t t 1- t 3. t 3. t 3.- ,z -z z εεε=?=?

则上述差分式子变成：

t t 3.3t 2.2t z z Y ε??β?β?++=

差分后，2z ?和3z ?的共线性将明显减弱。

2.5.4 异方差检验

在回归模型的假设得到满足之后，用最小二乘法估计的模型参数具有无偏和方差在线性无偏估计方法中最小的有效性，在这些假设中，其中有一条是误差项的方差不变。如果误差项的方差随观测次数的改变而改变，或随解释变量增减而变化，则称回归模型中存在异方差。异方差可以表示为[]2i i Var εσ=或

[][]

????????????===Ω22221'n E Var σσσεεε

其中异方差的的发现和检验方法有戈德菲尔德-夸特检验：构造统计量：

222

1212i i i i i i i i n c e K e F n c e e K -??-- ???==-??-- ???∑∑∑∑. 如果F F λ>，误差项存在明显的递增异方差性；如果1F F λ≤≤，误差项没有明显的异方差性。

异方差的克服和处理：如线性回归模型为i Ki K 1i 10i z z εβββ++++= Y ，经检验，

误差项有如下异方差性22)(σσji i z f =，可以用)(z ji f 除模型各项，得到：

)(z )(z )(z )(z 1

)(z ji ji ji 11ji 0ji f f z f z f f Y i ki K i i εβββ++++= , 新模型的误差项方差为：

][])

(z 1

[

])

(z [

2ji ji i i

Var f f Var εε=

ji )

(z 1

i f σ?=

2ji )()

(z 1

σji z f f ?=

2σ=.

3 中国经济现状

3.1 中国经济现状

改革开放30年来，中国经济持续高速增长，相当程度上是依赖于中小企业的崛起。快速、健康和持续发展的中小企业，对经济增长的贡献有目共睹：在繁荣经济、促进增长、国际贸易、扩大就业、推动创新、提高消费能力等方面发挥着重要的作用，已成为推动我国经济社会发展的重要力量，是大企业发展的依托，是活跃市场的基本主体，也是经济活力的具体体现[1]。

回顾2008年中国：我们经历了年初的雪灾、5月的地震灾害、8月承办奥运、中国股市连连下挫，上证指数从2007年的最高点6124点一路下滑至2008年8月份的最低点2284点、半年光景约有6.7万家中小企业倒闭、国际油价的居高不下，煤、电、油、运全面紧张。

针对新局势、新变化，我国政府把防过热、防通胀的经济政策迅速调整为保发展、控通胀。确保发展和控制物价是对立的统一，既有矛盾，也可以相互促进，关键在于我们采取什么样的政策，拉动GDP的三大要素是——投资、消费和进出口，根据相关研究今年经济增长如果不超过9.4%，通货膨胀率控制在5%左右，就是一个很好的平衡点，能为明年打下一个好的基础[2]。

中国经济正处在低谷的边缘。因为我国经济面临内忧外患，内忧是通货膨胀，外患是全球经济放缓，这些都对我国经济有很大影响，我们正在经历着动荡的考验：美元走低、人民币升值、外需放缓，这对于对外依存度超过60%的中国经济，是一次巨大的挑战[3]。

对于中小企业而言在投资和出口问题上主要依赖于国家的宏观调控，就困境中的中小企业本身来说基本上是无能为力的，然而可以团结起来、集合资源，向管理要效益，向降低成本要效益，从扩大内需中要效益，那么就要进一步激励民众扩大内需、大力推动消费、刺激消费，寻找一种能够产生新的消费热情的方法上下功夫，在实现消费增值的基础上取得企业效益，从而保持企业持续健康的发展。

3.2工业生产总值的概述

工业总产值是指以货币表现的工业企业在报告期内生产的工业产品总量。工业总产值按“工厂法”计算，即以工业企业作为一个整体，按企业工业生产活动的最终成果计算[5]。企业内部不允许重复计算，不能把企业内部各个车间生产的成果相加。工业总产值包括成品价值、对外加工费收入和自制半成品、在产品期末期初差额价值[8]。

4 工业生产总值的多因素模型分析

4.1建立多因素分析模型设

,776655443322110μββββββββ++++++++=X X X X X X X Y

其中：

Y 为工业总产值（按当年价格，单位：亿元）

1X 为塑料制品产量（单位：万吨） 2X 为水泥产量（单位：万吨）

3X 为平板玻璃产量（单位：万重量箱） 4X 为生铁产量（单位：万吨）

5X 为粗钢产量（单位：万吨） 6X 为钢筋产量（单位：万吨） 7X 为盘条产量（单位：万吨）

μ为随机误差项。

4.2数据收集

研究工业生产总值与经济发展之间的关系严格来说可以对每个地区进行研究，但是具体到各个地区，根据各个地区的条件情形不同，所以对研究得出的数据也会有很大的差异，所以此次就对同一地区的工业生产总值与经济发展之间的关系作为研究，就对一个地区的数据进行收集，然后得出结论，这个结论可以反映出这个地区的工业生产值与经济发展的关系，为促进经济发展，针对某一地区的经济发展，我们可以对它进行几十年的数据收集，得出这个地区的经济发展情况。下面我们以中国2007年各省市的主要工业产品产量统计量为研究对象，通过对这些数据和工业总产值的数据建立的线性关系来预测工业总产值。

(1) 工业总产值来自中国2007年按地区分组的专用设备制造业工业企业主要经济指标统计(一)；

(2) 原煤来自中国2007年按地区分组的主要工业产品产量统计(一)； (3) 由于西藏自治区一行中缺省数据太多，故删除了西藏一栏； (4) 中国2007年按地区分组的主要工业产品产量统计(六)

具体数据见下表4.1：

表4.1 原始数据

注1)：数据来自中国2007年统计年鉴8w 。

地区工业总产值(当年价格)

塑料制品 (万吨) 水泥 (万吨) 平板玻璃(万重量箱) 生铁

（万吨）粗钢（万吨）钢筋（万吨）盘条 (万吨) 全国 10591.98 3305.23 136117.25 53918.07 47651.63 48928.8 10275.48 7919.02 北京 331.92 32.66 1168.6 235.22 780.51 810.76 296.34 416.3 天津 204.82 40.9 614.79 186.06 1435.4 1602.13 185.19 64.14 河北 376.27 137.37 9758.28 10031.76 10523.01 10569.29 1335.43 1171.84 山西 258.49 13.44 2780.91 971.91 3727.64 2506.36 372.93 465.82 内蒙古 124.34 6.05 2871.17 1395.72 1260.09 1040.36 100.96 76.63 辽宁 680.18 159.3 3893.2 1941.21 4057.59 4140.27 246.94 453.91 吉林 94.57 21.97 1903.81 850.76 545.66 599.67 30.59 69.16 黑龙江 175.41 14.06 1645.06 490.21 374.11 436.05 184.5 33.3 上海 600.57 72.46 959.44 744.53 1790.36 2081.58 23.21 78.48 江苏 1425.76 327.37 11849.78 6856.11 3802.15 4721.47 1577.49 949.47 浙江 875.07 768.88 10548.51 2917.53 238.08 577.23 131.63 183.74 安徽 173.27 111.17 5402.23 472.56 1517.7 1663.61 501.04 257.69 福建 253.94 106.66 4500.1 1867.12 477.88 588.82 289.47 222.27 江西 56.09 12.95 5008.54 686.64 1047.36 1306.81 496.39 332.42 山东 1736.69 315.47 15023.89 5175.61 4906.67 4406.91 1090.68 638.12 河南 797.9 121.69 9471.36 3619.93 1974.95 2275.39 556.84 660.1 湖北 126.58 53.71 5638.85 2178.34 1679.79 1778.17 226.99 178.93 湖南 425.56 23.25 5683.28 1518.12 1247.76 1331.79 337.18 224.3 广东 923.24 754.45 9799.57 6123.03 755.25 1154.03 444.76 284.86 广西 175.53 21.71 4350.48 530.34 639.3 765.67 288.06 207.22 海南 2.03 2.25 633.32 7.68 18.84 4.54 6.54 0.67 重庆 84.85 22.68 3000.05 254.18 328.38 358.36 49.76 102.41 四川 364.4 83.51 6375.6 2495.79 1470.73 1415.34 492.78 195.91 贵州 28.31 7.96 2059.06 2.5 363.19 349.36 176.45 118.83 云南 37.24 16.11 3568.53 329.8 1202.78 883.85 228.43 183.61 陕西 181.62 5.14 3175.49 1175.08 365.55 396.27 318.94 53.67 甘肃 52.41 10.32 1540.21 591.89 592.78 602.8 98.84 140.53 青海 1.22 0.27 436.85 92.95 90.09 114.71 1.31 7.54 宁夏 16.23 2.02 817.36 61.82 46.25 0.36 37.77 5.08 新疆

7.46

39.47

1479.28

113.66

391.82

446.85

148.06

142.08

4.3 统计检验由SPSS 计算结果

表4.2 Variables Entered/Removed(b)

Model Variables Entered Variables

Removed

Method

1 盘条x7,

塑料制品x1, 生铁x4, 平板

玻璃x3, 水泥x2, 钢筋x6, 粗钢x5

0.976 Enter

a All requested variables entered.

b Dependent Variable: 工业总产值y

表4.3 Model Summary(b)

Model R R Square Adjusted R Square Std. Error of the

Estimate

Durbin-Watson

1 0.993(a) 0.987 0.983 245.84347 1.739

a Predictors: (Constant), 盘条x7, 塑料制品x1, 生铁x4, 平板玻璃x3, 水泥x2, 钢筋x6, 粗钢x5

b Dependent Variable: 工业总产值y

表4.4 ANOV A(b)

Model

Sum of Squares

Mean Square

Sig.

1 Regression 105370311.469 7 15052901.638 249.059 0.000(a) Residual 1390097.246 23 60439.011 Total 106760408.714 30 a Predictors: (Constant), 盘条x7, 塑料制品x1, 生铁x4, 平板玻璃x3, 水泥x2, 钢筋x6, 粗钢x5 b Dependent Variable: 工业总产值y

表4.5 Coefficients(a)

a Dependent Variable: 工业总产值y

Model Unstandardized Coefficients Standardized

Coefficients t Sig.

Collinearity Statistics

Std. Error Beta Tolerance VIF 1 (Constant)

-2.211

47.145 -0.047 0.963 塑料制品x1 0.989 0.452

0.317 2.187 0.039 0.027 37.156 水泥x2 0.036 0.024 0.460 1.535 0.138 0.006 158.745 平板玻璃x3

-0.055

0.056

-0.281

-0.978 0.338 0.007 145.392 生铁x4 0.013 0.154 0.058 0.083 0.934 0.001 858.829 粗钢x5 0.004 0.176 0.020 0.004 0.981 0.001 1170.904 钢筋x6 0.456 0.362 0.441 1.260 0.220 0.005 216.237 盘条x7 -0.016 0.499 -0.012 -.032

0.975

0.004

242.790

即有： 76543210160456000400130055003600.989-2.211X .X .X .X .X .X .X Y ?-+++-++=

2R =0.987 ,2R =0.983,F =249.059

方程的决定系数较高，2R =0.987，修正可决系数2R =0.983，又回归模型拟合程度与决定系数有关，决定系数越大，模型拟合程度越高，可见本模型拟合程度较好，又F=249.059>10, 模型总体显著性检验得知模型总体显著，也就是全体解释变量总体对被解释变量存在明显影响。对t 检验由上述分析结果知，除粗钢和原煤外其余预测变量都是显著的。故我们对上述模型进行计量经济学的检验，并进行修正，看是否能使模型方程得到改进。

其中我们看到平板玻璃和盘条产量的系数是负值，一般来说，平板玻璃和盘条产量等经济发展量应该与工业总产值成正比关系，但由于在研究具体某个地区的经济发展关系时，由于政策领导或其它的因为地区的特殊性的原因，造成了平板玻璃和盘条产量的系数是可能成为负值的。比如工业总产值在下降，但是因为政策或其它原因平板玻璃和盘条产量却在上升，或工业总产值在上升，但是平板玻璃和盘条产量却在下降。

4.4 计量经济学检验及模型修正

4.4.1 异方差检验

计算残差绝对值与个自变量的斯皮尔曼相关系数，结果如下表：

表4.6 Correlations

残差绝对值与各自变量的相关系数分别为0.59，0.47，0.287,0.489,0.513,0.416，0.547说明存在异方差，需采用加权最小二乘估计；

加权估计，得到最优权重为3.000，对其进行加权分析。

Correlations

塑料制品x1 水泥 x2 平板玻璃 x3 生铁 x4 粗钢 x5 钢筋 x6 盘条

x7 abs_1

Spearm an's rho

塑料制品x1 Correlation

Coefficient 1 0.735 0.738 0.615 0.685 0.592 0.711 0.590 Sig. 1-tailed 0 0 0 0 0 0 0 0 N

31 31 31 31

水泥x2 Correlation Coefficient 0.735 1 0.855 0.547 0.604 0.782 0.760 0.470 Sig. 1-tailed 0 0.002 0 0.001 0 0 0 0.004

31 31 31 31

平板玻璃x3

Correlation

Coefficient 0.738 0.855 1 0.665 0.717 0.665 0.690 0.287 Sig. 1-tailed 0 0 0 0 0 0 0 0.059 N

31 31 31 31 31

生铁x4 Correlation Coefficient 0.615 0.547 0.665 1 0.986 0.700 0.754 0.489 Sig. 1-tailed 0 0.001 0 . 0 0 0 0.003 N

31 31 31 31

粗钢x5 Correlation Coefficient 0.685 0.604 0.717 0.986 1 0.720 0.788 0.513 Sig. 1-tailed 0 0 0 0 . 0 0 0.002 N

31 31 31 31 31

钢筋x6 Correlation Coefficient 0.592 0.782 0.665 0.70 0.720 1 0.858 0.416 Sig. 1-tailed 0 0 0 0 0 0 0 0.01 N

31 31 31 31

31 盘条x7 Correlation Coefficient 0.711 0.760 0.690 0.754 0.788 0.858 1 0.547 Sig. 1-tailed 0 0 0 0 0 0 0 0.001 N

31 31 31 31

abs_1 Correlation Coefficient 0.590 0.470 0.287 0.489 0.513 0.416 0.547 1 Sig. 1-tailed 0 0.004 0.059 0.003 0.002 0.01 0.001 0.001

Correlation is significant at the 0.01 level 1-tailed.