文档库 最新最全的文档下载
当前位置:文档库 › 实验8_多元线性回归分析与非线性回归分析

实验8_多元线性回归分析与非线性回归分析

实验8_多元线性回归分析与非线性回归分析
实验8_多元线性回归分析与非线性回归分析

实验8 多元线性回归分析与非线性回归分析

多元线性回归分析研究多个变量的数量伴随关系,内容主要包括模型的假定与检验、参数的估计与检验、回归诊断与预测。

很多非线性回归问题都可以转化为线性回归问题处理,如多项式回归、指数回归、对数回归、幂函数回归等。

8.1 实验目的

掌握使用SAS多元线性回归分析与非线性回归分析的方法。

8.2 实验内容

一、用“分析家”作多元线性回归分析

二、用INSIGHT模块作多项式回归

三、使用REG过程作回归分析

四、一元非线性回归分析

8.3 实验指导

一、用“分析家”作多元线性回归分析

【实验8-1】某研究人员需要分析我国固定资产投资状况的影响因素,选取5个可能的影响因素:国内生产总值、商品房屋销售额、财政支出、社会消费品零售总额、进出口总额,统计1987~2001共15年的各项指标如表8-1所示(sy8_1.xls)所示。试在0.05的显著性水平下进行多元回归分析,判断哪些因素对固定资产投资有着显著影响,给出回归方程。

表8-1 15年的统计数据

年度固定投资总额国内生产总值商品房屋销售额财政支出社会消费品零售总额进出口总额1987 3791.7 11962.5 1100967 2262.18 5820 3084.2 1988 4753.8 14928.3 1472164 2491.21 7440 3821.8 1989 4410.4 16909.2 1637542 2823.78 8101.4 4155.9 1990 4517 18547.9 2018263 3083.59 8300.1 5560.1 1991 5594.5 21617.8 2378597 3386.62 9415.6 7225.8 1992 8080.1 26638.1 4265938 3742.2 10993.7 9119.6

12462.1 11271 13072.3 34634.4 8637141 4642.3

1993

1994 17042.1 46759.4 10184950 5792.62 16264.7 20381.9 1995 20019.26 58478.1 12577269 6823.72 20620 23499.9 1996 22913.55 67884.6 14271292 7937.55 24774.1

24133.8 1997 24941.11 74462.6 17994763 9233.56 27298.9 26967.2 1998 28406.17

78345.2

25133027

10798.18 29152.5

26857.7 1999 29854.71 82067.46 29878734 13187.67 31134.7 29896.3 2000 32917.73 89442.2 39354423 15886.5 34152.6 39274.2 2001 37213.49

95933.3

48627517

18902.58 37595.2

42193.3

1. 生成数据集

在“分析家”中直接打开上面的Excel 数据表(sy8_1.xls),选择编辑状态,修改每个变量的属性,将变量名分别改为:年度:n 、固定投资总额:y 、国内生产总值:x1、商品房屋销售额:x2、财政支出:x3、社会消费品零售总额:x4、进出口总额:x5。 以数据集Mylib.sy8_1存盘。

图8-1 Linear

Regression 对话框 2. 全回归分析

1) 选择主菜单“Statistics (统计)”→“Regression (回归)”→“Linear (线性)”,打开“Linear Regression (线性回归)”对话框。 2) 选择变量列表中的变量y ,单击“Dependent ”按钮,选定响应变量,选择变量列表中的变量x1、x2、x3、x4、x5,单击“Explanatory ”按钮,选定

解释变量,如图8-1所示。

3) 单击“OK ”按钮,得到分析结果如图8-2所示。

图8-2 多元回归分析结果

分析结果包括方差分析表、拟合的汇总信息以及回归系数估计值与显著性检验。方差分析表中显示模型的作用是显著的(F 统计量的值为1567.35,p 值<0.0001<0.05 = α)。

参数显著性检验表明,进入回归的5个自变量,其作用在其它变量进入回归的前提下并

不都是显著的。例如x3、x4、x5的作用就不显著。因此有必要适当选择变量建立一个“最优”的回归方程。

3. 逐步回归分析

1) 重复上面2中1),在“Linear Regression (线性回归)”对话框(图8-1)中,单击“Model ”按钮,打开“Linear Regression :Model ”对话框。在“Method ”选项卡中选择“Stepwise selection (逐步选择法)”,如图8-3所示。

两次单击“OK ”按钮,得到分析结果。

2) 在显示结果中,第1步记录了只有x1进入回归

方程的回归分析结果,其中回归方程和系数的检验均

为显著,此时R 2=0.9911,C(p)=58.5161;接着第2步是自变量x1和x2进入回归方程后的回归分析结果,回归方程及x1和x2的系数检验均为显著,但常数项检验不显著。接着第3步是自变量x1、x2和x3进入回归方程后的回归分析结果。其

中回归方程及所有系数检验均为显著,常数项检验也显著。且R 2=0.9984提高了,

C(p)=5.5226减少了。

图8-3 选择逐步回归法

图8-4 逐步回归第1、2步、3步及最后结果

在图8-4右下中指出在0.05的检验水平下,不能再有其它变量进入模型。比较R 2和C(p)的值(图8-4右),应取包含变量x 1、x 2和x 3的第三个模型作为较优的模型,对应的回归方程是:

32109048.200078157.036911.027814.3023x x x y ?++=

4. 回归诊断

进行回归诊断的步骤如下:

1) 重复上面2中1),在打开的“Linear Regression (线性回归)”对话框中,单击“Plots ”按钮。在打开的“Linear Regression :Plots ”对话框中,选择“Residual ”选项卡,按图8-5所示选择有关复选框。

2) 两次单击“OK ”按钮,得到回归诊断结果,在“分析家”窗口的项目管理器中依次

双击“Residual Plots ”下的“Plot of STUDET vs

PRED ”和“Plot of RESIDUAL vs NQQ ”得到

标准化后的残差图(图8-6左)和残差的QQ 图(图8-6右)。

图8-5 Linear Regression :Plots 对话框

图8-6 残差图和残差的QQ 图

从标准化后的残差图(图8-6左)看出,数据点随机地散布在零线附近,表明模型中误差等方差、独立性的假设没有问题。残差的QQ 图(图8-6右)近似一条直线,可以初步判定残差来自正态分布总体,所建回归模型是有效的。 3) 对残差作进一步检验: 在上述操作打开的“Linear Regression (线性回归)”对话框中,单击“Save Data ”按钮。在打开的“Linear Regression :Save Data ”对话框中,选中“Crate and save diagnostics data ”复选框,并将列表中的第二项“RESIDUAL Residuals ”添加到左边方框内,如图8-7所示。

图8-7 Linear Regression :Save Data 对话框 两次单击“OK ”后得到分析结果。 4) 在“分析家”窗口的项目管理器中双

击“Diagnostics ”下的“Diagnostics Table ”

可以看到在数据集中生成了残差数据,如图

8-8所示。

图8-8 生成残差数据

将“Diagnostics Table”存盘(sy8_1_r)后在“分析家”中打开。

5) 选择主菜单“Statistics(统计)”→“Descriptive(描述性统计)”→“Distributions…(分布)”,打开“Distributions”对话框,选择变量列表中的_RESID,单击“Analysis”按钮,选定分析变量,如图8-9左所示。

图8-9 设置选项

6) 单击“Fit(拟合)”按钮,在打开的对话框中选择拟合的分布类型:Normal,使用样本估计量(Sample estimates),如图8-9右所示。

7) 两次单击“OK”按钮,并在分析家窗口的项目管理器中双击“Fitted Distributions of sy8_1_r”项,得到对残差_RESID的正态分布检验结果,如图8-10所示。

图8-10 残差分布检验结果

三种检验均有p 值>0.05,因此不能拒绝残差来自正态总体的假定。

5. 预测

通过回归诊断得知模型:

32109048.200078157.036911.027814.3023x x x y ?++=

是合适的,可以用于预测。

1) 假定02,03年国内生产总值(x1)、商品房屋销售额(x2)、财政支出(x3)的数据已存入数据集Mylib.sy8_1_new 中,如图所示。

图8-11 数据集Mylib.sy8_1_new

2) 重复上面逐步回归步骤,并在图8-1所示的“Linear Regression (线性回归)”对话框中,单击“predictions ”按钮,打开“Linear Regression :predictions ”对话框。按图8-12所示进行预测的Input (输入)、Output (输出)设置。

图8-12 “Linear Regression :predictions ”对话框

3) 两次单击“OK ”,得到结果。在分析家的项目管理器中点击“predictions ”可以看到预测结果,如图8-13所示。

图8-13 预测结果

二、用INSIGHT 模块作多项式回归

【实验8-2】某研究人员统计了房地产行业2003年主营业务收入和净利润的关系,从中

随即抽取20家上市公司,统计后的主营业务收入和净利润如表8-2(sy8_2.xls)所示。试采用多项式回归方程给出净利润y与主营业务收入x的关系。

表8-2 20家公司的净利润和主营业务收入(百万元)

股票代码 主营业务收入 净利润 股票代码 主营业务收入 净利润

0000029 96.24 11.35 600533 48.05 70.50 0000031 33.09 85.11 600603 0.85 2.57 0000046 57.60 36.61 600638 51.66 63.70 0000511 36.77 27.26 600639 61.07 127.13 0000558 20.10 6.72 600641 64.54 33.59 0000608 45.53 36.37 600648 35.50 25.01 0600064 110.07 80.13 600663 226.55 664.02 0600322 72.05 20.88 600675 188.60 175.31 0600376 39.82 37.15 600736 81.32 108.68

1. 生成数据集

将表8-2在Excel中修改后导入成SAS数据集Mylib.sy8_2,在INSIGHT中打开后如图8-14所示。其中变量n、x、y分别表示股票代码、主营业收入和净利润。

2. 回归分析

为了大致地了解y与x的关系,首先利用INSIGHT作y与x的带有曲线拟合的散点图,具体方法是:

1) 选择菜单“Analyze(分析)”→“Fit(Y X) (拟合)”打开“Fit(Y X)”对话框,选择变量如图8-15所示。

图8-14 数据集Mylib.sy8_2 图8-15 选择变量单击“OK”,得到拟合线性模型:

β+

ε

β

=x

y

+

1

主要部分如图8-16所示。

图8-16 一元线性模型的拟合结果

从图8-16可以发现,虽然模型检验显著,但R 2只有0.6494,且常数项未通过检验。为改进模型,移动图8-16右上第一张表中“Degree(Polynomial)”栏下的滚动条,可以做高次多项式拟合试验,其中R-Square 、F Stat 可以说明拟合的效果。 作二次和三次多项式拟合试验的结果如图8-17所示。

图8-17 调整拟合模型

拟合三次多项式的R 2已接近94%,不需要再高的阶次了。

重新回到“Fit(Y X)”对话框,按图8-18左设置分析变量,可以拟合下面的三次多项式模型:

εββββ++++=332210x x x y

图8-18 设置拟合变量

单击“Output ”按钮,按图8-18右选择输出结果,两次单击“OK ”后,得到拟合结果,如图8-19所示。

图8-19 三次多项式拟合结果

虽然模型检验通过,但常数项未通过检验,进一步改进模型,再次回到“Fit(Y X)”对话框,按图8-18进行有关设置后,取消常数项复选框,如图8-20所示。

图8-20 取消常数项复选框

单击“OK ”按钮,得到拟合模型,主要部分如图8-21、8-22

所示。

εβββ+++=33221x x x y

图8-21 不含常数项的三次多项式拟合结果

其中模型和系数检验均通过,且R2高达84.98%,所以该模型为比较理想的模型,最后的回归方程具体形式为:

20002

3

x

y+

?

x

=

.3x

0527

.0

.0

3145

3. 回归诊断

从图8-22可以看出残差数据随机独立并大致服从均值为零的正态分布。

图8-22 残差图和残差QQ图

三、使用REG过程作回归分析

【实验8-3】某种水泥在凝固时放出的热量y(cal/g)与水泥中四种化学成分x1,x2,x3,x4有关,现测得13组数据,如表8-3(sy8_3.xls)所示。试从中选出主要的变量,建立y关于它们的线性回归方程。

表8-3 热量y与四种化学成分的实测数据

x1 x2 x3 x4 y

7 26 6 60 78.5

1 29 15 5

2 74.3

11 56 8 20 104.3

11 31 8 47 87.6

7 52 6 33 95.9

11 55 9 22 109.2

3 71 17 6 102.7 1 31 22 4

4 72.

5 2 54 18 22 93.1 21 47 4 2

6 115.9 1 40 23 34 83.8 11 66 9 12 113.3 10 68 8

12 109.4

1. 建立数据集

输入以下代码建立数据集sy8_3并显示:

data mylib.sy8_3;

input x1 x2 x3 x4 y; cards;

7 26 6 60 78.5 1 29 15 52 74.3 11 56 8 20 104.3 11 31 8 47 87.6 7 52 6 33 95.9 11 55 9 22 109.2 3 71 17 6 102.7 1 31 22 44 72.5 2 54 18 22 93.1 21 47 4 26 115.9 1 40 23 34 83.8 11 66 9 12 113.3

10 68 8 12 109.4

;

Title '数据集sy8_3'; Proc print ; run;

运行结果如图所示。

图8-23 数据集sy8_3

2. 向后逐步剔出法进行回归 执行以下代码:

proc reg data = Mylib.sy8_3; var y x1 - x4;

model y = x1 - x4/selection=backward; plot residual. * predicted.; run;

输出结果如下:

图8-24 向后逐步剔除的第0步(全回归)

图8-25 向后逐步剔除的第1步

图8-26 向后逐步剔除法第2步

图8-27 向后逐步剔除法结果汇总

向后逐步剔除法的分析结果给出回归模型:

Y = 52.57735 + 1.46831x1 + 0.66225x2

残差对预测值的散点图显示如下:

图8-28 残差散点图

3. 结果分析

采用向后逐步剔除法回归的第0步是做全回归,结果如图8-24所示,所有系数均未通过检验(P值均大于0.05),向后逐步剔除法第1步将变量x3剔除,结果如图8-25所示,其中x2和x4的系数仍不能通过检验,接下来第2步将变量x4剔除,结果如图8-26所示,此时的回归方程及x1和x2的系数均能通过检验,残差对预测值的散点图(图8-28)基本正常符合模型假定,所以方程Y = 52.57735 + 1.46831x1 + 0.66225x2为有效回归方程。

四、一元非线性回归分析

【实验8-4】已知数据如表8-4(sy8_4.xls)所示。试分别采用指数回归、对数回归、幂函数回归和倒幂函数回归4种非线性回归方法进行回归分析,并选择一个较好的回归方程。

表8-4 实验数据

X 1.1

1.2

1.3

1.4

1.5

1.6

1.7

1.8

1.9

2

2.1

2.2 2.3 2.4

Y 109.95

40.4520.09

24.53 11.02 7.39

4.95 2.72 1.82 1.490.82

0.3

0.2

0.22

1. 生成数据集

运行下面程序生成并显示数据集sy8_4,如图8-29所示。

图8-29 数据集sy8_4

data sy8_4; input x y; cards; 1.1 109.95 1.2 40.45 1.3 20.09 1.4 24.53 1.5 11.02 1.6 7.39 1.7 4.95 1.8 2.72 1.9 1.82 2 1.49 2.1 0.82 2.2 0.3 2.3 0.2 2.4 0.22 ; run;

title '数据集sy8_4'; proc print; run;

2. 对x 和y 作相关分析 执行如下代码:

/*画x 和y 的散点图*/ goptions ftext='宋体'; proc gplot data = sy8_4; plot y*x;

title 'x 和y 的散点图';

symbol v=dot i=none cv=orange ; run;

/*求x 和y 的相关系数*/ proc corr data = sy8_4; var x y; run;

运行上面程序,得到散点图(图8-30左)以及x 与y 的相关系数(图8-30右):

图8-30 x 与y 的散点图与相关系数

由图可见x 和y 有一定的非线性关系,根据散点分布的形状考虑用下面几种非线性回归方法建立非线性回归方程,并从中选出较为合适的回归方程。

3. 倒幂函数x

b

a y 1

+=回归 首先考虑倒幂函数拟合,执行如下代码:

图8-31 u 和v 的散点图

goptions ftext='宋体'; data new1; set sy8_4; u = 1/x; v = y; run;

/*画u 和v 的散点图*/ title 'u 和v 的散点图'; proc gplot data = new1; plot v*u;

symbol v=dot i=none cv=red ; run;

运行结果得到散点图8-31,由图可见,u 和v 有着较弱的线性关系。做线性回归:

proc reg data = new1; var v u; model v = u; print cli; title '残差图';

plot residual. * predicted.; run;

运行结果如图8-32和图8-33所示。

图8-32 倒幂函数回归结果

倒幂函数回归结果(图8-32):方差分析表中显示模型的作用是显著的(F 统计量的值为24.95,p 值<0.0003<0.05 = α)。参数显著性检验表明,自变量的作用是显著的。回归方程为:

v = -78.56560+156.53887u 即:

x

y 1

53887.56156560.78+?=

残差对预测值的散点图(图8-33)表明,残差有一定趋势,不符合模型的假定,以上回归方程无效。

图8-33 残差对预测值的散点图

4. 幂函数回归

b ax y = 考虑幂函数拟合,执行如下代码:

data new2; set sy8_4; u = log(x);

v = log(y); run;

/*画u 和v 的散点图

*/

图8-34 u 与v 的散点图

title 'u 和v 的散点图'; proc gplot data = new2; plot v*u;

symbol v=dot i=none cv=red ; run; title '残差图';

proc reg data = new2; var v u; model v = u; print cli;

plot residual. * predicted.; run;

得到散点图如图8-34所示:

幂函数回归的结果见图8-35左:

图8-35 幂函数回归结果与残差对预测值的散点图

得回归方程:v = 5.51053 – 7.93588u 即:

93588.72822.247?=x y 残差对预测值的散点图(如图8-35右)表明,残差有微弱趋势,不符合模型的假定,上面回归方程不佳。

5. 指数函数回归

bx ae y = 考虑指数函数拟合,执行如下代码:

data new3; set sy8_4; u = x;

v=log(y); run;

/*画u 和v 的散点图

*/

图8-36 u 与v 的散点图

title 'u 和v 的散点图'; proc gplot data = new3; plot v*u;

symbol v=dot i=none cv=red ; run; title '残差图';

proc reg data = new3; var v u; model v = u; print cli;

plot residual. * predicted.; run;

得到散点图如图8-36所示:

指数函数回归结果见图8-37左:

图8-37 指数函数回归结果与残差对预测值的散点图

得回归方程:v = 9.58399 – 4.73895u 即:

x e y 73895.414530.28?= 从残差对预测值的散点图(如图8-37右)可以看出,残差基本符合模型的假定,上面回归方程有效。

6. 对数x b a y ln +=回归 考虑对数函数拟合,执行如下代码:

data new4; set sy8_4; u = log(x);

v = y; run;

/*画u 和v 的散点图

*/

图8-38 u 与v 的散点图

title 'u 和v 的散点图'; proc gplot data = new4; plot v*u;

symbol v=dot i=none cv=red ; run; title '残差图';

proc reg data = new4; var v u; model v = u; print cli;

plot residual. * predicted.; run;

得到散点图如图8-38所示。

对数函数回归结果见图8-39左。

图8-39 对数函数回归结果

得回归方程:v = 64.58847 – 91.11730u 即:y = 64.58847 – 91.11730ln x

从残差对预测值的散点图(如图8-39右)可以看出,残差有二次趋势,不符合模型的假定,上面回归方程无效。

7. 结论

比较上述4个回归方程,第三种指数函数回归的Root MSE (均方残差平方根)最小

(0.25991)、R-Square (判定系数R 2)最大(0.9844),效果最好。 执行下述代码,得到模型的拟合图形如图8-40所示。

x e y 73895.414530.28?=data new5; set new1;

y1 = 14530.28*exp(-4.73895*x);

run;

title '回归图';

proc gplot data =new5;

plot y*x=1 y1*x=2/overlay ;

symbol v=dot i=none cv=red ;

symbol2 i=sm color=blue;

run;

图8-40 指数函数拟合图形

8.4 上机演练

【练习8-1】某学校20名一年级女大学生体重(公斤)、胸围(厘米)、肩宽(厘米)及肺活量(升)实测值如表8-5(lx8_1.xls)所示。试对影响女大学生肺活量的有关因素作多元回归分析。

表8-5 20名一年级女大学生肺活量及有关变量测量结果

编号 体重X1/公斤 胸围X2/厘米 肩宽X3/厘米 肺活量Y/升

1 51.3 73.6 36.4 2.9

2 48.9 83.9 34.0 3.11

3 42.8 78.3 31.0 1.91

4 55.0 77.1 31.0 2.63

5 45.3 81.7 30.0 2.86

6 45.3 74.8 32.0 1.91

7 51.4 73.7 36.5 2.98

8 53.8 79.4 37.0 3.28

9 49.0 72.6 30.1 2.52

10 53.9 79.5 37.1 3.27

11 48.8 83.8 33.9 3.10

12 52.6 88.4 38.0 3.28

非线性回归分析

SPSS—非线性回归(模型表达式)案例解析 2011-11-16 10:56 由简单到复杂,人生有下坡就必有上坡,有低潮就必有高潮的迭起,随着SPSS 的深入学习,已经逐渐开始走向复杂,今天跟大家交流一下,SPSS非线性回归,希望大家能够指点一二! 非线性回归过程是用来建立因变量与一组自变量之间的非线性关系,它不像线性模型那样有众多的假设条件,可以在自变量和因变量之间建立任何形式的模型非线性,能够通过变量转换成为线性模型——称之为本质线性模型,转换后的模型,用线性回归的方式处理转换后的模型,有的非线性模型并不能够通过变量转换为线性模型,我们称之为:本质非线性模型 还是以“销售量”和“广告费用”这个样本为例,进行研究,前面已经研究得出:“二次曲线模型”比“线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的趋势变化”,那么“二次曲线”会不会是最佳模型呢? 答案是否定的,因为“非线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的变化趋势” 下面我们开始研究: 第一步:非线性模型那么多,我们应该选择“哪一个模型呢?” 1:绘制图形,根据图形的变化趋势结合自己的经验判断,选择合适的模型 点击“图形”—图表构建程序—进入如下所示界面:

点击确定按钮,得到如下结果:

放眼望去, 图形的变化趋势,其实是一条曲线,这条曲线更倾向于"S" 型曲线,我们来验证一下,看“二次曲线”和“S曲线”相比,两者哪一个的拟合度更高! 点击“分析—回归—曲线估计——进入如下界面

在“模型”选项中,勾选”二次项“和”S" 两个模型,点击确定,得到如下结果: 通过“二次”和“S “ 两个模型的对比,可以看出S 模型的拟合度明显高于

多元线性回归SPSS实验报告

回归分析基本分析: 将毕业生人数移入因变量,其他解释变量移入自变量。在统计量中选择估计和模型拟合度,得到如图 注解:模型的拟合优度检验:

第二列:两变量(被解释变量和解释变量)的复相关系数R=0.999。 第三列:被解释向量(毕业人数)和解释向量的判定系数R2=0.998。 第四列:被解释向量(毕业人数)和解释向量的调整判定系数R2=0.971。在多个解释变量的时候,需要参考调整的判定系数,越接近1,说明回归方程对样本数据的拟合优度越高,被解释向量可以被模型解释的部分越多。 第五列:回归方程的估计标准误差=9.822 回归方程的显著性检验-回归分析的方差分析表 F检验统计量的值=776.216,对应的概率p值=0.000,小于显著性水平0.05,应拒绝回归方程显著性检验原假设(回归系数与0不存在显著性差异),认为:回归系数不为0,被解释变量(毕业生人数)和解释变量的线性关系显著,可以建立线性模型。 注解:回归系数的显著性检验以及回归方程的偏回归系数和常数项的估计值第二列:常数项估计值=-544.366;其余是偏回归系数估计值。

第三列:偏回归系数的标准误差。 第四列:标准化偏回归系数。 第五列:偏回归系数T检验的t统计量。 第六列:t统计量对应的概率p值;小于显著性水平0.05,拒接原假设(回归系数与0不存在显著性差异),认为回归系数部位0,被解释变量与解释变量的线性关系是显著的;大于显著性水平0.05,接受原假设(回归系数与0不存在显著性差异),认为回归系数为0被解释变量与解释变量的线性关系不显著的。 于是,多元线性回归方程为: y=-544.366+0.032x1+0.009x2+0.001x3-0.1x5+3.046x6 回归分析的进一步分析: 1.多重共线性检验 从容差和方差膨胀因子来看,在校学生数和教职工总数与其他解释变量的多重共线性很严重。在重新建模中可以考虑剔除该变量

多元非线性回归

多元非线性回归 什么是多元非线性回归分析 多元非线性回归分析是指包含两个以上变量的非线性回归模型。对多元非线性回归模型求解的传统做法,仍然是想办法把它转化成标准的线性形式的多元回归模型来处理。有些非线性回归模型,经过适当的数学变换,便能得到它的线性化的表达形式,但对另外一些非线性回归模型,仅仅做变量变换根本无济于事。属于前一情况的非线性回归模型,一般称为内蕴的线性回归,而后者则称之为内蕴的非线性回归。 [编辑] 多元非线性回归分析方程 如果自变数X_1,X_2,\cdots,X_m与依变数Y皆具非线性关系,或者有的为非线性有的为线性,则选用多元非线性回归方程是恰当的。例如,二元二次多项式回归方程为: \widehat{y}=a+b_{11}x_1+b_{21}x_2+b_{12}x_1^2+b_{22}x_2^ 2+b_{11\times22}x_1x_2 令b_1=b_{11},b_2=b_{21},b_3=b_{12},b_4=b_{22},b_5=b_{11\tim es22},及x_3=x_1^2,x_4=x_2^2,x_5=x_1\cdot x_2,于是上式化为五元一次线性回归方程: \widehat{y}=a+b_1x_1+b_2x_2+b_3x_3+b_4x_4+b_5x_5

这样以来,便可按多元线性回归分析的方法,计算各偏回归系数,建立二元二次多项式回归方程。 [编辑] 多元非线性回归分析模型[1] 一、常见的内蕴多元性回归模型 只要对模型中的变量进行数学变换,比如自然对数变换等,就可以将其转化具有标准形式特征的多元线性回归模型。 1.多重弹性模型 (y_1;x_{11},x_{12}\cdots,x_{1k}),(y_2;x_{21},x_{22}\cdots,x_{2k}),\ cdots,(y_n;x_{n1},x_{n2}\cdots,x_{nk})是一组对的样本观察资料,则称存在下列关系的非线性回归模型为多重弹性模型 y_i=\beta_0x_{i1}^{\beta_1}x_{i2}^{\beta_2}\cdots x_{ik}^{\beta_k}e^{\epsilon_{i}} (1) 上述模型中的各解释变量的幂,能够说明解释变量的相对变化对被解释变量产生的相对影响,我们正式从这一角度说它是多重弹性模型的。 2.Cobb-Dauglas生产函数模型 y_i=AK_{i}^aL_i^{\beta}e^{\epsilon_{i}},i=1,2,\cdots,n (2) 其中,yi表示产出总量,Ki为资本要素,Li为劳动力要素,A、α、β为参数。比较式(1)和(2),不难看出C-D生产函数模型实际是多

eviews多元线性回归案例分析

中国税收增长的分析 一、研究的目的要求 改革开放以来,随着经济体制的改革深化和经济的快速增长,中国的财政收支状况发生了很大的变化,中央和地方的税收收入1978年为519.28亿元到2002年已增长到17636.45亿元25年间增长了33倍。为了研究中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济学模型。 影响中国税收收入增长的因素很多,但据分析主要的因素可能有:(1)从宏观经济看,经济整体增长是税收增长的基本源泉。(2)公共财政的需求,税收收入是财政的主体,社会经济的发展和社会保障的完善等都对公共财政提出要求,因此对预算指出所表现的公共财政的需求对当年的税收收入可能有一定的影响。(3)物价水平。我国的税制结构以流转税为主,以现行价格计算的DGP等指标和和经营者收入水平都与物价水平有关。(4)税收政策因素。我国自1978年以来经历了两次大的税制改革,一次是1984—1985年的国有企业利改税,另一次是1994年的全国范围内的新税制改革。税制改革对税收会产生影响,特别是1985年税收陡增215.42%。但是第二次税制改革对税收的增长速度的影响不是非常大。因此可以从以上几个方面,分析各种因素对中国税收增长的具体影响。 二、模型设定 为了反映中国税收增长的全貌,选择包括中央和地方税收的‘国家财政收入’中的“各项税收”(简称“税收收入”)作为被解释变量,以放映国家税收的增长;选择“国内生产总值(GDP)”作为经济整体增长水平的代表;选择中央和地方“财政支出”作为公共财政需求的代表;选择“商品零售物价指数”作为物价水平的代表。由于税制改革难以量化,而且1985年以后财税体制改革对税收增长影响不是很大,可暂不考虑。所以解释变量设定为可观测“国内生产总值(GDP)”、“财政支出”、“商品零售物价指数” 从《中国统计年鉴》收集到以下数据 财政收入(亿元) Y 国内生产总值(亿 元) X2 财政支出(亿 元) X3 商品零售价格指 数(%) X4 1978519.283624.11122.09100.7 1979537.824038.21281.79102 1980571.74517.81228.83106

计量经济学实验报告(多元线性回归 自相关 )

实验报告 课程名称计量经济学 实验项目名称多元线性回归自相关 异方差多重共线性班级与班级代码 08国际商务1班实验室名称(或课室)实验楼910 专业国际商务 任课教师刘照德 学号: 043 姓名:张柳文 实验日期: 2011 年 06 月 23日 广东商学院教务处制

姓名张柳文实验报告成绩 评语: 指导教师(签名) 年月日说明:指导教师评分后,实验报告交院(系)办公室保存。

计量经济学实验报告 实验项目:多元线性回归、自相关、异方差、多重共线性 实验目的:掌握多元线性回归模型、自相关模型、异方差模型、多重共线性模型的估计和检验方法和处理方法 实验要求:选择方程进行多元线性回归;熟悉图形法检验和掌握D-W 检验,理解广义差分法变换和掌握迭代法;掌握Park或 Glejser检验,理解同方差性变换; 实验原理:普通最小二乘法图形检验法 D-W检验广义差分变换加权最小二乘法 Park检验等 实验步骤: 首先:选择数据 为了研究影响中国税收收入增长的主要原因,选择国内生产总值(GDP)、财政支出(ED)、商品零售价格指数(RPI)做为解释变量,对税收收入(Y)做多元线性回归。从《中国统计年鉴》2011中收集1978—2009年各项影响因素的数据。如下表所示: 中国税收收入及相关数据

实验一:多元线性回归 1、将数据导入后,分别对三个解释变量与被解释变量做散点图,选择两个变量作为group打开,在数据表“group”中点击view/graph/scatter/simple scatter,出现数据的散点图,分别如下图所示: 从散点图看,变量间不一定呈现线性关系,可以试着作线性回归。 2、进行因果关系检验

多元线性回归模型的案例分析

1. 表1列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ,鸡肉价格P 1,猪肉价格P 2与牛肉价格P 3的相关数据。 年份 Y/千 克 X/ 元 P 1/(元/千克) P 2/(元/千克) P 3/(元/千克) 年份 Y/千克 X/元 P 1/(元/ 千克) P 2/(元/ 千克) P 3/(元/千克) 1980 2.78 397 4.22 5.07 7.83 1992 4.18 911 3.97 7.91 11.40 1981 2.99 413 3.81 5.20 7.92 1993 4.04 931 5.21 9.54 12.41 1982 2.98 439 4.03 5.40 7.92 1994 4.07 1021 4.89 9.42 12.76 1983 3.08 459 3.95 5.53 7.92 1995 4.01 1165 5.83 12.35 14.29 1984 3.12 492 3.73 5.47 7.74 1996 4.27 1349 5.79 12.99 14.36 1985 3.33 528 3.81 6.37 8.02 1997 4.41 1449 5.67 11.76 13.92 1986 3.56 560 3.93 6.98 8.04 1998 4.67 1575 6.37 13.09 16.55 1987 3.64 624 3.78 6.59 8.39 1999 5.06 1759 6.16 12.98 20.33 1988 3.67 666 3.84 6.45 8.55 2000 5.01 1994 5.89 12.80 21.96 1989 3.84 717 4.01 7.00 9.37 2001 5.17 2258 6.64 14.10 22.16 1990 4.04 768 3.86 7.32 10.61 2002 5.29 2478 7.04 16.82 23.26 1991 4.03 843 3.98 6.78 10.48 (1) 求出该地区关于家庭鸡肉消费需求的如下模型: 01213243ln ln ln ln ln Y X P P P u βββββ=+++++ (2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。 先做回归分析,过程如下: 输出结果如下:

巧用Excel解决多元非线性回归分析

农业网络信息 AGRICULTURE NETWORK INFORMATION ·研究与开发· 2011年第1期 巧用Excel 解决多元非线性回归分析 龚江,石培春,李春燕 (石河子大学农学院,石河子832003) 摘 要:非线性回归是回归分析的重要内容和难点,而多元非线性回归在农业生产中有重要的应用。应用Excel “工具” 菜单“数据分析”选项中的“回归”分析工具,以二元二次非线性回归为例,阐述了用Excel 做多元非线性回归的详细过程,并与SPSS 软件做的结果进行比较,证明使用Excel 做多元非线性回归完全可行,且操作简单、易行,并就方程的统计意义进行了分析。 关键词:Excel ;多元;非线性回归中图分类号:S126 文献标识码:A 文章编码:1672-6251(2011)01-0046-03 Application of Excel Software in Multi-nonlinear Regress Analysis GONG Jiang,SHI Peichun,LI Chunyan (Agriculture College of Shihezi Univerity,Shihezi 832003) Abstract:Nonlinear regress analysis was a difficult and significant method of regress analysis ,the application of which was important in agriculture production.In this paper,with the multi-linear regression analysis by “data analysis ”tool of Microsoft Excel as example,a 2times nonlinear regress analysis ’s process was described,and the results showed that the output was same with SPSS software ,then the statistical significance of the 2times nonlinear regress equation was analyzed.Key words:Excel software;multi analysis;nonlinear regress 注:新疆石河子大学农学院一类课程“生物统计学”支助。 作者简介:龚江(1976-),男,硕士,讲师,研究方向:生物统计教学和植物营养。收稿日期:2010-12-10 大量统计软件的问世,使统计分析在科研领域迅速普及应用。众所周知,统计软件如SAS 、SPSS 等虽然功能强大,但较难掌握,并且市面上出售的统计软件大都是盗版软件,不但运行结果的可靠性无法保证,也侵犯了知识产权。对于大多数科研工作者,尤其是基层的科研工作者来说,经常使用的统计软件与涉及的方法也很有限,主要集中在方差分析、回归与相关分析等少数几种方法上,并不需要包罗万象、功能强大的统计软件。而正版统计软件也由于其价格不菲,难以被大多数科研工作者承受。Excel 是Office 家族的一个成员,是功能强大、使用方便的电子表格式数据综合管理与分析系统,可用来记录和整理试验数据。另外,Excel 也具备一些统计运算的功能 [1] ,若能 巧妙地使用,也可以解决一些较为复杂的农业统计运算问题,如多元非线性回归的问题等,其统计结果和 SPSS 软件结果一致。 1Excel 统计功能的安装 单击Microsoft Excel 中文版菜单栏中“工具”的 “加载宏”命令,在“加载宏”对话框中选定“分析工具库”,再按“确定”钮(见图1), “数据分析” 这一项就出现在工具菜单栏中(见图2)。若Excel “工具”中的“加载宏”没有“分析工具库”,则将 Office Excel 中文专业版光盘放入光驱中,运行“安装”程序,点击“添加/删除”按钮,出现“Microsoft Office 维护”对话框后,在“选项”一栏中,选中“Microsoft Excel ”,然后单击“更改选项”按钮,出现新的对话框,再选中“加载宏”继续单击“更改选项”按钮,在新的对话框中选取分析工具库,确定即可,之后按照安装向导的指示即可顺利安装。 图1Excel 统计功能的安装

SPSS多元线性回归分析实例操作步骤

SPSS 统计分析 多元线性回归分析方法操作与分析 实验目的: 引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。 实验变量: 以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。 实验方法:多元线性回归分析法 软件:spss19.0 操作过程: 第一步:导入Excel数据文件 1.open data document——open data——open; 2. Opening excel data source——OK.

第二步: 1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method 选择Stepwise. 进入如下界面: 2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、Casewise diagnostics默认;接着选择Model fit、Collinearity diagnotics;点击Continue.

3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(标准化残差图)中的Histogram、Normal probability plot;点击Continue. 4.点击右侧Save,勾选Predicted Vaniues(预测值)和Residuals(残差)选项组中的Unstandardized;点击Continue.

非线性回归分析(教案)

1.3非线性回归问题, 知识目标:通过典型案例的探究,进一步学习非线性回归模型的回归分析。 能力目标:会将非线性回归模型通过降次和换元的方法转化成线性化回归模型。 情感目标:体会数学知识变化无穷的魅力。 教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的 过程中寻找更好的模型的方法. 教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较. 教学方式:合作探究 教学过程: 一、复习准备: 对于非线性回归问题,并且没有给出经验公式,这时我们可以画出已知数据的散点图,把它与必修模块《数学1》中学过的各种函数(幂函数、指数函数、对数函数等)的图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量代换,把问题转化为线性回归问题,使其得到解决. 二、讲授新课: 1. 探究非线性回归方程的确定: 1. 给出例1:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间的/y 个 2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. ① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模. ② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =2C 1e x C 的周围(其中12,c c 是待定的参数),故可用指数函数模型来拟合这两个变量. ③ 在上式两边取对数,得21ln ln y c x c =+,再令ln z y =,则21ln z c x c =+,可以用线性回归方程来拟合. ④ 利用计算器算得 3.843,0.272a b =-=,z 与x 间的线性回归方程为 0.272 3.843z x =-,因此红铃虫的产卵数对温度的非线性回归方程为0.272 3.843x y e -=. ⑤ 利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行. 其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题. 三、合作探究 例 2.:炼钢厂出钢时所用的盛钢水的钢包,在使用过程中,由于钢液及炉渣对包衬耐火材料的侵蚀,使其容积不断增大,请根据表格中的数据找出使用次数 x 与增大的容积y 之间的关系.

计量经济学多元线性回归、多重共线性、异方差实验报告记录

计量经济学多元线性回归、多重共线性、异方差实验报告记录

————————————————————————————————作者:————————————————————————————————日期:

计量经济学实验报告

多元线性回归、多重共线性、异方差实验报告 一、研究目的和要求: 随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到亿人次,同比增长%,国内旅游收入万亿元,同比增长%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。 影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。 二、模型设定 根据以上的分析,建立以下模型 Y=β 0+β 1 X 1 +β 2 X 2 +β 3 X 3 +β 4 X 4 +Ut 参数说明: Y ——旅游景区营业收入/万元 X 1 ——旅游业从业人员/人 X 2 ——旅游景区固定资产/万元 X 3 ——旅游外汇收入/万美元 X 4 ——城镇居民可支配收入/元

(完整word版)多元线性回归模型案例分析

多元线性回归模型案例分析 ——中国人口自然增长分析一·研究目的要求 中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的5.8降到1980年2.24,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。 影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。 二·模型设定 为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。 从《中国统计年鉴》收集到以下数据(见表1): 表1 中国人口增长率及相关数据

设定的线性回归模型为: 1222334t t t t t Y X X X u ββββ=++++ 三、估计参数 利用EViews 估计模型的参数,方法是: 1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对 话框“Workfile Range ”。在“Workfile frequency ”中选择“Annual ” (年度),并在“Start date ”中输入开始时间“1988”,在“end date ”中输入最后时间“2005”,点击“ok ”,出现“Workfile UNTITLED ”工作框。其中已有变量:“c ”—截距项 “resid ”—剩余项。在“Objects ”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK ”出现数据编辑窗口。 年份 人口自然增长率 (%。) 国民总收入(亿元) 居民消费价格指数增长 率(CPI )% 人均GDP (元) 1988 15.73 15037 18.8 1366 1989 15.04 17001 18 1519 1990 14.39 18718 3.1 1644 1991 12.98 21826 3.4 1893 1992 11.6 26937 6.4 2311 1993 11.45 35260 14.7 2998 1994 11.21 48108 24.1 4044 1995 10.55 59811 17.1 5046 1996 10.42 70142 8.3 5846 1997 10.06 78061 2.8 6420 1998 9.14 83024 -0.8 6796 1999 8.18 88479 -1.4 7159 2000 7.58 98000 0.4 7858 2001 6.95 108068 0.7 8622 2002 6.45 119096 -0.8 9398 2003 6.01 135174 1.2 10542 2004 5.87 159587 3.9 12336 2005 5.89 184089 1.8 14040 2006 5.38 213132 1.5 16024

非线性回归分析

非线性回归问题, 知识目标:通过典型案例的探究,进一步学习非线性回归模型的回归分析。 能力目标:会将非线性回归模型通过降次和换元的方法转化成线性化回归模型。 情感目标:体会数学知识变化无穷的魅力。 教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用. 教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的 过程中寻找更好的模型的方法. 教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较. 教学方式:合作探究 教学过程: 一、复习准备: 对于非线性回归问题,并且没有给出经验公式,这时我们可以画出已知数据的散点图,把它与必修模块《数学1》中学过的各种函数(幂函数、指数函数、对数函数等)的图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量代换,把问题转化为线性回归问题,使其得到解决. 二、讲授新课: 1. 探究非线性回归方程的确定: 1. 给出例1:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据列于下表中,试建立y 与x 之间 2. 讨论:观察右图中的散点图,发现样本点并没有分布在某个带状区域内,即两个变量不呈线性相关关系,所以不能直接用线性回归方程来建立两个变量之间的关系. ① 如果散点图中的点分布在一个直线状带形区域,可以选线性回归模型来建模;如果散点图中的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模. ② 根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y =2C 1e x C 的周围(其中12,c c 是待定的参数),故可用指数函数模型来拟合这两个变量. ③ 在上式两边取对数,得21ln ln y c x c =+ ,再令ln z y =,则21ln z c x c =+, 可以用线性回归方程来拟合. ④ 利用计算器算得 3.843,0.272a b =-=,z 与x 间的线性回归方程为0.272 3.843z x =-$,因此红铃虫的产卵数对温度的非线性回归方程为$0.272 3.843x y e -=. ⑤ 利用回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行. 其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题. 三、合作探究 例 2.:炼钢厂出钢时所用的盛钢水的钢包,在使用过程中,由于钢液及炉渣对包衬耐火材料的侵蚀,使其容积不断增大,请根据表格中的数据找出使用次数x 与增大的容积y 之间的关系.

多元线性回归模型实验报告

多元线性回归模型实验报告 13级财务管理 101012013101 蔡珊珊 【摘要】首先做出多元回归模型,对于解释变量作出logx等变换,选择拟合程度最高的模型,然后判断出解释变量之间存在相关性,然后从检验多重线性性入手,由于解释变量之间有的存在严重的线性性,因此采用逐步回归法,将解释变量进行筛选,保留对模型解释能力较强的解释变量,进而得出一个初步的回归模型,最后对模型进行异方差和自相关检验。 【操作步骤】1.输入解释变量与被解释变量的数据 2.作出回归模型

R^2=0.966951 DW=0.626584 F-statictis=241.3763 ②我们令y1=log(consumption),x4=log(people),x5=log(price),x6=log(retained),x7= log(gdp), 作出回归模型

② 发现拟合程度很高,也通过了F检验与T检验。但是我们首先检查模型的共线性 发现x4与x6,x4与x7,x6与x7存在很强的共线性,对模型会造成严重影响。

目前暂用模型y1=10.55028-3.038439x4-0.236518x5+2.647396x6-0.557805x7,我们将陆续进行调整。 3.分别作出各解释变量与被解释变量之间的线性模型

①作出汽车消费量与汽车保有量之间的线性回归模型 R^2=0.956231 DW=0.147867 F-statistic=786.4967

因为prob小于α置信度,则可说明β1不明显为零。经济意义存在 Y1^=4.142917 + 0.761197x6 (8.283960) (28.04455)

多元非线性回归

多元非线性回归 目录 1 什么是多元非线性回归分析 2 多元非线性回归分析方程 3 多元非线性回归分析模型[1] 什么是多元非线性回归分析 多元非线性回归分析是指包含两个以上变量的非线性回归模型。对多元非线性回归模型求解的传统做法,仍然是想办法把它转化成标准的线性形式的多元回归模型来处理。有些非线性回归模型,经过适当的数学变换,便能得到它的线性化的表达形式,但对另外一些非线性回归模型,仅仅做变量变换根本无济于事。属于前一情况的非线性回归模型,一般称为内蕴的线性回归,而后者则称之为内蕴的非线性回归。 多元非线性回归分析方程 如果自变数X_1,X_2,\cdots,X_m与依变数Y皆具非线性关系,或者有的为非线性有的为线性,则选用多元非线性回归方程是恰当的。例如,二元二次多项式回归方程为:{y}=a+b_{11}x_1+b_{21}x_2+b_{12}x_1^2+b_{22}x_2^2+b_{11 \times22}x_1x_2 令b_1=b_{11},b_2=b_{21},b_3=b_{12},b_4=b_{22},b_5=b_{11\tim es22},及x_3=x_1^2,x_4=x_2^2,x_5=x_1\cdot x_2,于是上式化为

五元一次线性回归方程: \widehat{y}=a+b_1x_1+b_2x_2+b_3x_3+b_4x_4+b_5x_5 这样以来,便可按多元线性回归分析的方法,计算各偏回归系数,建立二元二次多项式回归方程。 多元非线性回归分析模型[1] 一、常见的内蕴多元性回归模型 只要对模型中的变量进行数学变换,比如自然对数变换等,就可以将其转化具有标准形式特征的多元线性回归模型。 1.多重弹性模型 (y_1;x_{11},x_{12}\cdots,x_{1k}),(y_2;x_{21},x_{22}\cdots,x_{2k}),\ cdots,(y_n;x_{n1},x_{n2}\cdots,x_{nk})是一组对的样本观察资料,则称存在下列关系的非线性回归模型为多重弹性模型 y_i=\beta_0x_{i1}^{\beta_1}x_{i2}^{\beta_2}\cdots x_{ik}^{\beta_k}e^{\epsilon_{i}} (1) 上述模型中的各解释变量的幂,能够说明解释变量的相对变化对被解释变量产生的相对影响,我们正式从这一角度说它是多重弹性模型的。 2.Cobb-Dauglas生产函数模型 y_i=AK_{i}^aL_i^{\beta}e^{\epsilon_{i}},i=1,2,\cdots,n (2) 其中,yi表示产出总量,Ki为资本要素,Li为劳动力要素,A、

多元线性回归实例分析

SPSS--回归-多元线性回归模型案例解析!(一) 多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程为: 毫无疑问,多元线性回归方程应该为: 上图中的x1, x2, xp分别代表“自变量”Xp截止,代表有P个自变量,如果有“N组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示: 那么,多元线性回归方程矩阵形式为: 其中:代表随机误差,其中随机误差分为:可解释的误差和不可解释的误差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样) 1:服成正太分布,即指:随机误差必须是服成正太分别的随机变量。 2:无偏性假设,即指:期望值为0 3:同共方差性假设,即指,所有的随机误差变量方差都相等 4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协方差解释。 今天跟大家一起讨论一下,SPSS---多元线性回归的具体操作过程,下面以教程教程数据为例,分析汽车特征与汽车销售量之间的关系。通过分析汽车特征跟汽车销售量的关系,建立拟合多元线性回归模型。数据如下图所示:

点击“分析”——回归——线性——进入如下图所示的界面:

将“销售量”作为“因变量”拖入因变量框内,将“车长,车宽,耗油率,车净重等10个自变量拖入自变量框内,如上图所示,在“方法”旁边,选择“逐步”,当然,你也可以选择其它的方式,如果你选择“进入”默认的方式,在分析结果中,将会得到如下图所示的结果:(所有的自变量,都会强行进入) 如果你选择“逐步”这个方法,将会得到如下图所示的结果:(将会根据预先设定的“F统计量的概率值进行筛选,最先进入回归方程的“自变量”应该是跟“因变量”关系最为密切,贡献最大的,如下图可以看出,车的价格和车轴跟因变量关系最为密切,符合判断条件的概率值必须小于0.05,当概率值大于等于0.1时将会被剔除)

实验六-用SPSS进行非线性回归分析

实验六用SPSS进行非线性回归分析 例:通过对比12个同类企业的月产量(万台)与单位成本(元)的资料(如图1),试配合适当的回归模型分析月产量与单位成本之间的关系

图1原始数据和散点图分析 一、散点图分析和初始模型选择 在SPSS数据窗口中输入数据,然后插入散点图(选择Graphs→Scatter命令),由散点图可以看出,该数据配合线性模型、指数模型、对数模型和幂函数模型都比较合适。进一步进行曲线估计:从Statistic下选Regression菜单中的Curve Estimation命令;选因变量单位成本到Dependent框中,自变量月产量到Independent框中,在Models框中选择Linear、Logarithmic、Power和Exponential四个复选框,确定后输出分析结果,见表1。 分析各模型的R平方,选择指数模型较好,其初始模型为 但考虑到在线性变换过程可能会使原模型失去残差平方和最小的意义,因此进一步对原模型进行优化。 模型汇总和参数估计值 因变量: 单位成本 方程模型汇总参数估计值 R 方 F df1 df2 Sig. 常数b1 线性.912 104.179 1 10 .000 158.497 -1.727 对数.943 166.595 1 10 .000 282.350 -54.059 幂.931 134.617 1 10 .000 619.149 -.556 指数.955 212.313 1 10 .000 176.571 -.018 自变量为月产量。 表1曲线估计输出结果

二、非线性模型的优化 SPSS提供了非线性回归分析工具,可以对非线性模型进行优化,使其残差平方和达到最小。从Statistic下选Regression菜单中的Nonlinear命令;按Paramaters按钮,输入参数A:176.57和B:-.0183;选单位成本到Dependent框中,在模型表达式框中输入“A*EXP(B*月产量)”,确定。SPSS输出结果见表2。 由输出结果可以看出,经过6次模型迭代过程,残差平方和已有了较大改善,缩小为568.97,误差率小于0.00000001, 优化后的模型为: 迭代历史记录b 迭代数a残差平方和参数 A B 1.0 104710.523 176.570 -.183 1.1 5.346E+133 -3455.813 2.243 1.2 30684076640.87 3 476.032 .087 1.3 9731 2.724 215.183 -.160 2.0 97312.724 215.183 -.160 2.1 83887.036 268.159 -.133 3.0 83887.036 268.159 -.133 3.1 59358.745 340.412 -.102 4.0 59358.745 340.412 -.102 4.1 26232.008 38 5.967 -.065 5.0 26232.008 385.967 -.065 5.1 7977.231 261.978 -.038 6.0 797 7.231 261.978 -.038 6.1 1388.850 153.617 -.015 7.0 1388.850 153.617 -.015 7.1 581.073 180.889 -.019 8.0 581.073 180.889 -.019 8.1 568.969 182.341 -.019 9.0 568.969 182.341 -.019 9.1 568.969 182.334 -.019 10.0 568.969 182.334 -.019 10.1 568.969 182.334 -.019 导数是通过数字计算的。 a. 主迭代数在小数左侧显示,次迭代数在小数右侧显示。 b. 由于连续残差平方和之间的相对减少量最多为SSCON = 1.000E-008,因此在 22 模型评估和 10 导数评估之后,系统停止运行。

matlab多元线性回归模型

云南大学数学与统计学实验教学中心 实验报告 一、实验目的 1.熟悉MATLAB的运行环境. 2.学会初步建立数学模型的方法 3.运用回归分析方法来解决问题 二、实验内容 实验一:某公司出口换回成本分析 对经营同一类产品出口业务的公司进行抽样调查,被调查的13家公司,其出口换汇成本与商品流转费用率资料如下表。试分析两个变量之间的关系,并估计某家公司商品流转费用率是6.5%的出口换汇成本. 实验二:某建筑材料公司的销售量因素分析 下表数据是某建筑材料公司去年20个地区的销售量(Y,千方),推销开支、实际帐目数、同类商品

竞争数和地区销售潜力分别是影响建筑材料销售量的因素。1)试建立回归模型,且分析哪些是主要的影响因素。2)建立最优回归模型。 提示:建立一个多元线性回归模型。

三、实验环境 Windows 操作系统; MATLAB 7.0. 四、实验过程 实验一:运用回归分析在MATLAB 里实现 输入:x=[4.20 5.30 7.10 3.70 6.20 3.50 4.80 5.50 4.10 5.00 4.00 3.40 6.90]'; X=[ones(13,1) x]; Y=[1.40 1.20 1.00 1.90 1.30 2.40 1.40 1.60 2.00 1.00 1.60 1.80 1.40]'; plot(x,Y,'*'); [b,bint,r,rint,stats]=regress(Y,X,0.05); 输出: b = 2.6597 -0.2288 bint = 1.8873 3.4322 -0.3820 -0.0757 stats = 0.4958 10.8168 0.0072 0.0903 即==1,0?6597.2?ββ,-0.2288,0?β的置信区间为[1.8873 3.4322],1,?β的置信区间为[-0.3820 -0.0757]; 2r =0.4958, F=10.8168, p=0.0072 因P<0.05, 可知回归模型 y=2.6597-0.2288x 成立. 1 1.5 2 2.5 散点图 估计某家公司商品流转费用率是6.5%的出口换汇成本。将x=6.5代入回归模型中,得到 >> x=6.5; >> y=2.6597-0.2288*x y = 1.1725

多元非线性回归

多元非线性回归分析是一种多元非线性回归模型。传统的求解多元非线性回归模型的方法仍然是将其转化为标准的线性多元回归模型。 一些非线性回归模型通过适当的数学变换可以得到线性化的表达式,而对于其他非线性回归模型,仅仅通过变量变换是没有帮助的。属于前者的非线性回归模型通常称为内在线性回归,而后者称为内在非线性回归。 补充资料:线性回归 线性回归是利用数理统计中的回归分析来确定两个或多个变量之间的定量关系的一种统计分析方法。表达式形式为y=w'x+e,e为误差的正态分布,平均值为0。 在回归分析中,只包含一个自变量和一个因变量,二者之间的关系可用直线近似。这种回归分析称为单变量线性回归分析。如果回归分析包含两个或两个以上的自变量,且因变量与自变量之间是线性关系,则称为多元线性回归分析。 在统计学中,线性回归是一种回归分析,它使用称为线性回归方程的最小二乘函数来建模一个或多个自变量和因变量之间的关系。这个函数是一个或多个模型参数的线性组合,称

为回归系数。只有一个自变量的情况称为简单回归,有多个自变量的情况称为多元回归。(这应该再次通过由多个因变量而不是单个标量变量预测的多元线性回归来区分。)在线性回归中,数据由线性预测函数建模,未知模型参数由数据估计。这些模型称为线性模型。最常用的线性回归模型是仿射函数,其中给定值x的条件平均值为x。在不太常见的情况下,线性回归模型可以是Y或其他分位数条件分布的中值。与所有形式的回归分析一样,线性回归侧重于给定x值的Y的条件概率分布,而不是x和Y的联合概率分布(在多元分析领域)。 线性回归是第一个经过严格研究并在实际应用中得到广泛应用的回归分析方法。这是因为与未知参数线性相关的模型比与位置参数非线性相关的模型更容易拟合,并且更容易确定结果估计值的统计特性。 线性回归模型通常采用最小二乘法进行拟合,但也可以采用其他方法进行拟合,如最小化其他规范中的“拟合缺陷”(如最小绝对误差回归)或最小化桥梁回归的惩罚函数最小二

相关文档
相关文档 最新文档