文档库 最新最全的文档下载
当前位置:文档库 › excel一元及多元线性回归实例

excel一元及多元线性回归实例

excel一元及多元线性回归实例
excel一元及多元线性回归实例

野外实习资料的数理统计分析

一元线性回归分析

一元回归处理的是两个变量之间的关系,即两个变量X和Y之间如果存在一定的关系,则通过观测所得数据,找出两者之间的关系式。如果两个变量的关系大致是线性的,那就是一元线性回归问题。

对两个现象X和Y进行观察或实验,得到两组数值:X1,X2,…,Xn和Y1,Y2,…,Yn,假如要找出一个函数Y=f(X),使它在

X=X1,X2, …,Xn时的数值f(X1),f(X2), …,f(Xn)与观察值Y1,Y2,…,Yn趋于接近。

在一个平面直角坐标XOY中找出(X1,Y1),(X2,Y2),…,(Xn,Yn)各点,将其各点分布状况进行察看,即可以清楚地看出其各点分布状况接近一条直线。对于这种线性关系,可以用数学公式表示:

Y = a + bX

这条直线所表示的关系,叫做变量Y对X的回归直线,也叫Y对X 的回归方程。其中a为常数,b为Y对于X的回归系数。

对于任何具有线性关系的两组变量Y与X,只要求解出a与b的值,即可以写出回归方程。计算a与b值的公式为:

式中:为变量X的均值,Xi为第i个自变量的样本值,为因变量的均值,Yi为第i个因变量Y的样本值。n为样本数。

当前一般计算机的Microsoft Excel中都有现成的回归程序,只要将所获得的数据录入就可自动得到回归方程。

得到的回归方程是否有意义,其相关的程度有多大,可以根据相关系数的大小来决定。通常用r来表示两个变量X和Y之间的直线相关程度,r为X和Y的相关系数。r值的绝对值越大,两个变量之间的相关程度就越高。当r为正值时,叫做正相关,r为负值时叫做负相关。r 的计算公式如下:

式中各符号的意义同上。

在求得了回归方程与两个变量之间的相关系数后,可以利用F检验法、t检验法或r检验法来检验两个变量是否显著相关。具体的检验方法在后面介绍。

2.多元线性回归分析

一元回归研究的是一个自变量和一个因变量的各种关系。但是客观事物的变化往往受到多种因素的影响,即使其中有一个因素起着主导作用,但其它因素的作用也是不可忽视的。因此,我们还需要研究多种变量的关系,这种多个变量之间的关系就叫做多元回归问题。例如,水稻的产量不仅与生长期内的雨量有关,而且与温度也有关系。所以寻求水稻的产量不仅与生长期内的雨量之间的相互关系,就是多元回归问题。

如果假设自变量为X1,X2,…,Xm,因变量为Y,而且因变量与自变量之间是线性的关系,则因变量Y与自变量为X1,X2,…,Xm 的多元线性回归方程为:

Y = a+b1X1+b2X2+…+bmXm

式中:a,b1,b2,bm为常数。

因此,只要能够求出a,b1,b2,…,bm这些常数,就可以得到因变量Y与自变量为X1,X2,…,Xm之间的多元回归方程。具体的算法比较简单,但很烦琐。这里不再叙述。求解多元回归的计算机程序很多,只要将自变量的数据以及与其相对应的因变量的数据输入计算机程序中,立刻就可以求出a,b1,b2,…,bm各常数的值,从而可以获得因变量Y与自变量为X1,X2,…,Xm的多元线性回归方程。

例如,设已知因变量Y的自变量X1,X2,X3,共得18组数据,并已知Y对Xi存在着线性关系,求其回归方程。

样品X1 X2 X3 Y

1 0.4 53 158 64

2 0.4 2

3 163 60

3 3.1 19 37 71

4 0.6 34 157 61

5 4.7 24 59 54

6 1.

7 65 123 77

7 9.4 44 46 81

8 10.1 31 117 93

9 11.6 29 173 93

10 12.6 58 112 51

11 10.9 37 111 76

12 23.1 46 114 96

13 23.1 50 134 77

14 21.6 44 73 93

15 23.1 56 168 95

16 1.9 36 143 54

17 26.8 58 202 168

18 29.9 51 124 99

通过求解,得到a=41.6516b1=1.7410b2=-0.0062b3=0.1553

所以,回归方程为

Y=41.6516+1.7410 X1 -0.0062 X2+0.1553 X3

通常可采用单相关系数、偏相关系数和复相关系数来说明这三个自变量与因变量之间是否有明显的线性关系以及它们之间相关的程度如何。单相关系数是指在不考虑其他因素影响的条件下,所求两个变量之间的相关系数。用rX1X2、rYX1和rYX2分别表示X1和X2、Y 和X1以及Y与X2之间的单相关系数。偏相关系数是指在这三个变量中,将其中一个变量保持常数时,其他两个变量之间的相关系数。用rYX1X2和rYX2X1分别表示X2为常数时,Y与X1的偏相关系数和X1为常数时,Y与X2的偏相关系数。偏相关系数可以用单相关系数求得。当这三个变量中,同时考虑两个变量对另一个变量相关系数时,叫做复相关系数。用r(X1X2)Y表示X1和X2、两个自变量对于Y的复相关系数。

3.方差分析

方差分析法是分析多组平均数之间差异显著性时常用的一种统计方法。方差(或均方)是一个表示变异程度的量,它是离均差的平方和与自由度之商。在一项实验或调查中往往存在着许多造成生物形状变异的因素,这些因素有比较重要的,也有较次要的。分析时主要是把平方和与自由度按不同的变异起因分解为若干部分,从而构成来自不

同起因的方差。利用它来检验各组平均数之间差异的显著性。在正态总体及方差相同的基本假定下,我们将利用方差比给出F分布的检验统计量。因此这种方法称为方差分析法。

方差分析是分析和处理试验或观测数据的主要方法之一。它首先被应用于农业试验,目前它在农业、工业、生物、医学等各部门有着广泛的应用。方差分析的方法往往与试验设计的方式紧密地联系在一起。对于从不同试验设计中得出观测资料,进行方差分析时将有不同的计算方法,类型繁多,但其基本原理却大同小异。在这里将结合一个较简单的例子介绍方差分析的数学模型和基本方法,以便于读者对方差分析的方法有一个大致的了解。

在实验设计的基础上,分组试验,如分为a组,每组作b个水平的试验,共得到a×b个数据。然后,算出组平均值和总平均值,组内和组间的离差平方和,组内和组间方差,作F检验。

F=组间方差/组内方差

假设HO: μ1 =μ2=···=μb ,表示各水平的均值相等。当 F ≤Fα 时,HO: 真;当F > Fα时,HO:假。

试验中必不可少地会产生误差。误差有两种:条件误差和试验误差。前者是由试验条件不同而引起的系统性误差,后者是在相同试验条件下引起的随机误差。

例如,把四种不同的饲料分别喂给4组小鸡,每组5只,它们的增重情况如下:

组别增重(Xij)

1 5549422152

2 61112308963

3 4297819592

4 16913716885153

试问四组小鸡在平均增重量方面有没有明显的差别?

通过计算,得到组内和组间方差分别为719.2和8706.3,因此,

F=8706.3/719.2=12.1

对于给定的显著性水平α,将有临界值Fα一,当α=0.01时,

F0.01(3,16)=5.3,其中3与16是自由度。

所以F=12.1>5.3= F0.01(3,16)

故,否定各种饲料效果一致的假设,可以认为四种饲料的效果有极明显的差别。

目前现成的计算机方差分析计算程序很多,如SPASS、SAS软件等,将数据输入后,都可以直接计算,并按要求输出结果。

上述例子是单因素的方差分析,比较简单。对于多因素的方差分析,由于比较复杂,这里就不再叙述了。

4. T检验

生物学中所遇到的绝大多数问题,总体标准差σ都是未知的。在σ

未知时,平均数的显著性检验有两种解决方法。其一是根据以往的经验或从类似的工作中估计出一个σ值,用这个σ做μ检验。使用估计的σ做检验并不是很可靠的。因此在实际工作中,一般不用这种方法而广泛使用t检验。

对于一个正态分布总体,若σ未知则服从n-1自由度的t分布,因此,在σ未知时可以用t检验做平均数的显著性检验。

t检验的零假设H0为:μ=μ0

备择假设有以下三种情况:(1)HA:μ>μ0,若已知μ不可能小于μ0;(2)HA:μ<μ0,若已知μ不可能大于μ0;(3)HA:μ≠μ0,包括μ>μ0和μ<μ0 。

三种备择假设的拒绝域为:

(1)t>tα ;(2)t< -tα;(3)t > tα/2,或表示为t > tα(双侧)。其中α为给定的显著性水平。

t检验的统计量为:

t = (-μ0)/(s/n1/2)

例如,已知玉米单交种群单105的平均穗重μ0=300克,喷药后,随机抽取9个果穗,其穗重为分别:308、305、311、298、315、300、321、294、320克。问喷药后与喷药前的果穗重差异是否显著?

根据上面介绍的基本程序:

已知玉米穗重是服从正态分布的随机变量,σ未知。

(2)假设:H0 :μ=μ0=300HA:μ≠μ0=300

由于问题要求检验的是“果穗重差异是否显著”,并没有明确穗重一定增加或一定减少,所以备择假设为HA:μ≠μ0

(3)显著性水平:根据实验的要求(差异是否“显著”)规定α=0.05。(4)统计量的值:由于σ未知需使用t检验。

t = (-μ0)/(s/n1/2)

t = (308-3000)/(9.62/91/2)=2.49

(5)建立的拒绝域H0:因HA:μ≠μ0,所以是双侧检验。当t > t0.05(双侧)时拒绝H0,α=0.05时,经查表t8,0.05(双侧)=2.306。

(6)结论:因t =2.49> t8,0.05(双侧)=2.306 ,所以结论是拒绝H0,接受HA。即喷药前后果穗重的差异是显著的。

5. F检验

t检验属于单个样本的显著性检验,即在样本统计量与零假设所提出的总体参量之间做比较。这种检验需要我们事先能够提出合理的参量假设值和对参量有某种意义的备择值。然而,在实际工作中,很难提出这样的假设值及备择值。因此,限制了这种方法在实际工作中的应用。

为了避免上述问题的出现,在实际应用时,常常选择两个样本,一个作为处理,一个作为对照。在这两个样本之间做比较。判断它们之间是否存在足够显著的差异。当它们之间的差异不能用偶然性解释时,则认为它们之间存在足够显著的差异,这两个样本来自两个不同的总体。而F检验是关于两个方差的检验,所以常用F检验来解决上述问题。

F检验的程序概述如下:

(1)假定从两个正态总体中,独立地抽取含量分别为n1和n2的两个随机样本,计算出s12和s22。总体平均数μ1和μ2可以相等也可以不相等。

(2)零假设H0为:σ1=σ2

备择假设有以下三种情况:(1)HA:σ1>σ2,若已知σ1不可能小于σ2;(2)HA:σ1<σ2,若已知σ1不可能大于σ2;(3)HA:σ1≠σ2 ,包括σ1>σ2和σ1<σ2 。

(3)显著性水平:经常用α=0.05和α=0.01两个水平。

(4)检验的统计量:F(n1-1),(n2-1)经= s12 /s22

(5)建立H0的拒绝域:

对于HA:σ1>σ2σ1<σ2,应做上尾单侧检验,当F>Fα时拒绝H0;对于HA:σ1<σ2,应做下尾单侧检验,当F

对于HA:σ1≠σ2 ,应做双侧检验,当F>Fα/2及F

多元线性回归模型的案例分析

1. 表1列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ,鸡肉价格P 1,猪肉价格P 2与牛肉价格P 3的相关数据。 年份 Y/千 克 X/ 元 P 1/(元/千克) P 2/(元/千克) P 3/(元/千克) 年份 Y/千克 X/元 P 1/(元/ 千克) P 2/(元/ 千克) P 3/(元/千克) 1980 2.78 397 4.22 5.07 7.83 1992 4.18 911 3.97 7.91 11.40 1981 2.99 413 3.81 5.20 7.92 1993 4.04 931 5.21 9.54 12.41 1982 2.98 439 4.03 5.40 7.92 1994 4.07 1021 4.89 9.42 12.76 1983 3.08 459 3.95 5.53 7.92 1995 4.01 1165 5.83 12.35 14.29 1984 3.12 492 3.73 5.47 7.74 1996 4.27 1349 5.79 12.99 14.36 1985 3.33 528 3.81 6.37 8.02 1997 4.41 1449 5.67 11.76 13.92 1986 3.56 560 3.93 6.98 8.04 1998 4.67 1575 6.37 13.09 16.55 1987 3.64 624 3.78 6.59 8.39 1999 5.06 1759 6.16 12.98 20.33 1988 3.67 666 3.84 6.45 8.55 2000 5.01 1994 5.89 12.80 21.96 1989 3.84 717 4.01 7.00 9.37 2001 5.17 2258 6.64 14.10 22.16 1990 4.04 768 3.86 7.32 10.61 2002 5.29 2478 7.04 16.82 23.26 1991 4.03 843 3.98 6.78 10.48 (1) 求出该地区关于家庭鸡肉消费需求的如下模型: 01213243ln ln ln ln ln Y X P P P u βββββ=+++++ (2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。 先做回归分析,过程如下: 输出结果如下:

excel一元及多元线性回归实例

野外实习资料的数理统计分析 一元线性回归分析 一元回归处理的是两个变量之间的关系,即两个变量X和Y之间如果存在一定的关系,则通过观测所得数据,找出两者之间的关系式。如果两个变量的关系大致是线性的,那就是一元线性回归问题。 对两个现象X和Y进行观察或实验,得到两组数值:X1,X2,…,Xn和Y1,Y2,…,Yn,假如要找出一个函数Y=f(X),使它在 X=X1,X2, …,Xn时的数值f(X1),f(X2), …,f(Xn)与观察值Y1,Y2,…,Yn趋于接近。 在一个平面直角坐标XOY中找出(X1,Y1),(X2,Y2),…,(Xn,Yn)各点,将其各点分布状况进行察看,即可以清楚地看出其各点分布状况接近一条直线。对于这种线性关系,可以用数学公式表示: Y = a + bX 这条直线所表示的关系,叫做变量Y对X的回归直线,也叫Y对X 的回归方程。其中a为常数,b为Y对于X的回归系数。 对于任何具有线性关系的两组变量Y与X,只要求解出a与b的值,即可以写出回归方程。计算a与b值的公式为:

式中:为变量X的均值,Xi为第i个自变量的样本值,为因变量的均值,Yi为第i个因变量Y的样本值。n为样本数。 当前一般计算机的Microsoft Excel中都有现成的回归程序,只要将所获得的数据录入就可自动得到回归方程。 得到的回归方程是否有意义,其相关的程度有多大,可以根据相关系数的大小来决定。通常用r来表示两个变量X和Y之间的直线相关程度,r为X和Y的相关系数。r值的绝对值越大,两个变量之间的相关程度就越高。当r为正值时,叫做正相关,r为负值时叫做负相关。r 的计算公式如下: 式中各符号的意义同上。 在求得了回归方程与两个变量之间的相关系数后,可以利用F检验法、t检验法或r检验法来检验两个变量是否显著相关。具体的检验方法在后面介绍。

多元线性回归模型练习题及答案.doc

ESS&i-k)A RSS[(k -1) ESS /(SI)I). TSS/(n-k) 多元线性回归模型练习 一、单项选择题 1. 在由〃 =30的一组样本估计的、包含3个解释变量的线性回归模型中,计算 得可决系数为0.8500,则调整后的可决系数为(D ) A. 0. 8603 B. 0. 8389 C. 0. 8655 D. 0. 8327 2. 用一组有30个观测值的样本估计模型乂 =如玷气+E +0后,在0. 05的 显著性水平上对九的显著性作「检验,则气显著地不等于零的条件是其统计量, 大于等于 (C ) A. ,O .O 5(3°) B . ‘。025(28) c.,。。25(27) p ^*0.025 (^28) 3?线性回归模型乂 =4+"1也+勾% +……+ b k x h +u i 中,检验 =0(,= 0,1,2,..人)时,所用的统计量 服从(C ) A. t (n _k+l ) B. t (n -k -2) C. t (n -k _l ) D. t (n -k+2) 4. 调整的可决系数与多元样本判定系数R ,之间有如下关系( D ) 局=公—/?2 职=]_qj R2 A. n-k -1 B ? n-k-\ R 2=[—- (1 + R2) 斤 2 =]— (I-/?2) C. n-k-\ D. n-k-\ 5. 对模型Y L B 。+ B 伏"B 2X 2i + u 「进行总体显著性F 检验,检验的零假设是 (A ) A. P 1= 3 2=0 B. 3 i=0 C. B 2-O D. B 0二0 或 B i=0 6. 设k 为[q 归模型中的参数个数,n 为样本容量。则对多元线性同归方程进行 显著性检验时,所用的F 统计量可表示为(B ) R2/ k B (1-R2)/(D b/d) c. (1-R2)/(S1) 7. 多元线性问归分析中(回归模型中的参数个数为k ),调整后的可决系数与 可决系数R2之间的关系(A )

eviews多元线性回归案例分析

中国税收增长的分析 一、研究的目的要求 改革开放以来,随着经济体制的改革深化和经济的快速增长,中国的财政收支状况发生了很大的变化,中央和地方的税收收入1978年为519.28亿元到2002年已增长到17636.45亿元25年间增长了33倍。为了研究中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济学模型。 影响中国税收收入增长的因素很多,但据分析主要的因素可能有:(1)从宏观经济看,经济整体增长是税收增长的基本源泉。(2)公共财政的需求,税收收入是财政的主体,社会经济的发展和社会保障的完善等都对公共财政提出要求,因此对预算指出所表现的公共财政的需求对当年的税收收入可能有一定的影响。(3)物价水平。我国的税制结构以流转税为主,以现行价格计算的DGP等指标和和经营者收入水平都与物价水平有关。(4)税收政策因素。我国自1978年以来经历了两次大的税制改革,一次是1984—1985年的国有企业利改税,另一次是1994年的全国范围内的新税制改革。税制改革对税收会产生影响,特别是1985年税收陡增215.42%。但是第二次税制改革对税收的增长速度的影响不是非常大。因此可以从以上几个方面,分析各种因素对中国税收增长的具体影响。 二、模型设定 为了反映中国税收增长的全貌,选择包括中央和地方税收的‘国家财政收入’中的“各项税收”(简称“税收收入”)作为被解释变量,以放映国家税收的增长;选择“国内生产总值(GDP)”作为经济整体增长水平的代表;选择中央和地方“财政支出”作为公共财政需求的代表;选择“商品零售物价指数”作为物价水平的代表。由于税制改革难以量化,而且1985年以后财税体制改革对税收增长影响不是很大,可暂不考虑。所以解释变量设定为可观测“国内生产总值(GDP)”、“财政支出”、“商品零售物价指数” 从《中国统计年鉴》收集到以下数据 财政收入(亿元) Y 国内生产总值(亿 元) X2 财政支出(亿 元) X3 商品零售价格指 数(%) X4 1978519.283624.11122.09100.7 1979537.824038.21281.79102 1980571.74517.81228.83106

SPSS多元线性回归分析实例操作步骤

SPSS 统计分析 多元线性回归分析方法操作与分析 实验目的: 引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。 实验变量: 以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。 实验方法:多元线性回归分析法 软件:spss19.0 操作过程: 第一步:导入Excel数据文件 1.open data document——open data——open; 2. Opening excel data source——OK.

第二步: 1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method 选择Stepwise. 进入如下界面: 2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、Casewise diagnostics默认;接着选择Model fit、Collinearity diagnotics;点击Continue.

3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(标准化残差图)中的Histogram、Normal probability plot;点击Continue. 4.点击右侧Save,勾选Predicted Vaniues(预测值)和Residuals(残差)选项组中的Unstandardized;点击Continue.

EXCEL在多元线性回归分析中的应用

EXCEL 在多元线性回归分析中的应用 高 平/文 在一元线性回归分析中,重点放在了用模 型中的一个自变量X 来估计因变量Y 。实际 上,由于客观事物的联系错综复杂,一个因变 量的变化往往受到两个或多个自变量的影响。 为了全面揭示这种复杂的依存关系,准确地 测定它们的数量变动,提高预测和控制的精确 度,就要考虑更多的自变量,建立多元回归模 型。多元回归分析的原理和方法同一元线性回归分析基本相同,但有两个不同点:1.不能用散点图来表示变量之间的关系。2.多元回归的计算难度要远大于简单线性回归,且变量越多,计算越复杂。但应用EXCEL 来完成计算将变得简单和轻松。 以下图中的数据为例: 多元线性回归的EXCEL 数据分析操作 方法首先单击工具栏,在弹出的菜单中选择 数据分析 ,在数据分析工具的选项框中选中 回归 ,然后在输入、输出选项以及有关的选项框中进行适当的选择,必须注意在进行自变量X 的输入时要按照已经确定的各个自变量的顺序把所有自变量的单元格引用范围一起 放在X 值的输入区域内。见下图 :!27!

点击 确定按钮,即可得到线性回归分析的结果。见下图: ! ! 28

根据上图中的显示结果,可直接写出二元线性回归方程: Y i=b0+b1X1i+b2X2i=-51.3127+1. 4053x1i+6.3823x2i b1表示在促销费用固定时,商店的规模大小每增加1平方米,年销售额平均增加1.4053万元;b2表示在商店的规模大小固定时,促销费用每增加1万元,年销售额平均增加6.3823万元。这里b1即商店的规模大小的回归系数比一元线性回归方程中的回归系数b= 1.6246小,是因为一元线性回归方程只考虑了商店的规模大小对年销售额的影响,忽略了促销费用这一很重要的因素,在商店的规模大小的影响中渗入了促销费用的影响。这里的截距b0=-51.3127万元,与一元线性回归方程中的截距+99.01万元有很大的不同,因为X1=0和X2 =0都不在X1、X2的样本取值范围之内,因而对截距项的解释要非常谨慎。 判定系数等于85.14%,表明在年销售额的变动中,有85.14%可由商店规模大小和促销费用多少这两个因素的变动来解释,只有14.86%的因素属于随机误差。引进了第二个自变量之后,回归方程的判定系数85.14%,比一元线性回归方程的判定系数77.68%提高了7.46个百分点。但需注意,在一般情况下,增加自变量,即使这个自变量在统计上并不显著,也会使判定系数的值增大。 年平均销售额的估计标准误差为112. 1015万元,引进了第二个自变量促销费用之后,回归方程的估计标准误差比一元线性回归方程的估计标准误差131.99万元有了下降,说明多元线性回归方程的代表性高于一元线性回归方程。 设显著性水平 =0.05,b1的检验统计量t=6.2817;b2的检验统计量t=2.4538,查t 表知t0.05/2(15-3)= 2.1788。因为6. 2817> 2.1788, 2.4538>2.1788。因此拒绝H0:1=0、H0:2=0的假设,认为这两个回归系数在统计上都是显著的。需注意的是,若此例的显著性水平=0.01,不是0.05,则t0. 01/2(15-3)= 3.0545。虽然6.2817> 3. 0545,但是2.4538< 3.0545,因此仍要拒绝H0: 1=0的假设,但无法拒绝、H0: 2=0的假设,所以第二个回归系数在统计上不是非常显著。 设计显著性水平 =0.05,查得F0.05(2, 12)=3.89。F=34.38>F0.05(2,12)= 3.8,所以拒绝原假设,表明样本的r2是显著的,由此推论已建立的二元线性回归模型有效。所谓复相关,是指一个因变量同多个自变量之间的相关关系。所有自变量共同变动时,因变量随之变动,其相关程度就可用复相关系数来测定。该例中商店规模大小、促销费用和年销售额三个变量的复相关系数为0.9227。计算结果表明,商店规模大小、促销费用作为一个整体影响因素同年销售额存在高度相关,其相关程度比一元回归中商店规模大小单个自变量同年销售额的相关系数更高。但需要强调是当我们研究的客观事物本质上属于多因素影响的变量时,用多元回归、复相关和偏相关分析,比一元回归和单相关分析更为真实和准确。 (作者单位:省统计局) (下接第37页) 3、加强普查队伍的建设与培训。农业普查不仅工作量大,而且专业性强,数据质量要求高。能否建立一支业务过硬、作风严谨、责任心强的高素质普查队伍,关系到普查的成败。因此,各级、各部门特别是县区政府一定要按照普查办法的要求,把好人员选聘和培训关,选调业务过硬、作风严谨、责任心强的人员充实到各级普查机构。与此同时,要认真做好普查培训和切实搞好普查试点工作,使所有普查人员明确普查指标的内容含义、要求及普查指标间的逻辑关系,准确把握普查的难点内容和问题,尤其要学会如何利用被调查对象的总体情况,现场分析评估被调查对象申报的数据,当场修改不实数据,确保各类普查数据的真实性。 4、加强依法普查,确保普查质量。各级、各有关部门要以这次普查为契机,加大统计普法力度,使各级普查机构严格按照?中华人民共和国统计法#的有关规定和普查的具体要求,克服困难,依法实事求是认真调查和填报,不弄虚作假,使各被调查单位和农户如实填报普查表,不虚报、瞒报。 总之,要确保此次普查情况不失真,调查数字不含水,统计数据不掺假,经得起实践的检验、群众的检验和历史的检验,为更好地推进新农村建设,获取真实的 三农数据。做到这一要求,只要有好的方案,通过法制手段、宣传手段、培训手段和市场经济手段等多种措施,解决了人的问题,包括各级领导、各级普查人员、各被调查对象的认识问题、思想问题,普查的难点会迎刃而解。否则,别无他法。 (作者单位:山东省沂南统计局 文登统计局) ! 29 !

多元线性回归模型案例

我国农民收入影响因素的回归分析 本文力图应用适当的多元线性回归模型,对有关农民收入的历史数据和现状进行分析,探讨影响农民收入的主要因素,并在此基础上对如何增加农民收入提出相应的政策建议。?农民收入水平的度量常采用人均纯收入指标。影响农民收入增长的因素是多方面的,既有结构性矛盾因素,又有体制性障碍因素。但可以归纳为以下几个方面:一是农产品收购价格水平。二是农业剩余劳动力转移水平。三是城市化、工业化水平。四是农业产业结构状况。五是农业投入水平。考虑到复杂性和可行性,所以对农业投入与农民收入,本文暂不作讨论。因此,以全国为例,把农民收入与各影响因素关系进行线性回归分析,并建立数学模型。 一、计量经济模型分析 (一)、数据搜集 根据以上分析,我们在影响农民收入因素中引入7个解释变量。即:2x -财政用于农业的支出的比重,3x -第二、三产业从业人数占全社会从业人数的比重,4x -非农村人口比重,5x -乡村从业人员占农村人口的比重,6x -农业总产值占农林牧总产值的比重,7x -农作物播种面积,8x —农村用电量。

资料来源《中国统计年鉴2006》。 (二)、计量经济学模型建立 我们设定模型为下面所示的形式: 利用Eviews 软件进行最小二乘估计,估计结果如下表所示: DependentVariable:Y Method:LeastSquares Sample: Includedobservations:19 Variable Coefficient t-Statistic Prob. C X1 X3 X4 X5 X6 X7 X8 R-squared Meandependentvar AdjustedR-squared 表1最小二乘估计结果 回归分析报告为: () ()()()()()()()()()()()()()()() 2345678 2? -1102.373-6.6354X +18.2294X +2.4300X -16.2374X -2.1552X +0.0100X +0.0634X 375.83 3.7813 2.066618.37034 5.8941 2.77080.002330.02128 -2.933 1.7558.820900.20316 2.7550.778 4.27881 2.97930.99582i Y SE t R ===---=230.99316519 1.99327374.66 R Df DW F ====二、计量经济学检验 (一)、多重共线性的检验及修正 ①、检验多重共线性 (a)、直观法 从“表1最小二乘估计结果”中可以看出,虽然模型的整体拟合的很好,但是x4x6

案例分析报告(一元线性回归模型)

案例分析报告(2014——2015学年第一学期) 课程名称:预测与决策 专业班级:电子商务1202 学号: 02 学生姓名:陈维维 2014 年 11月

案例分析(一元线性回归模型) 我国城镇居民家庭人均消费支出预测 一、研究目的与要求 居民消费在社会经济的持续发展中有着重要的作用,居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。从理论角度讲,消费需求的具体内容主要体现在消费结构上,要增加居民消费,就要从研究居民消费结构入手,只有了解居民消费结构变化的趋势和规律,掌握消费需求的热点和发展方向,才能为消费者提供良好的政策环境,引导消费者合理扩大消费,才能促进产业结构调整与消费结构优化升级相协调,才能推动国民经济平稳、健康发展。例如,2008年全国城镇居民家庭平均每人每年消费支出为元,最低的青海省仅为人均元,最高的上海市达人均元,上海是黑龙江的倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定 我研究的对象是各地区居民消费的差异。居民消费可分为城镇居民消费和农村居民消费,由于各地区的城镇与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城镇居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。 所以模型的被解释变量Y选定为“城镇居民每人每年的平均消费支出”。 因为研究的目的是各地区城镇居民消费的差异,并不是城镇居民消费在

(完整版)多元线性回归模型习题及答案

多元线性回归模型 一、单项选择题 1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定系数为0.8500,则调整后的多重决定系数为( D ) A. 0.8603 B. 0.8389 C. 0.8655 D.0.8327 2.下列样本模型中,哪一个模型通常是无效的(B ) A. i C (消费)=500+0.8 i I (收入) B. d i Q (商品需求)=10+0.8i I (收入)+0.9i P (价格) C. s i Q (商品供给)=20+0.75i P (价格) D. i Y (产出量)=0.650.6i L (劳动)0.4 i K (资本) 3.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后,在0.05的显著性水 平上对1 b 的显著性作t 检验,则1 b 显著地不等于零的条件是其统计量t 大于等于( C ) A. )30(05.0t B. ) 28(025.0t C. ) 27(025.0t D. ) 28,1(025.0F 4.模型 t t t u x b b y ++=ln ln ln 10中,1b 的实际含义是( B ) A.x 关于y 的弹性 B. y 关于x 的弹性 C. x 关于y 的边际倾向 D. y 关于x 的边际倾向 5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( C ) A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度 6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...) t H b i k ==时,所用的统计量 服从( C ) A.t(n-k+1) B.t(n-k-2) C.t(n-k-1) D.t(n-k+2)

用EXCEL进行生产函数的多元线性回归分析

用EXCEL进行生产函数的多元线性回归分析 一、相关函数 EXCEL电子制表系统中函数的语法分为函数名和参数两部分,参数用圆括号括起来,之间以逗号隔开。参数可以为单元格区域、数组、函数、常数(逻辑型、数值型等)。 进行回归分析时,主要采用线性回归函数LINEST,辅以使用索引取值INDEX与四舍五入ROUND函数。 1、线性回归函数LINEST。 使用最小二乘法对已知数据进行最佳直线拟合,并返回描述此直线的数组。因为此函数返回数值数组,所以必须以数组公式的形式输入。 该函数的功能为:运算结果返回一线性回归方程的参数,即当已知一组混合成本为Y因变量序列值、N组Xi有关自变量因素的数量序列值时,函数返回回归方程的系数bi(i=1,2…n单位变动成本)和常数a(固定成本或费用)。 多元回归方程模型则为:y=b1x1+b2X2……+bnXn+a 语法 LINEST(known_y's,known_x's,const,stats) Known_y's 是关系表达式 y = mx + b 中已知的 y 值集合。 ?如果数组 known_y's 在单独一列中,则 known_x's 的每一列被视为一个独立的变量。 ?如果数组 known-y's 在单独一行中,则 known-x's 的每一行被视为一个独立的变量。 Known_x's 是关系表达式 y = mx + b 中已知的可选 x 值集合。 ?数组 known_x's 可以包含一组或多组变量。如果只用到一个变量,只要 known_y's 和 known_x's 维数相同,它们可以是任何形状的区域。如果用到多个变量,则 known_y's 必须为向量(即必须为一行或一列)。 ?如果省略 known_x's,则假设该数组为 {1,2,3,...},其大小与 known_y's 相同。Const 为一逻辑值,用于指定是否将常量 b 强制设为 0。 ?如果 const 为 TRUE 或省略,b 将按正常计算。 ?如果 const 为 FALSE,b 将被设为 0,并同时调整 m 值使 y = mx。 Stats 为一逻辑值,指定是否返回附加回归统计值。 ?如果 stats 为 TRUE,则 LINEST 函数返回附加回归统计值,这时返回的数组为{mn,mn-1,...,m1,b;sen,sen-1,...,se1,seb;r2,sey;F,df;ssreg,ssresid}。

(完整word版)多元线性回归模型案例分析

多元线性回归模型案例分析 ——中国人口自然增长分析一·研究目的要求 中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的5.8降到1980年2.24,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。 影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。 二·模型设定 为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。 从《中国统计年鉴》收集到以下数据(见表1): 表1 中国人口增长率及相关数据

设定的线性回归模型为: 1222334t t t t t Y X X X u ββββ=++++ 三、估计参数 利用EViews 估计模型的参数,方法是: 1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对 话框“Workfile Range ”。在“Workfile frequency ”中选择“Annual ” (年度),并在“Start date ”中输入开始时间“1988”,在“end date ”中输入最后时间“2005”,点击“ok ”,出现“Workfile UNTITLED ”工作框。其中已有变量:“c ”—截距项 “resid ”—剩余项。在“Objects ”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK ”出现数据编辑窗口。 年份 人口自然增长率 (%。) 国民总收入(亿元) 居民消费价格指数增长 率(CPI )% 人均GDP (元) 1988 15.73 15037 18.8 1366 1989 15.04 17001 18 1519 1990 14.39 18718 3.1 1644 1991 12.98 21826 3.4 1893 1992 11.6 26937 6.4 2311 1993 11.45 35260 14.7 2998 1994 11.21 48108 24.1 4044 1995 10.55 59811 17.1 5046 1996 10.42 70142 8.3 5846 1997 10.06 78061 2.8 6420 1998 9.14 83024 -0.8 6796 1999 8.18 88479 -1.4 7159 2000 7.58 98000 0.4 7858 2001 6.95 108068 0.7 8622 2002 6.45 119096 -0.8 9398 2003 6.01 135174 1.2 10542 2004 5.87 159587 3.9 12336 2005 5.89 184089 1.8 14040 2006 5.38 213132 1.5 16024

多元线性回归模型练习题及答案

多元线性回归模型练习 一、单项选择题 1. 在由n =30的一组样本估计的、包含3个解释变量的线性回归模型中,计算 得 可决系数为0.8500,贝U 调整后的可决系数为(D ) A. 0.8603 B. 0.8389 C. 0.8655 D.0.8327 2. 用一组有30个观测值的样本估计模型 y t =b o ? b i x it b 2 X 2t U t 后,在0.05的 显著 性水平上对b l 的显著性作t 检验,则b l 显著地不等于零的条件是其统计量 t 大于等于(C ) A t o 』5(3O ) B t o.025 (28) C t o.o25(27) D F 0.025 (1,28) 3. 线性回归模型y t =b ° "旳+6x 21 + ............ +b k X kt +4中,检验 A H o :b =0(i 二。,1,2 ,.*)时,所用的统计量 / ■■ ■X 服从(C ) A.t (n-k+1) B.t (n-k-2) C.t (n-k-1) D.t( n k+2) 4. 调整的可决系数 :与多元样本判定系数: ‘之间有如下关系( D) R 2= n " R 2 R 2 =1 - n " R 2 A . n- k-1 B. n -k -1 R 2=1 - n " (1 R 2) R 2 =1 - n " (1-R 2 ) C n —k -1 D. n- k-1 5.对模型Y = B 0+ B 1X i + B 2X 2i + 卩 i 进行总体显著性F 检验,检验的零假设是 A ) A . B 1= B 2=0 B. B 1=0 C .B 2=0 D. B 0=0 或 B 1=0 6?设 k 为回归模型中的参数个数,n 为样本容量。则对多元线性回归方程进 行显著性检验时,所用的F 统计量可表示为( B ) ESS (n-k ) 一k A. RSS (k-1) B . (1-R 2 )/(n —k — 1 ) R 2 (n - k) C. (1 - R 2) '(k-1) 7.多元线性回归分析中(回归模型中的参数个数为 k ),调整后的可决系数 R 2与可决系数R 2之间的关系( A ) n -1 R 2 =1 _(1 _R 2 ) ESS/(k-1) D. TSS (n-k)

Excel大数据分析报告工具进行多元回归分析报告

使用Excel数据分析工具进行多元回归分析 使用Excel数据分析工具进行多元回归分析与简单的回归估算分析方法基本相同。但是由于有些电脑在安装办公软件时并未加载数据分析工具,所以从加载开始说起(以Excel2010版为例,其余版本都可以在相应界面找到)。 点击“文件”,如下图: 在弹出的菜单中选择“选项”,如下图所示: 在弹出的“选项”菜单中选择“加载项”,在“加载项”多行文本框中使用滚动条找到并选中“分析工具库”,然后点击最下方的“转到”,如下图所示:

在弹出的“加载宏”菜单中选择“分析工具库”,然后点击“确定”,如下图所示: 加载完毕,在“数据”工具栏中就出现“数据分析”工具库,如下图所示:

给出原始数据,自变量的值在A2:I21单元格区间中,因变量的值在J2:J21中,如下图所示: 假设回归估算表达式为: 试使用Excel数据分析工具库中的回归分析工具对其回归系数进行估算并进行回归分析:点击“数据”工具栏中中的“数据分析”工具库,如下图所示: 在弹出的“数据分析”-“分析工具”多行文本框中选择“回归”,然后点击“确定”,如下图所示:

弹出“回归”对话框并作如下图的选择: 上述选择的具体方法是: 在“Y值输入区域”,点击右侧折叠按钮,选取函数Y数据所在单元格区域J2:J21,选完后再单击折叠按钮返回;这过程也可以直接在“Y值输入区域”文本框中输入J2:J21; 在“X值输入区域”,点击右侧折叠按钮,选取自变量数据所在单元格区域A2:I21,选完后再单击折叠按钮返回;这过程也可以直接在“X值输入区域”文本框中输入A2:I21; 置信度可选默认的95%。 在“输出区域”如选“新工作表”,就将统计分析结果输出到在新表内。为了比较对照,我选本表内的空白区域,左上角起始单元格为K10.点击确定后,输出结果如下:

多元线性回归实例分析

SPSS--回归-多元线性回归模型案例解析!(一) 多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程为: 毫无疑问,多元线性回归方程应该为: 上图中的x1, x2, xp分别代表“自变量”Xp截止,代表有P个自变量,如果有“N组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示: 那么,多元线性回归方程矩阵形式为: 其中:代表随机误差,其中随机误差分为:可解释的误差和不可解释的误差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样) 1:服成正太分布,即指:随机误差必须是服成正太分别的随机变量。 2:无偏性假设,即指:期望值为0 3:同共方差性假设,即指,所有的随机误差变量方差都相等 4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协方差解释。 今天跟大家一起讨论一下,SPSS---多元线性回归的具体操作过程,下面以教程教程数据为例,分析汽车特征与汽车销售量之间的关系。通过分析汽车特征跟汽车销售量的关系,建立拟合多元线性回归模型。数据如下图所示:

点击“分析”——回归——线性——进入如下图所示的界面:

将“销售量”作为“因变量”拖入因变量框内,将“车长,车宽,耗油率,车净重等10个自变量拖入自变量框内,如上图所示,在“方法”旁边,选择“逐步”,当然,你也可以选择其它的方式,如果你选择“进入”默认的方式,在分析结果中,将会得到如下图所示的结果:(所有的自变量,都会强行进入) 如果你选择“逐步”这个方法,将会得到如下图所示的结果:(将会根据预先设定的“F统计量的概率值进行筛选,最先进入回归方程的“自变量”应该是跟“因变量”关系最为密切,贡献最大的,如下图可以看出,车的价格和车轴跟因变量关系最为密切,符合判断条件的概率值必须小于0.05,当概率值大于等于0.1时将会被剔除)

巧用Excel解决多元非线性回归分析

农业网络信息 AGRICULTURE NETWORK INFORMATION ·研究与开发· 2011年第1期 巧用Excel 解决多元非线性回归分析 龚江,石培春,李春燕 (石河子大学农学院,石河子832003) 摘 要:非线性回归是回归分析的重要内容和难点,而多元非线性回归在农业生产中有重要的应用。应用Excel “工具” 菜单“数据分析”选项中的“回归”分析工具,以二元二次非线性回归为例,阐述了用Excel 做多元非线性回归的详细过程,并与SPSS 软件做的结果进行比较,证明使用Excel 做多元非线性回归完全可行,且操作简单、易行,并就方程的统计意义进行了分析。 关键词:Excel ;多元;非线性回归中图分类号:S126 文献标识码:A 文章编码:1672-6251(2011)01-0046-03 Application of Excel Software in Multi-nonlinear Regress Analysis GONG Jiang,SHI Peichun,LI Chunyan (Agriculture College of Shihezi Univerity,Shihezi 832003) Abstract:Nonlinear regress analysis was a difficult and significant method of regress analysis ,the application of which was important in agriculture production.In this paper,with the multi-linear regression analysis by “data analysis ”tool of Microsoft Excel as example,a 2times nonlinear regress analysis ’s process was described,and the results showed that the output was same with SPSS software ,then the statistical significance of the 2times nonlinear regress equation was analyzed.Key words:Excel software;multi analysis;nonlinear regress 注:新疆石河子大学农学院一类课程“生物统计学”支助。 作者简介:龚江(1976-),男,硕士,讲师,研究方向:生物统计教学和植物营养。收稿日期:2010-12-10 大量统计软件的问世,使统计分析在科研领域迅速普及应用。众所周知,统计软件如SAS 、SPSS 等虽然功能强大,但较难掌握,并且市面上出售的统计软件大都是盗版软件,不但运行结果的可靠性无法保证,也侵犯了知识产权。对于大多数科研工作者,尤其是基层的科研工作者来说,经常使用的统计软件与涉及的方法也很有限,主要集中在方差分析、回归与相关分析等少数几种方法上,并不需要包罗万象、功能强大的统计软件。而正版统计软件也由于其价格不菲,难以被大多数科研工作者承受。Excel 是Office 家族的一个成员,是功能强大、使用方便的电子表格式数据综合管理与分析系统,可用来记录和整理试验数据。另外,Excel 也具备一些统计运算的功能 [1] ,若能 巧妙地使用,也可以解决一些较为复杂的农业统计运算问题,如多元非线性回归的问题等,其统计结果和 SPSS 软件结果一致。 1Excel 统计功能的安装 单击Microsoft Excel 中文版菜单栏中“工具”的 “加载宏”命令,在“加载宏”对话框中选定“分析工具库”,再按“确定”钮(见图1), “数据分析” 这一项就出现在工具菜单栏中(见图2)。若Excel “工具”中的“加载宏”没有“分析工具库”,则将 Office Excel 中文专业版光盘放入光驱中,运行“安装”程序,点击“添加/删除”按钮,出现“Microsoft Office 维护”对话框后,在“选项”一栏中,选中“Microsoft Excel ”,然后单击“更改选项”按钮,出现新的对话框,再选中“加载宏”继续单击“更改选项”按钮,在新的对话框中选取分析工具库,确定即可,之后按照安装向导的指示即可顺利安装。 图1Excel 统计功能的安装

多元线性回归模型的案例讲解

多元线性回归模型的案 例讲解 Document number:NOCG-YUNOO-BUYTT-UU986-1986UT

1. 表1列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ,鸡肉价格P 1,猪肉价格P 2与牛肉价格P 3的相关数据。 年份 Y/ 千克 X/元 P 1/(元/千克) P 2/(元/千克) P 3/(元/千克) 年份 Y/ 千克 X/元 P 1/(元/千克) P 2/(元/千克) P 3/(元/ 千克) 1980 397 1992 911 1981 413 1993 931 1982 439 1994 1021 1983 459 1995 1165 1984 492 1996 1349 1985 528 1997 1449 1986 560 1998 1575 1987 624 1999 1759 1988 666 2000 1994 1989 717 2001 2258 1990 768 2002 2478 1991 843 (1) 求出该地区关于家庭鸡肉消费需求的如下模型: 01213243ln ln ln ln ln Y X P P P u βββββ=+++++ (2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。 先做回归分析,过程如下: 输出结果如下:

所以,回归方程为: 123ln 0.73150.3463ln 0.5021ln 0.1469ln 0.0872ln Y X P P P =-+-++ 由上述回归结果可以知道,鸡肉消费需求受家庭收入水平和鸡肉价格的影响,而牛肉价格和猪肉价格对鸡肉消费需求的影响并不显着。 验证猪肉价格和鸡肉价格是否有影响,可以通过赤池准则(AIC )和施瓦茨准则(SC )。若AIC 值或SC 值增加了,就应该去掉该解释变量。 去掉猪肉价格P 2与牛肉价格P 3重新进行回归分析,结果如下: Variable Coefficient Std. Error t-Statistic Prob.?? C LOG(X) LOG(P1) R-squared ????Mean dependent var Adjusted R-squared ????. dependent var . of regression ????Akaike info criterion Sum squared resid ????Schwarz criterion Log likelihood ????F-statistic Durbin-Watson stat ????Prob(F-statistic)

多元线性回归例题与解析

作业: 在农作物害虫发生趋势的预报研究中,所涉及的5个自变量及因 变量的10组观测数据如下,试建立y对x1-x5的回归模型,指出那些变量对y有显著的线性贡献,贡献大小顺序。 x1 x2 x3 x4 x5 y 9.200 2.732 1.471 0.332 1.138 1.155 9.100 3.732 1.820 0.112 0.828 1.146 8.600 4.882 1.872 0.383 2.131 1.841 10.233 3.968 1.587 0.181 1.349 1.356 5.600 3.732 1.841 0.297 1.815 0.863 5.367 4.236 1.873 0.063 1.352 0.903 6.133 3.146 1.987 0.280 1.647 0.114 8.200 4.646 1.615 0.379 4.565 0.898 8.800 4.378 1.543 0.744 2.073 1.930 7.600 3.864 1.599 0.342 2.423 1.104 (!)回归性方程显著性检验: 由Analysis of variance 表可知,其 r F P 的值0.0170小于0.05,则1 y x 与、2 x3x4x、5x之间具有显著性相关性;由R-square的值为0.9356可知该方程的拟合度高,(2)参数显著性检验:

a.由Parameter Estimates 表可知,对自变量x1。t 检验值为t=1.06,Pr t >的值等于 0.3479,大于0.05,故x1的系数为0,即x1未通过检验,去掉x1,再次运行程序。 b.结果表明所有变量的系数均通过检验,得到线性模型。 (3)拟合区间。 2350.75463 1.999640.33313 2.24781y x x x =--+ 故对y 有显著的线性贡献大小顺序为 325 x x x >>。 附件: data ex; input x1-x5 y@@; cards ; 9.200 2.732 1.471 0.332 1.138 1.155 9.100 3.732 1.820 0.112 0.828 1.146 8.600 4.882 1.872 0.383 2.131 1.841 10.233 3.968 1.587 0.181 1.349 1.356 5.600 3.732 1.841 0.297 1.815 0.863 5.367 4.236 1.873 0.063 1.352 0.903 6.133 3.146 1.987 0.280 1.647 0.114 8.200 4.646 1.615 0.379 4.565 0.898 8.800 4.378 1.543 0.744 2.073 1.930

相关文档
相关文档 最新文档