文档库 最新最全的文档下载
当前位置:文档库 › 回归分析在数学建模中的应用

回归分析在数学建模中的应用

回归分析在数学建模中的应用
回归分析在数学建模中的应用

摘要

回归分析和方差分析是探究和处理相关关系的两个重要的分支,其中回归分析方法是预测方面最常用的数学方法,它是利用统计数据来确定变量之间的关系,并且依据这种关系来预测未来的发展趋势。本文主要介绍了一元线性回归分析方法和多元线性回归分析方法的一般思想方法和一般步骤,并且用它们来研究和分析我们在生活中常遇到的一些难以用函数形式确定的变量之间的关系。在解决的过程中,建立回归方程,再通过该回归方程进行预测。

关键词:多元线性回归分析;参数估计;F检验

回归分析在数学建模中的应用

Abstract

Regression analysis and analysis of variance is the inquiry and processing of the correlation between two important branches, wherein the regression analysis method is the most commonly used mathematical prediction method, it is the use of statistical data to determine the relationship between the variables, and based on this relationship predict future trends. introduces a linear regression analysis and multiple linear regression analysis method general way of thinking and the general steps, and use them to research and analysis that we encounter in our life, are difficult to determine as a function relationship between the variables in the solving process, the regression equation is established by the regression equation to predict.

Keywords:Multiple linear regression analysis; parameter estimation;inspection

II

咸阳师范学院2013届本科毕业论文

I II 目 录

摘 要 ............................................................... I Abstract ........................................................... I I 目 录 ............................................................. I II

引言 (1)

1 回归分析的背景来源及其概念 (1)

1.1 回归分析的背景 (1)

1.2 回归分析的基本概念 (1)

2 线性回归分析模型 (2)

2.1 一元线性回归的模型 (2)

2.1.1 回归参数10,ββ和2σ的估计 (3)

2.1.2 一元线性回归方程的显著性检验 (3)

2.2 多元线性回归分析的模型 (4)

2.2.1 回归参数p βββ,,,10 和2σ的估计 (5)

2.2.2 多元线性回归分析方程的显著性检验 (5)

3 实例应用 (5)

3.1 问题提出 (5)

3.2 建立模型 (6)

3.3 关于家庭收入与家庭食品支出的应用 (6)

3.4 多元线性回归分析在我国民航客运量与其影响因素中的应用 (8)

小结

............................................................... 12 参考文献

........................................................... 13 谢辞

(14)

咸阳师范学院2013届本科毕业论文

1 引言

回归分析是研究生活中多个相关变量变化的一种最常见的数学方法,运用

它来解决实际问题,不仅可以使问题简单化 ,还可以对未来的数据进行预测。本文主要将回归分析应用于研究家庭食品支出和家庭收入以及我国民航客运量和

国民收入、消费额、铁路客运量、民航航线里程、来华入境人数之间的关系。 1 回归分析的背景来源及其概念

1.1 回归分析的背景

“回归”这一概念是在19世纪80年代由英国的统计学家弗朗西斯·高尔顿

在研究父代身高和子代身高之间的关系时提出来的。他发现不管父代身高是高或是矮,子代的身高都有回归父辈平均身高的趋势,他把这种现象称作回归。现如今,回归分析已经成为社会科学定量分析研究中最基本、应用最为广泛的一种数据处理方法。它不但可以给出描述自变量和因变量之间相关关系的函数表达式,还可以用来预测因变量的取值。在现实生活中,影响某一现象的因素常常是多方面的。社会科学的研究不可能像自然科学研究那样运用实验的方法来进行解决,人们为了弄清和解释事物之间变化的真实原因和规律,就必须借助一些经验数据并进行整理分析。而回归分析的最大优点恰恰就在于它可以通过统计方法来对干扰因素加以控制,从而帮助我们来发现自变量与因变量之间的关系。

1.2 回归分析的基本概念

一切运动着的事物都是相互联系、相互制约的,从而,描述事物和事物运动的

变量之间也是相互联系、相互制约的。变量之间的关系总体可以分为两类:一类叫做确定关系,即函数关系,它的特征是:一个变量随其他变量的确定而确定。例

如球的体积V 和半径r 之间的关系33

4r V π=;另一类关系叫做相关关系,这类关系的特征是:变量之间的关系很难用一种精确的方法表示出来。例如农业上的施肥量和亩产量之间有一定的关系,但是由施肥量不能精确地算出亩产量,由亩产量也不能精确地计算出施肥量。而回归分析就是用来处理和描述这种相关关系的。那么,什么是回归分析呢?我们大家都知道,数学分析和高等数学是研究连续变量之间的关系,泛函分析是研究函数集之间的关系,而回归分析则是研究随机变量之间的相关关系的一种数学方法。它是最常用的数理统计方法,能解决决策、控制、生产工艺优化等问题。目前,回归分析在工农业生产及科学研究中有着极其广泛的作用,同时也在实验数据的处理、经验公式的推导、产品的统计质量管

回归分析在数学建模中的应用

2

理、市场的预测、气象预报和医学卫生等许多领域都常常会运用回归分析。

回归分析主要研究的内容是:(1)从一组数据出发,确定这些变量(参数)之间的定量关系,所得到的表达式称为回归方程;(2)对求得的回归方程的可信度进行检验;(3)在有关的许多变量中,判断变量的显著性,即哪些是显著的,哪一些是不显著的,显著地保留,不显著的忽略;(4)利用所求得的回归方程进行预测和控制。

回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一元回归分析;当研究的因果关系涉及因变量和多个自变量时,叫做多元回归分析。另外,依据描述自变量和因变量之间的函数关系是线性的还是非线性的,把回归分析又分为线性回归分析和非线性回归分析。本文主要研究线性回归分析。

2 线性回归分析模型

线性回归分析是回归分析中较为简单的一类,并且它在现实生活中的应用及其泛。线性回归分析则是研究和处理变量之间的线性相关关系的数学方法。根据所研究自变量的多少,可以将线性回归分析分为一元线性回归分析和多元线性回归分析。

2.1 一元线性回归的模型

一元线性回归模型又称简单直线回归模型,它是根据成对的两种变量的数据,配合直线方程式,根据自变量的变动,来推算因变量发展趋势和水平的方法。它是研究相关的两种数量变动与存在关系的一种方法。

一元线性回归模型的一般形式:

εββ+X +=Y 10 (1)

上式中,X +10ββ表示Y 随X 的变化而线性变化的部分,ε是随机误差,是其它一切不确定因素影响的总和,它的值是不可测的,通常假定ε服从)(2,0δN , 称函数()X X f 10ββ+=为一元线性回归函数。0β为回归常数,1β为回归系数,他们统称为回归参数。其中称X 为回归自变量或回归因子;称Y 为回归因变量或响应变量。

若()11,y x ,()22,y x , ,()n n y x ,是)(Y X ,的一组观测值,那么一元线性回归模型可表示为:

咸阳师范学院2013届本科毕业论文

3 i i i x y εββ++=10n i ,,3,2,1 =

上式中,()0=E i ε ,()2var σε=i ,n i ,,3,2,1 =

2.1.1 回归参数10,ββ和2σ的估计

用最小二乘法估计10,ββ的值,即取它们的一组估计值1

0?,?ββ,使其随机误差i ε的平方和达到最小,即使i y 与i

i x y 10???ββ+=的最佳拟合。若记 ()()∑=--=n

i i i x y Q 12

1010,ββββ 则()

()10,10,min ?,?10ββββββQ Q = 显然有(),0,10≥ββQ 并且关于10,ββ可微,则由多元函数存在极值的必要条件

得 ,??1

0x y ββ-= xx xy l l =1?β 则称1

0?,?ββ为10,ββ的最小二乘估计,其中 ∑==n i i y n y 11 ,∑==n i i x n x 11, 2

1121??? ??-=∑∑==n i i n i i xx x n x l ??? ????? ??-=∑∑∑===n i i n i i n

i i i xy y x n y x l 1111 于是可得到经验回归方程 X Y 10???ββ+=。

其中有 ()2???12

102---=∑=n x y n i i i ββσ , 则2?σ

是2σ的无偏估计。 2.1.2 一元线性回归方程的显著性检验

根据回归方程求出估计值10,ββ以后,现在的问题是:y 与x 之间是否确实存在这种线性关系呢?也就是说1β是否为0,这就需要对回归方程作显著性检验。

显著性检验法有F 检验法、t 检验法和r 检验法,而F 检验法是最常用、最基本的检验方法。只要判断出()2,1-n F 与()2,1-n F α的大小即可,当

()()2,12,1->-n F n F α时,则说明00=β的假设不成立,即模型中的一次项x 1β是

回归分析在数学建模中的应用

4

必要的。换而言之,模型对水平α而言是显著的,反之就是不显著的。

经过检验,当回归方程有意义时,便可用它来进行预测。当给定0x X =时求出

预测值0

001??x y ββ+=即可。 2.2 多元线性回归分析的模型

线性回归模型适合于分析一个因变量和多个自变量之间的相关关系。现假设一个回归模型中有1-p 个自变量,即有121,,,-p x x x , 则该回归模型可以表示为:

()()i p i p ik k i i i x x x x y εβββββ+++++++=--1122110 (2)

其中i ε服从)(2,0σN ,并且独立同部分布。

上式中,i y 表示个体()n

i i ,...,2,1=在因变量y 中的取值,0β为截距的总体参数,12,,,1-p βββ 为斜率的总体参数。由于该回归模型中包含多个自变量,因此将

(2)式称为多元线性回归模型。

如果我们定义一下的矩阵:

????????????????????=?n i n y y y y y 211

()()()()?

???????????????????=----?1211211222211112111111p n n n p i i i p p p n x x x x x x x x x x x x X ?????????

???????????=?1101p k p βββββ ????????????????????=?n i n εεεεε 211

此时,我们可以采用矩阵的表达形式,将一般的多元线性回归模型表示为:

咸阳师范学院2013届本科毕业论文

5 111????+=n p p n n X y εβ (3)

上面的式子也常常简记为:εβ +=X y 。这里,y 表示因变量的向量,β 表示总体参

数的向量,X 表示由所有自变量和一列常数1所组成的矩阵,ε 则表示随机误差

变量的向量。

2.2.1 回归参数p βββ,,,10 和2σ的估计

类似于一元线性回归分析的参数估计,求多元线性回归分析的回归系数β 的

估计值β? ,就是求最小二乘函数()()()βββ X y X y Q T --=达到最小的β 值。

于是可求得β 的最小二乘估计

()y X X X T T 1?-=β 。 从而可得经验回归方程 p

p X X Y βββ????110+++= ,称βε?X y -=为残差向量。 通常有()1-p -n ???εεσ

T =为2σ的最小二乘估计。 2.2.2 多元线性回归分析方程的显著性检验

假设:0H ,010====p βββ H βββ,,,:101 不全为0。

当0H 成立时,构造统计量F 服从)(1,--p n p F ,对于给定的显著性水平α

(一般取值为0.01或0.05),检验的拒绝域为()1,-->p n p F F α。

当多元线性回归方程经过检验是显著的之后,并且其中每一个系数均显著不为0时,便可以

用此方程进行预测。即给定()

T p x x x x X 002010,,, ==,将其代入回归方程,可得到:p

p x x y 001100????βββ+++= 。 3 实例应用

3.1 问题提出

食品是人们生活中不可缺少的。每个家庭都必须在食品支出上加以重视,然而,一个家庭的收入是该家庭食品支出的先决条件。也就是说,家庭收入影响着家庭食品支出。那么它们之间到底有什么关系呢?另外,在现实生活中,影响某一变量的因素不止一个,有时候从表面上看,诸多的因素好像都与某一因变量有着某种相关关系,其实不然。在这些因素中有的因素对该变量是显著性的或起决定性

回归分析在数学建模中的应用

6

作用,而有的因素则是不显著的。要解决这类问题,我们就必须借助于多元线性回归。例如:在我国民航客运量的研究中,影响民航客运量的因素是多方面的,其中包括国民收入、铁路客运量、民航航线里程等。下面本文将分别解决以上的两个问题。

3.2 建立模型

)1( 假设家庭收入为x ,家庭食品支出为y ,那么可以设这两种变量之间的关系为:εββ++=x y 10,其中10,ββ为回归参数,ε是随机误差,并且ε服从)(2,0σN ;

)2( 假设我国民航客运量为y ,国民收入、消费额、铁路客运量、民航航线里程和来华旅游入境人数分别为1x ,2x ,3x ,4x 和5x 。则设变量之间的关系为:

εββββββ++++++=55443322110x x x x x y ,

其中()5,4,3,2,1=i i β为回归参数ε为不可测量的误差变量。

3.3 关于家庭收入与家庭食品支出的应用

为了研究家庭收入和该家庭食品支出之间的关系,随机调查了10个家庭,所得数据如下:

家庭收入和食品支出数据 单位:百元

首先设家庭收入为X (单位:百元),家庭食品支出为Y (单位:百元)

根据题中所给出的数据,我们可以画出散点图,

1 2

3 4 5 6 7 8 9 10 家庭收入 20 30

32 40 15 26 13 38 35 40 食品支出 7

6 8 12 9 11 4 10 9 10

咸阳师范学院2013届本科毕业论文

7 由图我们可只看出,家庭收入X 与家庭食品支出Y 之间存在线性关系。

表3.1 样本数据计算表

序号 家庭收入i x 食品支出i y 2i x 2

i y i i y x

1 20 7 400 49 140

2 30 6 900 36 180

3 30 8 102

4 64 256

4 40 12 1600 144 480

5 15 9 225 81 135

6 26 11 676 121 286

7 13 4 169 16 52

8 38 10 1444 100 380

9 35 9 1225 81 315

10 40 10 1600 100 400 ∑ 289 84 9263 792 2624

=x 9.2810289= 4.81084==y

4.1964.89.281026241

=??-=-=∑=y x n y x l n i i i xy

9

.9109.28109261221

2=?-=-=∑=x n x l n i i xx

4.864.8107922212

=?-=-=∑=y n y l n i i yy

2178.09.9104.196?1===xx

xy l l β 1056.2??10=-=x y ββ 19.439.9102178.04.86?221222=?-=-=-=xx

yy R T E l l S S S β 3236.23989.5819.4322

===-=∧n S E δ 通过以上计算可以得到家庭食品支出Y 对家庭收入X 的样本回归方程是:

x x y 2178.01056.2?10+=+=∧

∧ββ 该方程说明,当收入为零时,家庭的食品支出也必须有2.1056元。这部分的支出

回归分析在数学建模中的应用

8

可看作是基本支出或固定支出水平;在一定的范围内,收入每增加100元,食品支出就增加21.78元。

用F 检验法进行显著性检验,取显著水平05.0=α。因为

()

0137.09

.910306.23982.51,112=?=

-=-l xx n F c ασ 拒绝域为 {}

0137.0?210>=βK ,而0137.00474.02178.0?221>==β 所以拒绝0H ,也就是说家庭收入X 对家庭食品支出Y 有着显著的影响。

取420=x ,即当家庭收入为4200元时,食品支出的预测值为:

2532.11422178.01056.2???0

100=?+=+=x y ββ(百元) 置信度为95%的预测区间为 ()()()0000?,?x y x y δδ+-

通过计算可以得到,()9014.6306.2288.13236.20=??=x δ

因此可得预测区间为:(4.3518,18.1546),即有95%的把握估计当家庭收入为4200元时,家庭食品支出额在435到1815.46元之间。

3.4 多元线性回归分析在我国民航客运量与其影响因素中的应用

为了研究我国民航客运量的变化趋势及其成因,现以民航客运量作为因变量,以国民的收入、消费额、铁路客运量、民航航线里程以及来华旅游入境人数作为影响国民航客运量的主要因素。根据《2004年统计摘要》可以获得1988-2003年统计数据见下表4.2。

表4.2 民航统计数据表

年份 Y /万人 1x /亿元 2x /亿元 3x /万人 4x / 万km 5x /万人 1998 231 3010 1888 81491 14.89 180.92 1989 298 3350 2195 86389 16.00 420.39 1990 343 3688 2531 92204 19.53 570.25 1991 401 3941 2799 95300 21.82 776.71 1992 445 4258 3054 99922 23.27 792.43 1993 391 4726 3358 106044 22.91 947.70 1994 554 5652 3905 11353 26.02 1285.22

咸阳师范学院2013届本科毕业论文

9 1995 744 7020 4879 112110 27.72 1783.30 1996 997 7859 5552 108579 32.43 2281.95 1997 1310 9313 6386 112429 38.91 2690.23 1998 1442 11738 8038 122645 37.38 3169.48 1999 1283 13176 9005 113807 47.19 2450.14 2000 1660 14384 9663 95712 50.68 2746.20 2001 2178 16557 10969 95081 55.91 3335.50 2002 2886 20223 12985 99693 83.66 3311.50 2003 3383 24882 15949 105458 96.08 4152.70 运用回归分析的方法分析上面的所给出的一系列数据,并且建立多元线性回归模型并用MATLAB 软件进行解决。

建立回归分析模型,定义民航客运量为Y ,国民收入、消费额、铁路客运量、民航航线里程和来华旅游入境人数分别为1x ,2x ,3x ,4x 和5x .设变量之间的关系为:

εββββββ++++++=55443322110x x x x x y

其中ε为不可测量的误差变量。

根据统计数据,利用MATLAB 计算出回归系数。具体如下:

>=Y [23

1660 2178 2886 3383 ];

>=X [3130 1888 81491 14.89 180.92;

3350 2195 86389 16.00 420.39;

3688 2531 92204 19.53 570.25;

3941 2799 95300 21.82 776.71;

4258 3054 99922 23.27 792.43;

4736 3358 106044 22.91 947.70;

5652 3905 11353 26.02 1285.22;

7020 4879 112110 27.72 1783.30;

7859 5552 108579 32.43 2281.95;

9313 6386 112429 37.38 3169.48;

13176 9005 113807 47.19 2450.14;

回归分析在数学建模中的应用

10

14384 9663 95712 50.68 2746.20;

16557 10969 5081 55.91 3335.65;

20223 12985 99693 83.66 3311.50;

24882 15949 105458 96.08 4152.70];

>=X [()1,16ones X ];

>[stats r r b C int,,int,,]()05.0,,x y regress =;

计算出: 回归系数=C []3437.0,9803.15,0006.0,7708.0,5196

.0,9.195--; 因此所得的多元线性回归方程为:

3

21554433221100006.07708.05196.09.195???????x x x x x x x x y +-+-=+++++=ββββββ 543437.09803.15x x ++;

该方程中的0?β,1?β,2?β,3?β,4?β,5

?β都有明确的含义。例如说:当=1?β0.5196时则表示国民收入每增加1亿元,在其他条件不变的情况下,民航客运量就会增加0.5196万人。

运用F 检验法对回归方程进行检验,经过计算可得69.527=F ,取显著性水平05.0=α,查F 分布表得()33.310,595.0=F ,因为)(33.310,569.52795.0=>=F F 。故拒绝0H ,表明线性回归方程高度显著,即就说明1x ,2x ,3x ,4x ,5x 整体上对y 有显著的影响。

对回归系数进行显著性检验,:0H 0=i β,5,4,3,2,1=i

代入公式()22?1E ii i i S c k n F β--=,5,4,3,2,1=i 。计算得:

135.27,735.8,454.0,434.21,302.2354321=====F F F F F

给定05.0=α,查F 分布表得()96.410,195.0=F ,其中1F ,2F ,4F ,5F 均大于所查表的值,而()96.410,1454.095.03=<=F F ,这样的结果说明回归系数中1x ,2x ,4x ,5x 对y 有显著性影响,而3x 对y 无显著影响,这说明铁路客运量对民航客运量无显著影响。此时,该多元线性回归模型中可以剔除铁路客运量3x 的影响,从而得

咸阳师范学院2013届本科毕业论文

11 到新的线性回归模型为:

=y ?54213471.09777.157544.05090.08784.153x x x x ++-+-

再经过检验可知,所有的回归变量均对y 有显著性影响,并且可以计算出复相关系数998642.0=R 。因为复相关系数接近1,则可认为X 与Y 之间相关关系显著,说明拟合程度很高,故该模型的预测值和真实值之间很接近。

经过调查,已知2010年的国民收入为30782亿元,总的消费额为22351亿元,民航航线里程为198463万km,来华旅游入境人数是5268.46万人。即有

=X [1 30782 22351 18463 5268.46];

???????

?????????--=3471.09777.157544.05090.08784.153β 因而可得2010年民航客运量的预测值为:=y

?β? X 4858=万人。即预计,2010年我国民航客运量可达到4585万人。

然而,线性回归分析主要解决实际问题中的具有相关关系的变量,在某一范围之中,这种线性关系可以一直维持着,但实际生活中的问题,并不总是如我们所想的那样,它总会有一个极限。当某一变量达到上限的时候,就不会和其他的变量再次呈现线性关系了。此时,线性回归分析的方法就不可用了。那么,当我们遇到这种问题时,就不得不采用控制的方法加以解决。对于我国民航客运量的问题中,在国民收入1x 、消费额2x 、铁路客运量3x 一定的前提条件下,当民航客运量()21,y y Y ∈时,来华旅游入境人数5x 应控制的范围由方程组

??

???-++++=-++++=2553322110225533221101????????????αασβββββσβββββZ x x x x y Z x x x x y 其中)(222-≈n t Z αα 所确定,即分别解出1x ,可以作为控制1x 的上下限。

回归分析在数学建模中的应用

小结

在现实生活中,当我们遇到几个变量之间的关系无法用函数形式确定的时候,我们便会尽可能多的去调查和搜集与此相关的一些数据,然后再利用回归分析的方法去研究和分析这些数据之间的关系。本文首先介绍了线性回归分析的来源、阐述及其分类,另外,重点让我们了解了一元线性回归分析和多元线性回归分析在数学建模中的一般步骤和一般思想。在运用回归分析解决问题的过程中,最关键的是对其线性回归方程中的参数进行估计。然而对于参数估计的方法,我们通常采用的是最小二乘法的原则,在必要的情况下,通常也借助于MATLAB软件进行相应的计算,从而得到相应的线性回归方程,并对方程和回归系数进行显著性检验,最后进行预测。

在本文中,主要研究了家庭收入与家庭食品支出之间的线性关系、我国民航客运量与国民收入等多个因素的线性关系,通过对它们所提到数据的分析和研究,并建立相应的数学模型,进而可以得出线性回归方程,通过显著性检验之后,并分别计算出家庭收入为4200元时家庭食品支出的预测和2010年我国民航客运量的预测。通过计算的这两个实例分别体现了一元线性回归分析和多元线性回归分析在数学建模中的应用。在此过程中,我们可以明确地得到运用回归分析解决实际问题的一般步骤:第一步,根据所给数据确定相关变量,第二步,假设线性回归模型,第三步,对模型中的回归参数进行估计,第四步,检验显著性,第五步,依据回归方程进行预测,最后,将建立的回归模型应用于实际生活生产中。

12

咸阳师范学院2013届本科毕业论文

参考文献

【1】薛毅主编. 数学建模基础. 北京工业大学出版社 2005.1

【2】杨虎 ,钟波 , 刘琼荪编著应用数理统计【ME】清华大学出版社2006.12

【3】陈东彦 . 李冬梅 . 王树忠 . 编著数学建模【SP】科学出版社 2007

【4】解放军信息工程大学韩忠庚编著数学建模方法及其应用高等教育出版社 2005.6

【5】姜启源 . 谢金星 .叶俊编著数学建模(第三版)高等教育出版社 2003.8

【6】谢宇等编著回归分析【SM】社会科学文献出版社 2010.8 【7】赵静 , 但琦等主编数学建模与数学实验(第3版)高等教育出版社 2008.1

【8】孙荣恒 .应用数理统计.北京:科学出版社,2003

【9】何晓群.现代统计分析方法与应用 .北京:中国人民大学出版社,1998 【10】马逢时,何良才等编著应用概率统计天津大学出版社 1996 【11】陆璇.数理统计基础. 北京:中国统计出版社,1998

【12】陈希孺等. 概率论与数理统计.合肥:中国科学技术大学出版社,2002 【13】何晓群. 现代统计分析方法与应用. 北京:中国人民大学出版社,1998 【14】潘承毅等. 数理统计的原理与方法. 上海:同济大学出版社,1993 【15】Yang Hu, Yang Ting. Outlier Mining Based on Principal Component Estimation. Acta Mathematica Applicatae Sinica,2005

13

回归分析在数学建模中的应用

谢辞

转眼间我的大学生活即将结束,而毕业论文是我们在大学时期的最后一次作业,我抱着端正、认真的态度完成它.。当然,起初在写论文的过程中,我感觉困难重重,是我的指导老师崔老师不厌其烦的给我一一指导。他是一位既和蔼又负责任老师,他严肃的科学态度,严谨的治学精神,精益求精的工作作风,深深地感染和激励着我。他经常抽时间给我们开会,检查我们写论文的进度,他一边督促我们,一边又给我们几个一一指导,唯恐我们哪里没有弄懂。崔老师多次为我指点迷津,帮助我发掘新的思路和观点。在此,我要郑重的感谢崔老师,谢谢您,正因为有您的指导和帮助,我的毕业论文才能顺利完成。

14

数学建模——回归分析

回归分析——20121060025 吕佳琪 企业编号生产性固定资产价值(万元)工业总产值(万元) 1318524 29101019 3200638 4409815 5415913 6502928 7314605 812101516 910221219 1012251624 合计65259801 (2)建立直线回归方程; (3)计算估价标准误差; (4)估计生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值。解: (1)画出散点图,观察二变量的相关方向 x=[318 910 200 409 415 502 314 1210 1022 1225]; y=[524 1019 638 815 913 928 605 1516 1219 1624]; plot(x,y,'or') xlabel('生产性固定资产价值(万元)') ylabel('工业总产值(万元)') 由图形可得,二变量的相关方向应为直线 (2)

x=[318 910 200 409 415 502 314 1210 1022 1225]; y=[524 1019 638 815 913 928 605 1516 1219 1624]; X = [ones(size(x))', x']; [b,bint,r,rint,stats] = regress(y',X,0、05); b,bint,stats b = 395、5670 0、8958 bint = 210、4845 580、6495 0、6500 1、1417 stats = 1、0e+004 * 0、0001 0、0071 0、0000 1、6035 上述相关系数r为1,显著性水平为0 Y=395、5670+0、8958*x (3) 计算方法:W=((Y1-y1)^2+……+(Y10-y10)^2)^(1/2)/10 利用SPSS进行回归分析:

数学建模之回归分析法

什么是回归分析 回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。 回归分析之一多元线性回归模型案例解析 多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程为: 毫无疑问,多元线性回归方程应该为: 上图中的x1, x2, xp分别代表“自变量”Xp截止,代表有P个自变量,如果有“N组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示: 那么,多元线性回归方程矩阵形式为: 其中:代表随机误差,其中随机误差分为:可解释的误差和不可解释的误差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样) 1:服成正太分布,即指:随机误差必须是服成正太分别的随机变量。 2:无偏性假设,即指:期望值为0 3:同共方差性假设,即指,所有的随机误差变量方差都相等 4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协方差解释。

今天跟大家一起讨论一下,SPSS---多元线性回归的具体操作过程,下面以教程教程数据为例,分析汽车特征与汽车销售量之间的关系。通过分析汽车特征跟汽车销售量的关系,建立拟合多元线性回归模型。数据如下图所示:(数据可以先用excel建立再通过spss打开) 点击“分析”——回归——线性——进入如下图所示的界面:

回归分析在数学建模中的应用

摘要 回归分析和方差分析是探究和处理相关关系的两个重要的分支,其中回归分析方法是预测方面最常用的数学方法,它是利用统计数据来确定变量之间的关系,并且依据这种关系来预测未来的发展趋势。本文主要介绍了一元线性回归分析方法和多元线性回归分析方法的一般思想方法和一般步骤,并且用它们来研究和分析我们在生活中常遇到的一些难以用函数形式确定的变量之间的关系。在解决的过程中,建立回归方程,再通过该回归方程进行预测。 关键词:多元线性回归分析;参数估计;F检验

回归分析在数学建模中的应用 Abstract Regression analysis and analysis of variance is the inquiry and processing of the correlation between two important branches, wherein the regression analysis method is the most commonly used mathematical prediction method, it is the use of statistical data to determine the relationship between the variables, and based on this relationship predict future trends. introduces a linear regression analysis and multiple linear regression analysis method general way of thinking and the general steps, and use them to research and analysis that we encounter in our life, are difficult to determine as a function relationship between the variables in the solving process, the regression equation is established by the regression equation to predict. Keywords:Multiple linear regression analysis; parameter estimation;inspection II

数学建模-回归分析-多元回归分析

1、 多元线性回归在回归分析中,如果有两个或两个以上的自变量,就称为 多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。 在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响,表现在线性回归模型中的解释变量有多个。这样的模型被称为多元线性回归模型。(multivariable linear regression model ) 多元线性回归模型的一般形式为: 其中k 为解释变量的数目,j β (j=1,2,…,k)称为回归系数(regression coefficient)。上式也被称为总体回归函数的随机表达式。它的非随机表达式为: j β也被称为偏回归系数(partial regression coefficient)。 2、 多元线性回归计算模型 多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和(Σe)为最小的前提下,用最小二乘法或最大似然估计法求解参数。 设( 11 x , 12 x ,…, 1p x , 1 y ),…,( 1 n x , 2 n x ,…, np x , n y )是一个样本, 用最大似然估计法估计参数: 达 到最小。

把(4)式化简可得: 引入矩阵: 方程组(5)可以化简得: 可得最大似然估计值:

3、Matlab 多元线性回归的实现 多元线性回归在Matlab 中主要实现方法如下: (1)b=regress(Y, X ) 确定回归系数的点估计值 其中 (2)[b,bint,r,rint,stats]=regress(Y,X,alpha)求回归系数的点估计和区间估计、并检 验回归模型 ①bint 表示回归系数的区间估计. ②r 表示残差 ③rint 表示置信区间 ④stats 表示用于检验回归模型的统计量,有三个数值:相关系数r2、F 值、与F 对应的 概率p 说明:相关系数r2越接近1,说明回归方程越显著;F>F1-alpha(p,n-p-1) 时拒绝H0,F 越大,说明回归方程越显著;与F 对应的概率p<α 时拒绝H0,回归模型成立。 ⑤alpha 表示显著性水平(缺省时为0.05) (3)rcoplot(r,rint) 画出残差及其置信区间

数学建模回归分析多元回归分析

1、 多元线性回归 在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。 在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响,表现在线性回归模型中的解释变量有多个。这样的模型被称为多元线性回归模型。(multivariable linear regression model ) 多元线性回归模型的一般形式为: 其中k 为解释变量的数目,j β (j=1,2,…,k)称为回归系数(regression coefficient)。上式也被称为总体回归函数的随机表达式。它的非随机表达式为: j β也被称为偏回归系数(partial regression coefficient)。 2、 多元线性回归计算模型 多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和(Σe)为最小的前提下,用最小二乘法或最大似然估计法求解参数。 设( 11 x , 12 x ,…, 1p x , 1 y ),…,( 1 n x , 2 n x ,…, np x , n y )是一个样本, 用最大似然估计法估计参数: 达 到最小。

把(4)式化简可得: 引入矩阵: 方程组(5)可以化简得: 可得最大似然估计值:

3、Matlab 多元线性回归的实现 多元线性回归在Matlab 中主要实现方法如下: (1)b=regress(Y, X ) 确定回归系数的点估计值 其中 (2)[b,bint,r,rint,stats]=regress(Y,X,alpha)求回归系数的点估计和区间估计、并检 验回归模型 ①bint 表示回归系数的区间估计. ②r 表示残差 ③rint 表示置信区间 ④stats 表示用于检验回归模型的统计量,有三个数值:相关系数r2、F 值、与F 对应的 概率p 说明:相关系数r2越接近1,说明回归方程越显著;F>F1-alpha(p,n-p-1) 时拒绝H0,F 越大,说明回归方程越显著;与F 对应的概率p<α 时拒绝H0,回归模型成立。 ⑤alpha 表示显著性水平(缺省时为0.05) (3)rcoplot(r,rint) 画出残差及其置信区间

数学建模多元回归模型

实习报告书 学生姓名: 学号: 学院名称: 专业名称: 实习时间: 2014年 06 月 05 日 第六次实验报告要求 实验目的: 掌握多元线性回归模型的原理,多元线性回归模型的建立、估计、检验及解释变量的增减的方法,以及运用相应的Matlab软件的函数计算。 实验内容: 已知某市粮食年销售量、常住人口、人均收入、肉、蛋、鱼的销售数据,见表1。请选择恰当的解释变量和恰当的模型,建立粮食年销售量的回归模型,并对其进行估计和检验。

表1 某市粮食年销售量、常住人口、人均收入、肉、蛋、鱼的销售数据 年份粮食年销售 量Y/万吨 常住人口 X2/万人 人均收 入X3/ 元 肉销售 量X4/万 吨 蛋销售 量X5/ 万吨 鱼虾销 售量 X6/万吨 197498.45560.20153.20 6.53 1.23 1.89 1975100.70603.11190.009.12 1.30 2.03 1976102.80668.05240.308.10 1.80 2.71 1977133.95715.47301.1210.10 2.09 3.00 1978140.13724.27361.0010.93 2.39 3.29 1979143.11736.13420.0011.85 3.90 5.24 1980146.15748.91491.7612.28 5.13 6.83 1981144.60760.32501.0013.50 5.418.36 1982148.94774.92529.2015.29 6.0910.07

1983158.55785.30552.7218.107.9712.57 1984169.68795.50771.1619.6110.1815.12 1985162.14804.80811.8017.2211.7918.25 1986170.09814.94988.4318.6011.5420.59 1987178.69828.731094.6 523.5311.6823.37 实验要求: 撰写实验报告,参考第10章中牙膏销售量,软件开发人员的薪金两个案例,写出建模过程,包括以下步骤 1.分析影响因变量Y的主要影响因素及经济意义; 影响因变量Y的主要影响因素有常住人口数量,城市中人口越多,需要的粮食数量就越多,粮食的年销售量就会相应增加。粮食销量还和人均收入有关,人均收入增加了,居民所能购买的粮食数量也会相应增加。另外,肉类销量、蛋销售量、鱼虾销售量也会对粮食的销售量有影响,这些销量增加了,也表示居民的饮食结构也在发生变化,生活水平在提高,所以相应的,生活水平提升了,居民也有能力购买更多的粮食。

数学建模统计模型

数学建模

论文题目: 一个医药公司的新药研究部门为了掌握一种新止痛剂的疗效,设计了一个药物试验,给患有同种疾病的病人使用这种新止痛剂的以下4个剂量中的某一个:2 g,5 g,7 g和10 g,并记录每个病人病痛明显减轻的时间(以分钟计). 为了解新药的疗效与病人性别和血压有什么关系,试验过程中研究人员把病人按性别及血压的低、中、高三档平均分配来进行测试. 通过比较每个病人血压的历史数据,从低到高分成3组,分别记作,和. 实验结束后,公司的记录结果见下表(性别以0表示女,1表示男). 请你为该公司建立一个数学模型,根据病人用药的剂量、性别和血压组别,预测出服药后病痛明显减轻的时间.

一、摘要 在农某医药公司为了掌握一种新止痛药的疗效,设计了一个药物实验,通过观测病人性别、血压和用药剂量与病痛时间的关系,预测服药后病痛明显减轻的时间。我们运用数学统计工具m i n i t a b软件,对用药剂量,性别和血压组别与病痛减轻

时间之间的数据进行深层次地处理并加以讨论概率值P (是否<)和拟合度R-S q的值是否更大(越大,说明模型越好)。 首先,假设用药剂量、性别和血压组别与病痛减轻时间之间具有线性关系,我们建立了模型Ⅰ。对模型Ⅰ用m i n i t a b 软件进行回归分析,结果偏差较大,说明不是单纯的线性关系,然后对不同性别分开讨论,增加血压和用药剂量的交叉项,我们在模型Ⅰ的基础上建立了模型Ⅱ,用m i n i t a b软件进行回归分析后,用药剂量对病痛减轻时间不显着,于是我们有引进了用药剂量的平方项,改进模型Ⅱ建立了模型Ⅲ,用m i n i t a b 软件进行回归分析后,结果合理。最终确定了女性病人服药后病痛减轻时间与用药剂量、性别和血压组别的关系模型: Y=1x 3x 1x 3x 2 1 x 对模型Ⅱ和模型Ⅲ关于男性病人用m i n i t a b软件进行回归分析,结果偏差依然较大,于是改进模型Ⅲ建立了模型Ⅳ,用m i n i t a b软件进行回归分析后,结果合理。最终确定了男性病人服药后病痛减轻时间与用药剂量、性别和血压组别的关系模 型:Y=1x1x 3x 2 1 x关键词止痛剂药剂量性别病痛减轻时 间

数学建模实验 ——曲线拟合与回归分析

曲线拟合与回归分析 1、有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下: (1)说明两变量之间的相关方向; (2)建立直线回归方程; (3)计算估计标准误差; (4)估计生产性固定资产(自变量)为1100万元时的总资产 (因变量)的可能值。 解: (1)工业总产值是随着生产性固定资产价值的增长而增长的,存 在正向相关性。 用spss回归 (2)spss回归可知:若用y表示工业总产值(万元),用x表示生产性固定资产,二者可用如下的表达式近似表示: .0+ y =x 896 . 395 567 (3)spss回归知标准误差为80.216(万元)。 (4)当固定资产为1100时,总产值为: (0.896*1100+395.567-80.216~0.896*1100+395.567+80.216) 即(1301.0~146.4)这个范围内的某个值。 MATLAB程序如下所示: function [b,bint,r,rint,stats] = regression1 x = [318 910 200 409 415 502 314 1210 1022 1225]; y = [524 1019 638 815 913 928 605 1516 1219 1624]; X = [ones(size(x))', x']; [b,bint,r,rint,stats] = regress(y',X,0.05); display(b); display(stats); x1 = [300:10:1250]; y1 = b(1) + b(2)*x1; figure;plot(x,y,'ro',x1,y1,'g-');

数学建模之回归分析法

什么就是回归分析 回归分析(regression analysis)就是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析与多元回归分析;按照自变量与因变量之间的关系类型,可分为线性回归分析与非线性回归分析。如果在回归分析中,只包括一个自变量与一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量与自变量之间就是线性关系,则称为多元线性回归分析。 回归分析之一多元线性回归模型案例解析 多元线性回归,主要就是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程 为: 毫无疑问,多元线性回归方程应该 为: 上图中的x1, x2, xp分别代表“自变量”Xp截止,代表有P个自变量,如果有“N组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示: 那么,多元线性回归方程矩阵形式为: 其中:代表随机误差, 其中随机误差分为:可解释的误差与不可解释的误差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样) 1:服成正太分布,即指:随机误差必须就是服成正太分别的随机变量。 2:无偏性假设,即指:期望值为0 3:同共方差性假设,即指,所有的随机误差变量方差都相等 4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协方差解释。 今天跟大家一起讨论一下,SPSS---多元线性回归的具体操作过程,下面以教程教程数据为例,分析汽车特征与汽车销售量之间的关系。通过分析汽车特征跟汽车销售量的关系,建立拟

数学建模竞赛统计回归分析相关练习题

1. 一个班有7名男性工人,他们的身高和体重列于下表 请把他们分成若干类并指出每一类的特征。这里身高以米为单位,体重以千克为单位。 2.有两种跳蚤共10只,分别测得它们四个指标值如表。 样本号甲种乙种 X3 X4 X1 X2 X3 X4 X1 X 2 1 189 245 137 163 181 305 184 209 2 192 260 132 217 158 237 13 3 188 3 217 276 141 192 18 4 300 166 231 4 221 299 142 213 171 273 162 213 5 171 239 128 158 181 297 163 224 1)用距离判别法建立判别准则。 2)问(192, 287, 141,198 和(197, 303, 170, 205 各属于哪一种? 3.考察温度x对产量y的影响,测得下列10组数据: 求y关于x的线性回归方程,检验回归效果是否显著,并预测 x=42C时产量的估值 4. 在研究化学动力学反应过程中,建立了一个反应速度和反应物 %-备 含量的数学模型,形式为y — 1 +卩2为+ P3X 2 +P4X3 其中i…,飞是未知参数,X1,X2,X3是三种反应物(氢,门戊烷, 异构戊烷)的含量,y是反应速度?今测得一组数据如表,试由此确定参数订…宀

序号反应速度y 氢X1 n戊烷X2 异构戊烷X3 1 8.55 470 300 10 2 3.79 285 80 10 3 4.82 470 300 120 4 0.02 470 80 120 5 2.75 470 80 10 6 14.39 100 190 10 7 2.54 100 80 65 8 4.35 470 190 65 9 13.00 100 300 54 10 8.50 100 300 120 11 0.05 100 80 120 12 11.32 285 300 10 13 3.13 285 190 120 5. 主成分与卡方检验已课件为主

数学建模之回归模型

二、多元线性回归分析 1.简介 多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。 应用于根据现有资料对某变量进行预测,如预测某商品的销量等。 2.步骤 ①根据预测目标,确定自变量和因变量。 ②建立多元线性归回模型 根据预测目标得自变量(1,2, ,)k x k m =,因变量y 。设与k x 无关的未知量 2(1,,),j j m βσ= ,j β为回归系数。 记y ,k x 的观测值分别为i b ,im a ,1, ,,i n n m =>,n 阶单位矩阵n E ,且 111111m n nm a a X a a ????= ???? ?? ,1,n b Y b ????= ?????? [][]101 ,,,,,T T n m εεεββββ== 则多元线性回归分析的模型为 2 , ~(0,). n Y X N E βεεσ=+???(1) ③求归回系数 使用最小二乘法求j β的估计值,选取估计值?j β,使当?j j ββ=时,误差平方和2 220111 1 1 ?)()n n n i i i i i m im i i i Q b b b a a εβββ=====-=----∑∑∑( 最小。 因此,令 j 0,0,1,2,3Q j c ?==?.

得到正规方程组: ,T T j X X X Y β= 则有 1?().T T j X X X Y β-= 利用matlab 求解正规方程组即得j β的估计值为 将?j β带回(1)得y 的估计值为 011 ????,m m y x x βββ=+++ 拟合为 011 ????,1,,.i m m b x x i n βββ=+++= 用拟合误差?e Y Y =-作为随机误差ε的估计值得ε= 残差平方和 2 21 1 ?()n n i i i i i Q e b b ====-∑∑ ④回归模型的假设检验 由于不确定因变量与自变量之间是否存在线性关系,现对其作出检验。 要使在所有?||j β都很小时,y 与k x 的线性关系也明显,则设 0:0,1, ,.j H j m β== 当0H 成立时,回归平方和211 1?()n n i i i i U b b n ===-∑∑,残差平方和Q 满足 /(,1),/(1) U m F F m n m Q n m = ---- 利用matlab 求出统计量F ,查表得出α/2分位数 在显著水平α下,若 1/2/2(,1)(,1)F m n m F F m n m αα---<<-- 则接受0H ,否则拒绝。 ⑤回归系数的假设检验及区间估计 若0H 被拒绝,说明j β不全为0,但存在有若干个等于0的情况。因此做m+1个检验: ()0:0,0,1, ,.j j H j m β==

线性回归分析的数学模型

线性回归分析的数学模型 摘要 在实际问题中常常遇到简单的变量之间的关系,我们会遇到多个变量同处于一个过程之中,它们之间互相联系、互相制约.这些问题中最简单的是线性回归.线性回归分析是对客观事物数量关系的分析,是一种重要的统计分析方法,被广泛的应用于社会经济现象变量之间的影响因素和关联的研究.由于客观事物的联系错综复杂经济现象的变化往往用一个变量无法描述,故本篇论文在深入分析一元线性回归及数学模型的情况下,又详细地介绍了多元线性回归方程的参数估计和其显著性检验等.全面揭示了这种复杂的依存关系,准确测定现象之间的数量变动.以提高预测和控制的准确度. 本文中详细的阐述了线性回归的定义及其线性模型的简单分析并应用了最小二乘法原理.具体介绍了线性回归分析方程参数估计办法和其显著性检验.并充分利用回归方程进行点预测和区间预测. 但复杂的计算给分析方法推广带来了困难,需要相应的操作软件来计算回归分析求解操作过程中的数据.以提高预测和控制的准确度.从而为工农业生产及研究起到强有力的推动作用. 关键词:线性回归;最小二乘法;数学模型 目录 第一章前言 (1) 第二章线性模型 (2)

第一节一元线性模型 (2) 第二节多元线性模型 (4) 第三章参数估计 (5) 第一节一元线性回归方程中的未知参数的估计 (5) 第二节多元线性回归模型的参数估计 (8) 第四章显著性检验 (13) 第一节一元线性回归方程的显著性检验 (13) 第二节多元线性回归方程的显著性检验 (20) 第五章利用回归方程进行点预测和区间预测 (21) 第六章总结 (26) 致谢 (27) 参考文献………………………………………………………………………… 第一章前言 回归分析是对客观事物数量依存关系的分析.是数理统计中的一个常用的方法.是处理多个变量之间相互关系的一种数学方法. 在现实世界中,我们常与各种变量打交道,在解决实际问题过程中,我们常常会遇到多个变量同处于一个过程之中,它们之间互相联系、互相制约.常见的关系有两种:一类为“确定的关系”即变量间有确定性关系,其关系可用函数表达式表示.例如:路程s,时间t,与速度v之间有关系式:s=vt 在圆体给与半径r之间有关系式v= 另外还有一些变量.他们之间也有一定的关系,然而这种关系并不完全确定,不能用函数的形式来表达,在这种关系中至少有一个变量是随机的.例如:人的身高与体重有一定的关系,一般来讲身高高的人体重相对大一些.但是它们之间不能用一个确定的表达式表示出来.这次变量(或至少其中有一个

数学建模论文-中国GDP增长的数学模型及其分析与预测

中国GDP 增长的数学模型及其分析与预测 摘要 1978 年11月,中国经济开始改革开放,之后中国经济持续高速发展达30年之久,让全世界瞩目。这30年中,中国经济增长成为世界第三大经济体。 国内生产总值(GDP)是现代国民经济核算体系的核心指标,是衡量一个国家综合国力的重要指标。 本文就1978年到2008年的生产总值(GDP)等相关统计数据,先建立了关于GDP 增长 的回归预测模型.通过matlab 编程计算, 本文判断出 4 3295.8665x 1124.7878x 6564.1066x x 16126.75083967.15706?+-+-=y 7650.0007x 0.0880x 4.1564x -+-对现实数据的拟合效果最好,从而预测了2009年 到2018年的GDP 总量,但是预测值与实际极度不符。 为了得到更好的预测结果 ,本文建立了ARIMA 模型。 通过计算自相关函数和偏相关函数,确定取d =2。利用AIC 准则定阶,取ARIMA (1,2,2)模型。计算得到2009年到2018年的GDP 总量,通过与2009及2010的GDP 总量比较,发现该模型短期预测精度是比较高的。 选取ARIMA 模型预测的结果进行分析,预计中国GDP 将继续保持增长,不过增长率缓慢下降。猜想:GDP 年增长率最后将趋于稳定。 关键词:GDP ;回归预测模型;ARIMA 模型

引言 国内生产总值(Gross Domestic Product,简称GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,更可以反映一国的国力与财富。 一般来说,国内生产总值共有四个不同的组成部分,其中包括消费、私人投资、 =+++。式中:CA为消费、政府支出和净出口额。用公式表示为:GDP CA I CB X I为私人投资、CB为政府支出、X为净出口额。 一个国家或地区的经济究竟处于增长抑或衰退阶段,从这个数字的变化便可以观察到。一般而言,GDP公布的形式不外乎两种,以总额和百分比率为计算单位。当GDP 的增长数字处于正数时,即显示该地区经济处于扩张阶段;反之,如果处于负数,即表示该地区的经济进入衰退时期了。国内生产总值是指一定时间内所生产的商品与劳务的总量乘以“货币价格”或“市价”而得到的数字,即名义国内生产总值,而名义国内生产总值增长率等于实际国内生产总值增长率与通货膨胀率之和。因此,即使总产量没有增加,仅价格水平上升,名义国内生产总值仍然是会上升的。在价格上涨的情况下,国内生产总值的上升只是一种假象,有实质性影响的还是实际国内生产总值变化率,所以使用国内生产总值这个指标时,还必须通过GDP缩减指数,对名义国内生产总值做出调整,从而精确地反映产出的实际变动。因此,一个季度GDP缩减指数的增加,便足以表明当季的通货膨胀状况。如果GDP缩减指数大幅度地增加,便会对经济产生负面影响,同时也是货币供给紧缩、利率上升、进而外汇汇率上升的先兆。 一国的GDP大幅增长,反映出该国经济发展蓬勃,国民收入增加,消费能力也随之增强。在这种情况下,该国中央银行将有可能提高利率,紧缩货币供应,国家经济表现良好及利率的上升会增加该国货币的吸引力。反过来说,如果一国的GDP出现负增长,显示该国经济处于衰退状态,消费能力减低时,该国中央银行将可能减息以刺激经济再度增长,利率下降加上经济表现不振,该国货币的吸引力也就随之而减低了。因此,一般来说,高经济增长率会推动本国货币汇率的上涨,而低经济增长率则会造成该国货币汇率下跌。例如,1995-1999年,美国GDP的年平均增长率为4.1%,而欧元区11国中除爱尔兰较高外(9.0%),法、德、意等主要国家的GDP增长率仅为2.2%、1.5%和1.2%,大大低于美国的水平。这促使欧元自1999年1月1日启动以来,对美元汇率一路下滑,在不到两年的时间里贬值了30%。但实际上,经济增长率差异对汇率变动产生的影响是多方面的: 一是一国经济增长率高,意味着收入增加,国内需求水平提高,将增加该国的进口,从而导致经常项目逆差,这样,会使本国货币汇率下跌。 二是如果该国经济是以出口导向的,经济增长是为了生产更多的出口产品,则出口的增长会弥补进口的增加,减缓本国货币汇率下跌的压力。 三是一国经济增长率高,意味着劳动生产率提高很快,成本降低改善本国产品的竞争地位而有利于增加出口,抑制进口,并且经济增长率高使得该国货币在外汇市场上被看好,因而该国货币汇率会有上升的趋势。 在美国,国内生产总值由商务部负责分析统计,惯例是每季估计及统计一次。每次在发表初步预估数据(The Preliminary Estimates)后,还会有两次的修订公布(The First Revision & The Final Revision),主要发表时间在每个月的第三个星期。国内生产总值通常用来跟去年同期作比较,如有增加,就代表经济较快,有利其货币升

数学建模解多元线性回归问题

公司年销售额的分析 摘 要 公司年销售额通常和很多因素有关,但它们之间并不是确定性关系,所以我们用回归分析来处理,并建立了多元线性回归模型。本文用最小二乘的方法给出了变量间相关关系的回归方程,针对各因素对公司年销售额的影响我们与偏回归平方和联系起来,并将各因素的影响程度进行了排序。还通过F 检验和T 检验分别验证了回归方程的显著性和方程系数的显著性。最后我们采用了逐个剔除的方法找出了影响年销售额的主要因素,并且建立了新的回归方程,再次进行检验,新回归方程高度显著,最后得到了个人可支配收入、价格、投资和广告费密切相关的结论。 第一问:我们首先对附表1的数据进行处理,利用MATLAB 对残差向量进行分析,剔除其中的异常点。然后建立起多元线性回归模型,采用最小二乘的方法来估计回归方程的参数i 。我们引入偏回归平方和i Q 的概念来判定各因素对年销售额的影响程度,并对各因素的影响程度由深到浅进行了排序。 第二问:通过对回归平方和回S 和剩余平方和剩S 的分析,并且运用F 检验法 来判定线性回归方程的显著性。由于回归方程显著并不意味着每个自变量1x ,2x ,3x ,…8x 对因变量y 的影响都是重要的。所以我们对方程系数的显著性用T 检验 法进行了检验。最后通过逐个剔除的方法找出了其中的主要因素,主要因素为:个人可支配的收入、价格、投资、广告费这四个方面。 第三问:通过逐个剔除的方法建立了新的回归方程,并对新的回归方程进行显著性检验,对方程系数进行显著性检验。得到了公司的年销售额与个人可支配收入、价格、投资和广告费密切相关的结论。

关键词:多元线性回归 最小二乘法 F 检验 T 检验 偏回归平方和 1 问题重述 在经济流通领域中,某公司的年销售额(y )与个人可支配的收入(1x );商人的回扣(2x );价格(3x );研究与发展费(4x );投资(5x );广告费(6x );销售费用(7x );总的工业广告预算(8x )等有关。附表1中是某公司的原始数据。建立模型,分析各因素对年销售额的影响程度。并对所做模型进行检验,找出影响销售额的主要因素。最后分析主要因素与销售额的关系,并给出结论。

数学建模的主要建模方法

主要建模方法 1、类比法 建模一般在具体分析该实际问题的各个因素的基础上,通过联想、归纳对各因素进行分析,并且与已知模型比较,把未知关系化为已知关系,在不同的对象或完全不相关的对象中找出同样的或相似的关系,用已知模型的某些结论类比得到解决该“类似”问题的数学方法,最终建立起解决问题的模型 2、量纲分析 是在经验和实验的基础上,利用物理定律的量纲齐次性,确定各物理量之间的关系。 它是一种数学分析方法,通过量纲分析,可以正确地分析各变量之间的关系,简化实验和便于成果整理。 在国际单位制中,有七个基本量:质量、长度、时间、电流、温度、光强度和物质的量,它们的量纲分别为M、L、T、I、H、J和N,称为基本量纲。 量纲分析法常常用于定性地研究某些关系和性质,利用量纲齐次原则寻求物理量之间的关系,在数学建模过程中常常进行无量纲化,无量纲化是根据量纲分析思想,恰当地选择特征尺度将有量纲量化为无量纲量,从而达到减少参数、简化模型的效果。 3.差分法 差分法的数学思想是通过taylor级数展开等方法把控制方程中的导数用网格节点上的函数值的差商代替进行离散,从而建立以网格节点上的值为未知数的方程组,将微分问题转化为代数问题,是建立离散动态系统数学模型的有效方法。构造差分的方法有多种形式,目前主要采用的是泰勒级数展开方法。 其基本的差分表达式主要有以下几种形式:一阶向前差分、一阶向后差分、一阶中心差分和二阶中心差分等,其中前两种格式为一阶计算精度,后两种格式为二阶计算精度。通过对时间和空间这几种不同差分格式的组合,可以组合成不同的差分计算格式。 差分法的解题步骤为:建立微分方程;构造差分格式;求解差分方程;精度分析和检验 4、变分法 较少 5、图论法 数学建模中的图论方法是一种独特的方法,图论建模是指对一些抽象事物进行抽象、化简,并用图来描述事物特征及内在联系的过程。图论是研究由线连成的点集的理论。一个图中的结点表示对象,两点之间的连线表示两对象之间具有某种特定关系(先后关系、胜负关系、传递关系和连接关系等)。事实上,任何一个包含了某种二元关系的系统都可以用图形来模拟。因此,图论是研究自然科学、工程技术、经济问题、管理及其他社会问题的一个重要现代数学工具,更是成为了数学建模的一个必备工具 6、层次分析法 现在已广泛地应用在企业信用评级、经济管理规划、能源开发利用与资源分析、城市产业规划、企业管理、人才预测、科研管理、交通运输、水资源分析利用等方面。 层次分析法的基本步骤是:建立层次结构模型;构造成比较矩阵;计算权向量并做一致性检验 7.数据拟合法在建立数学模型时,实际问题有时仅给出一组数据,处理这类问题较简单易行

相关文档
相关文档 最新文档