文档库 最新最全的文档下载
当前位置:文档库 › 时间序列分析在温度预测中的应用

时间序列分析在温度预测中的应用

时间序列分析在温度预测中的应用
时间序列分析在温度预测中的应用

时间序列分析在温度预测中的应用

宋学娜,王晓雨,孟玲清

辽宁工程技术大学理学院,辽宁阜新 (123000)

E-mail :songxuena123@https://www.wendangku.net/doc/db7171027.html,

摘 要:通过介绍时间序列的相关知识,并将其应用到具体实例中,首先建立数据文件,画出数据原始图和自相关函数图,偏相关函数图,正泰概率图,并依据图形进行分析评价;然后用Box ―Jenkins 方法建模.进行模型参数估计和检验;最后做出预测。体现了时间序列的重要性。

关键词:时间序列分析,温度,Box ―Jenkins 方法建模,模型参数估计和检验

1. 引言

人们的一切活动,其目的无不在认识世界和改造世界,时间序列分析不仅可以从数量上揭示某一现象的发展变化规律或从动态的角度刻划某一现象之间与其他现象之间的内在数量关系及其变化规律性,达到认识客观世界之目的。而且运用时序模型还可以预测和控制现象的未来行为,修正或重新设计系统以达到利用和改造客观世界之目的。近几年来,时间序列分析一起了国内外学者及科研和管理人员的极大兴趣,特别是随着计算机的普及和软件的开发应用,对于只具有一般数学知识的学者和广大的工程技术及管理人员学习和掌握时间序列分析方法,并用以分析、探索社会经济现象的动态结构和发展变动规律,进行对未来状态进行预测控制,提供了实现可能性,且在诸多应用领域已取得了可喜成果。

温度对一个地区的农业,工业,生活都具有很重要的意义,温度随时间的变化而不同,其所形成的序列可以看成是时间序列。

2. 相关背景知识

2.1时间序列的含义

从统计意义上讲,所谓时间序列就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的序列。这种数列由于受到各种偶然因素的影响,往往表现出某种随机性,彼此之间存在着统计上的依赖关系。从数学意义上讲,对某一过程的某一个变量或一组变量)(t X 进行观察测量,在一系列时刻N t t t ,...,21(t 为自变量,且

N t t t <<<...21)得到的离散有序数据集合N i Xt Xt Xt Xt ,...,,...,,21称为离散数字时间序

列,即随机过程的一次样本实现。设):(T t t X ∈(i=1,2…)是一个随机过程,i Xt 是在时刻i 对过程)(t X 的观察值,则i Xt (i=1,2…)称为一次样本实现,也就是一个时间序列。从系统意义上看,时间序列就是某一系统在不同时间地点的响应。不仅指出时间序列是按一定顺序排列而成的,这里的"一定顺序"既可以是时间顺序,也可以是具有各种不同意义的物理量,可见时间序列只强调顺序的重要性,而非强调必须以时间顺序排列。[1]

2.2时间序列及模型的主要分类

按所研究的对象对少分,有一元时间序列和多元时间序列。按时间的连续性可分为离散时间序列和连续时间序列。按序列的统计特性分析,有平稳时间序列和非平稳时间序列。如果一个时间序列的概率分布于时间t 无关,则称该序列为严格的平稳时间序列。如果

序列的一、二阶矩阵存在,而且对任意时刻t 满足:(1)均值为常数(2)协方差为时间间隔τ的函数则称为宽平稳时间序列。

模型有:自回归模型(AR 模型);移动平均模型(MA 模型);自回归移动平均模型(ARMA 模型)[1]

用Y 表示某个时间序列,该序列可以分解成下面几个部分:),,,(e S C T f Y = 其中,T :趋势项,长期看时间序列逐渐增加或逐渐减少的变化

C :循环项,时间超过一年的周期性变动 S :季节项,一年内的周期性变动

e :随机项,不可预测的偶然因素对时间序列的影响

也可把T 和C 并在一起统称为趋势,一个时间序列可能包括上面四个部分中的全部或这几个部分。[2]

2.3时间序列建模的主要过程

一:平稳时间序列建模:

第一步 原始数据序列特性的初步分析 1. 分析原始数据序列是否满足:

⑴ 平稳性(有随机性,无趋势规律和季节波动) ⑵ 独立性(非白噪声,系统有记忆性) ⑶ 正态性 2. 模型的初步识别 第二步 模型的建立 1. 模型结构的建立 2. 模型参数的估计

第三步 模型的评价、修改与最终模型的确定 1. 模型拟合检验

2. 藉助函数aicbic 的多种模型的比较与选优

3. 用蒙特卡洛模拟方法验证所建模型的可靠性 二:非平稳时间序列建模: 第一步 数据特性的初步分析

第二步 剔除数据长期趋势(将非平稳时间序列转化为平稳时间序列) 方法一: 典型分解方法

⑴ 用时间回归法拟合长期趋势T =a +bt ⑵ 从原始数据中剔除长期趋势 ⑶ 考察剔除长期趋势后的数据特性 方法二:用差分法剔除长期趋势

⑴ 用函数price2ret 将非平稳序列转化为平稳序列 (2)考察变换后的数据特性

第三步 借助AIC/BIC 准则多模型比较方法建模(仅对方法2作后续处理)

(1)模型识别:1)在可能的AR 模型中评价与选择;2)在可能的MA 模型

中评价与选择;3)在可能的ARMA 模型中评价与选择;

(2)模型参数估计

第四步模型的检验

第五步模型预测:(1)计算预测残差并求残差平方和

(2)预测结果可视化

3.具体应用实例

3.1问题与数据

某年某地2月1日至8月18日中午温度数据(摄氏温度):根据所建模型对8月19

日至29日中午的温度做出预报,并使预报结果可视化.

表1 2月1日至8月18日中午温度数据

-5.1 -10.1 -0.3 -1.1 -0.1 -0.1 -0.6 -4.6 -0.2 -7.3 -7.3 -0.1 -0.5 -2.8 -5 6.7 -5.8 -4.6 -5.1 -4 -6.4 -3.4 -4.3 -5.1 -4.9 -4.6 -7.1 -7.7 -9.7 -5.2 -6.6 -7.4 -3.9 -3.8 -1.1 -1.4 -4.8 -6.4 -3 -9.6 -4.2 0.2 0 0.8 2.9 2.6 -0.4 -3 -3 -2.8 -3.9 -3.4 -0.8 -3.8 -5.7 -6.3 -6 -5.3 -4.3 -3.4 -1.6 2 0.1 -1.2 -0.8 0.3 -1.7 0.7 1.9 0.4 -2.6 -3.7 -2.4 -1.5 -2.9 -4.2 -4.9 -0.7 -3.1 -4.5 -4.1 -4.2 -2.2 -3.3 -2.6 -2.4 -2.4 -2.8 -4.3 -3.2 -3.5 -3.7 -2.3 -2.5 -3.9 -4.7 -0.2 2.1 1.8 3.8 -0.4 0.3 0 0.6 -0.1 1.7 -2.4 -0.5 -2.9 -0.6 3.7 5.4 7.6 2.2 3.6 7.8 7.8 5.2 0.8 2.7 0.7 1.4 4.2 3.7 0.3 0.6 0.6 -0.6 -0.7 2.8 2.7 1.5 2.1 -0.2 0 3.3 5.8 3.4 1.8 3.6 4.9 3.9 1.2 5.5 0.1 5.5 7.6 13.6 9.7 7.9 11.5 8.4 10.5 12.2 10.5 7.7 6.2 7.2 9.1 9.2 4.9 5.3 7.6 4.8 4.8 2.8 2.3 1.1 0.1 1.2 1.2 5.5 4.3 1.7 -0.1 1.6 4.3 3.9 6.1 6.9 5.9 7.3 5 2.8 3.1 5 7.2 8.8 13.6 13.1 12.3 11.4 11.3 7.2 4.9 5.1 7.1 8.2 9.7

3.2相应的matlab求解过程

3.2.1.画图并分析数据

wdsj=[5.1 -10.1 -0.3 -1.1 -0.1 -0.1 -0.6 -4.6 -0.2 -7.3 -7.3 -0.1 -0.5 -2.8 -5 -6.7 -5.8 -4.6 -5.1 -4 -

6.4 -3.4 -4.3 -5.1 -4.9 -4.6 -

7.1 -7.7 -9.7 -5.2 -6.6 -7.4 -3.9 -3.8 -1.1 -1.4 -4.8 -6.4 -3 -9.6 -4.2 0.2 0

0.8 2.9 2.6 -0.4 -3 -3 -5.6 -2.8 -3.9 -3.4 -0.8 -3.8 -5.7 -6.3 -6 -5.3 -4.3 -3.4 -1.6 2 0.1 -1.2 -0.8 0.3 -

1.7 0.7 1.9 0.4 -

2.6 -

3.7 -2.4 -1.5 -2.9 -

4.2 -4.9 -0.7 -3.1 -4.5 -4.1 -4.2 -2.2 -3.3 -2.6 -2.4 -2.4 -2.8 -

4.3 -3.2 -3.5 -3.7 -2.3 -2.5 -3.9 -4.7 -0.2 2.1 1.8 3.8 -0.4 0.3 0 0.6 -0.1 1.7 -2.4 -0.5 -2.9 -0.6 3.7

5.4 7.6 2.2 3.6 7.8 7.8 5.2 0.8 2.7 0.7 1.4 4.2 3.7 0.3 0.6 0.6 -0.6 -0.7 2.8 2.7 1.5 2.1 -0.2 0 3.3 5.8

3.4 1.8 3.6

4.9 3.9 1.2

5.5 0.1 5.5 7.6 13.6 9.7 7.9 11.5 8.4 10.5 12.2 10.5 7.7

6.2

7.2 9.1 9.2 4.9

5.3 7.6 4.8 4.8 2.8 2.3 1.1 0.1 1.2 1.2 5.5 4.3 1.7 -0.1 1.6 4.3 3.9

6.1 6.9 5.9

7.3 5 2.8 3.1 5 7.2

8.8

13.6 13.1 12.3 11.4 11.3 7.2 4.9 5.1 7.1 8.2 9.7];

subplot(2,2,1)

plot(wdsj,'.'),lsline,title('原始数据图')

s ubplot(2,2,2)

autocorr(wdsj,60),title('自相关函数图')

subplot(2,2,3)

parcorr(wdsj,60),title('偏相关函数图像')

subplot(2,2,4)

normplot(wdsj),title('数据的正态概率图')[3]~[4]

图1 数据原始图

由图一知:

(1)有原始数据散点图可以看出,数据有缓慢的上升趋势呈现非平稳性⑵由自相关函数图像可以看出,数据没有有季节波动因为自相关函数图像没有显现出周期性。⑶由自相关函数图像可以看出,数据不是白噪声因为自相关函数值在K≥1时存在显著非零的点。⑷原始数据的正态概率图基本呈现直线状态,可以初步判断数据具有正态性(可以理解为系统的干扰源是正态白噪声)

3.2.2用基本差分变换将非平稳序列转化为平稳序列

w = wdsj(2:end)-wdsj(1:end-1);

clf

subplot(3,1,1)

plot(w,'.'),lsline,title('差分序列的散点图')

subplot(3,1,2)

autocorr(w,60),title('自相关函数图像')

subplot(3,1,3)

parcorr(w,60),title('偏相关函数图像')[3]~[4]

图2 平稳序列图

从图二可知:

(1)自相关函数值,当k≥1时绝大多数显著为零,且无明显的周期性特征,因此可以认为已改数据序列是平稳的(无趋势规律和季节性波动)。

⑵自相关函数值,当k≥1时存在显著非零的点,故其不是白噪声序列,可以考虑拟合建模。

⑶自相关函数图像显示出在k=1截尾的特征,而偏相关函数图像呈现出拖尾的特性,初步判断应用MA(1)模型拟合

3.2.3建模、评价与检验

用AIC/BIC确定模型阶数

Eaic=zeros(4,4);

Ebic=zeros(4,4);

for r=1:4

for m=1:4

spec=garchset('R',r,'M',m,'Display','off');

[Coeff,Errors,LLF]=garchfit(spec,w);

NumParams=Garchcount(Coeff);

[AIC,BIC]=aicbic(LLF,NumParams,199);

Eaic(r,m)=AIC;

Ebic(r,m)=BIC;

end

end

Eaic

Ebic

aicMIN=min(min(Eaic))

bicMIN=min(min(Ebic)) [3]~[4]

表2 运行结果

Eaic =

Ebic =

942.5410 944.4482946.4130 948.2218955.7142960.9148966.1728 971.2749944.4443 946.4404948.4305 949.1605960.9108966.2002971.4836 975.5069946.4188 948.4318949.9428 950.7396966.1786971.4849976.2893 980.3793948.0837 949.9177950.7188 952.1479

971.1369

976.2641980.3585 985.0810aicMIN =942.5410

bicMIN =955.7142

由结果可知AIC 准则得最优模型是ARMA(1,1)模型,BIC 准则得最优模型是ARMA(1,1) spec=garchset('M',1,'R',1)

[Coeff,Errors,LLF,Innovations,Sigma,Summary] =garchfit(spec , w);Coeff

[3]~[4]

结果:

spec = Comment: 'Mean: ARMAX(1,1,?); Variance: GARCH(0,0) ' Distribution: 'Gaussian' R: 1 M: 1 C: [] AR: [] MA: []

VarianceModel: 'GARCH' K: []

Optimization terminated: magnitude of directional derivative in search direction less than 2*options.TolFun and maximum constraint violation is less than options.TolCon. No active inequalities.

Coeff = Comment: 'Mean: ARMAX(1,1,0); Variance: GARCH(0,0) ' Distribution: 'Gaussian' R: 1 M: 1

C: 0.0207 AR: 0.4939 MA: -0.8069

VarianceModel: 'GARCH' K: 6.4129

所建模型为:

210.80690.49390.0207???++=t t t t X εεε

[H, pValue, Qstat, CriticalValue] = lbqtest(Innovations) [3]~[4]

结果:H = 0 pValue =0.9865 Qstat =8.6628 CriticalValue = 31.4104 3.2.4.模型预测 t=11

Periods=11;

[W_pred_sigma,W_pred_dmean] =garchpred(Coeff,w,Periods) [3]~[4]

表3 预测结果

W_pred_sigma

2.5324 2.5324 2.5324 2.5324 2.5324 2.5324 2.5324 2.5324 2.5324 2.5324 2.5324

W_pred_dmean

-0.4862 -0.2194 -0.0877 -0.0226 0.0095 0.0254 0.0332 0.0371 0.0390 0.0399 0.0404

3.2.5将预测值还原为8月19日至29日中午的温度

wdsj_pred_dmean=wdsj(end)+cumsum(W_pred_dmean)

wdsj_pred_upper=wdsj(end)+cumsum(W_pred_dmean+W_pred_sigma)

wdsj_pred_lower=wdsj(end)+cumsum(W_pred_dmean-W_pred_sigma) [3]~[4]

表4 结果

wdsj_pred_dmean

9.2138 8.9944 8.9067 8.8841 8.8936

8.9189 8.9521 8.9892 9.0282 9.0681

9.1085

wdsj_pred_upper

11.7462 14.0591 16.5038 19.0135 21.5554

24.1131 26.6787 29.2481 31.8195 34.3918

36.9645

wdsj_pred_lower

6.6815 3.9297 1.3096 -1.2454 -3.7683

-6.2753 -8.7744 -11.2697 -13.7631 -16.2556 -18.7475

3.2.6计算预测残差并求残差平方和

wdsj_pred_Innovations=wdsj(end-10:end)-wdsj_pred_dmean

SST=sum(wdsj_pred_Innovations.^2) [3]~[4]

表5 结果

wdsj_pred_Innovations

4.3862 4.1056 3.3933 2.5159 2.4064

-1.7189 -4.0521 -3.8892 -1.9282 -0.8681

0.5915

SST 99.0515

3.2.7预测结果可视化

T=1:length(wdsj)+11;

wdsj_pred=[wdsj(end-11),wdsj_pred_dmean];

clf

plot(T(end-13:end),wdsj(end-13:end),':r')

hold on

plot(T(end-11:end),wdsj_pred,'-b')

plot(T(end-10:end),wdsj_pred_upper,'o')

plot(T(end-10:end),wdsj_pred_lower,'x')

title('温度预测图')

hold off [3]~[4]

图3 预测结果图

4.结论

通过运用时间序列的相关知识,对数据进行分析,并作出预测得出理想的结果,由此可以证实时间序列的实用性,同时对类似问题提供了一个好的预测计算方法

参考文献

[1] 王振龙.时间序列分析[M].北京.中国统计出版社,2002

[2] 潘红宇.时间序列分析[M].对外经济贸易大学出版社,2006

[3] 张德喜.MATLAB语言程序设计教程[M].中国铁道出版社,2006

[4] 苏金明.MATLAB工具箱应用[M].电子工业出版社 , 2004

Time Series Analysis And It's Application In Temperature

Forecast

Song Xuena,Wang Xiaoyu,Meng Lingqing

Liaoning Engineering Technology University,Fu x in,Liaoning (123000)

Abstract

Through introducing the related knowledge of time series analysis and appling the knowledge in the concrete example .First build the data document and draw up the primitive picture of data, the self relevance picture of function,the partial relevance picture of function ,the picture of thailandz probability.Second analyse the valuation according to the picture.Third build a model using the method of Box―Jenkins, analyse the parameter in the model and check it.Finally make a forecast.Which embodes the significance of time series.

Keywords:Time Series Analysis;Temperature;the method of Box―Jenkins;analyse the parameter in the model and check it

《时间序列分析》案例

《时间序列分析》案例案例名 称:时间序列分析在经济预测中的应用内容要 求:确定性与随机性时间序列之比较设计作 者:许启发,王艳明 设计时 间:2003年8月

案例四:时间序列分析在经济预测中的应用 一、案例简介 为了配合《统计学》课程时间序列分析部分的课堂教学,提高学生运用统计分析方法解决实际问题的能力,我们组织了一次案例教学,其内容是:对烟台市的未来经济发展状况作一预测分析,数据取烟台市1949—1998年国内生产总值(GDP)的年度数据,并以此为依据建立预测模型,对1999年和2000年的国内生产总值作出预测并检验其预测效果。国内生产总值是指一个国家或地区所有常住单位在一定时期内生产活动的最终成果,是反映国民经济活动最重要的经济指标之一,科学地预测该指标,对制定经济发展目标以及与之相配套的方针政策具有重要的理论与实际意义。在组织实施时,我们首先将数据资料印发给学生,并讲清本案例的教学目的与要求,明确案例所涉及的教学内容;然后给学生一段时间,由学生根据资料,运用不同的方法进行预测分析,并确定具体的讨论日期;在课堂讨论时让学生自由发言,阐述自己的观点;最后,由主持教师作点评发言,取得了良好的教学效果。 经济预测是研究客观经济过程未来一定时期的发展变化趋势,其目的在于通过对客观经济现象历史规律的探讨和现状的研究,求得对未来经济活动的了解,以确定社会经济活动的发展水平,为决策提供依据。 时间序列分析预测法,首先将预测目标的历史数据按照时间的先后顺序排列,然后分析它随时间的变化趋势及自身的统计规律,外推得到预测目标的未来取值。它与回归分析预测法的最大区别在于:该方法可以根据单个变量的取值对其自身的变动进行预测,无须添加任何的辅助信息。 本案例的最大特色在于:它汇集了统计学原理中的时间序列分析这一章节的所有知识点,通过本案例的教学,可以把不同的时间序列分析方法进行综合的比较,便于学生更好地掌握本章的内容。 二、案例的目的与要求 (一)教学目的 1.通过本案例的教学,使学生认识到时间序列分析方法在实际工作中应用的必要性和可能性; 2.本案例将时间序列分析中的水平指标、速度指标、长期趋势的测定等内容有机的结合在一起,以巩固学生所学的课本知识,深化学生对课本知识的理解; 3.本案例是对烟台市的国内生产总值数据进行预测,通过对实证结果的比较和分析,使学生认识到对同一问题的解决,可以采取不同的方法,根据约束条件,从中选择一种合适的预测方法; 4.通过本案例的教学,让学生掌握EXCEL软件在时间序列分析中的应用,对统计、计量分析软件SPSS或Eviews等有一个初步的了解; 5.通过本案例的教学,有助于提高学生运用所学知识和方法分析解决问题的能力、合作共事的能力和沟通交流的能力。 (二)教学要求 1.学生必须具备相应的时间序列分析的基本理论知识; 2.学生必须熟悉相应的预测方法和具备一定的数据处理能力; 3.学生以主角身份积极地参与到案例分析中来,主动地分析和解决案例中的问题; 4.在提出解决问题的方案之前,学生可以根据提供的样本数据,自己选择不同的统计分析方法,对这一案例进行预测,比较不同预测方法的异同,提出若干可供选择的方案; 5.学生必须提交完整的分析报告。分析报告的内容应包括:选题的目的及意义、使用数据的特征及其说明、采用的预测方法及其优劣、预测结果及其评价、有待于进一步改进的思路或需要进一步研究的问题。 三、数据搜集与处理 时间序列数据按照不同的分类标准可以划分为不同的类型,最常见的有:年度数据、季度数据、月度数据。本案例主要讨论对年度数据如何进行预测分析。考虑到案例设计时的侧重点,本案例只是对烟

【经济预测与决策】时间序列分析预测法

经济预测与决策第四章时间序列分析预测法时间序列分析预测法时间序列分析预测法是将预测目标的历史数据按照时间的顺序排列成为时间序列,然后分析它随时间的变化趋势, 外推预测目标的未来值。本章学习目的与要求通过本章的学习,了解时间序列的概念;掌握移动平均法和指数平滑法。本章学习重点和难点重点是移动平均法;难点是指数平滑法。本章内容提示第一节时间序列第二节移动平均法第三节指数平滑法第一节时间序列一、时间序列二、时间序列的影响因素三、时间序列因素的组合形式四、时间序列预测的步骤一、时间序列时间序列是指某种经济统计指标的数值,按时间先后顺序排列起来的数列。时间序列是时间t 的函数,若用Y 表示,则有:Y=Y(t )。时间序列时间序列按其指标不同,可分为绝对数时间序列、相对数时间序列和平均数时间序列三种。 绝对数时间序列是基本序列。可分为时期序列和时点序列两种。时期序列是指由反映某种社会经济现象在一段时期内发展过程的总量指标所构成的序列。如各个年度的国民生产总值。时点序列是指由反映某种社会经济现象在一定时点上的发展状况的指标所构成的序列。如各个年末的人口总数。 二、时间序列的影响因素一个时间序列是多种因素综合作用的结果。这些因素可以分为四种:1. 长期趋势变动2. 季节变动3. 循环变动4. 不规则变动1. 长期趋势变动长期趋势变动又称倾向变动,它是指伴随着经济的发展,在相当长的持续时间内,单方向的上升、下降或水平变动的因素。它反映了经济现象的主要 变动趋势。长期趋势变动是时间t 的函数,它反映了不可逆转的倾向的变动。长期趋势变动通常用T表示,T=T( t )。2.循环变动循环变动是围绕于

基于时间序列分析的股票价格短期预测与分析

基于时间序列分析的股票价格短期预测与 分析 姓名:王红芳数学与应用数学一班指导老师:魏友华 摘要 时间序列分析是经济领域研究的重要工具之一,它描述历史数据随时间变化的规律,并用于预测经济变量值。在股票市场上,时间序列预测法常用于对股票价格趋势进行预测,为投资者和股票市场管理方提供决策依据。本文通过各种预测方法的对比,突出时间序列分析的优势,从时间序列的概念出发介绍了时间序列分析预测法的基础以及其简单的应用模型。文中使用中石化股票的历史收盘价数据,运用时间序列预测法预测出中石化股票的后五个交易日的收盘价,通过对预测价格和实际价格做出对比,表明时间序列预测法的效果比较好。 关键词:时间序列;股票价格;预测

The short-term stock price prediction based on time series analysis Abstract: The analysis of time series is one of the important tools for researching in the field of economy, it describes the law of historic data with the time passing by and it is also used to predict the value of economic variables. In the stock market, the forecasting method of time series is commonly used to forecast the trend of stock price, and provide evidence of decision making for investors and managements. In the thesis, through the comparison of various forecasting methods to highlight the advantages of the analysis of time series, beginning with the concept of time series, I introduce the basic of forecasting method of the analysis of time series as well as its simple application model. in the paper, I use the historic closing price data of Sinopec shares and the forecasting method of time series to predict the Sinopec shares' closing price of the last five days, and by comparison between predicting price and actual price to show the good effect of the forecasting method of time series. Keywords: Time series; Stock price; Forecast

时间序列分析方法第章预测

第四章 预 测 在本章当中我们讨论预测的一般概念和方法,然后分析利用),(q p ARMA 模型进行预测的问题。 §4.1 预期原理 利用各种条件对某个变量下一个时点或者时间阶段内取值的判断是预测的重要情形。为此,需要了解如何确定预测值和度量预测的精度。 4.1.1 基于条件预期的预测 假设我们可以观察到一组随机变量t X 的样本值,然后利用这些数据预测随机变量1+t Y 的值。特别地,一个最为简单的情形就是利用t Y 的前m 个样本值预测1+t Y ,此时t X 可以描述为: 假设*|1t t Y +表示根据t X 对于1+t Y 做出的预测。那么如何度量预测效果呢?通常情况下,我们利用损失函数来度量预测效果的优劣。假设预测值与真实值之间的偏离作为损失,则简单的二次损失函数可以表示为(该度量也称为预测的均方误差): 定理4.1 使得预测均方误差达到最小的预测是给定t X 时,对1 +t Y 的条件数学期望,即: 证明:假设基于t X 对1+t Y 的任意预测值为: 则此预测的均方误差为: 对上式均方误差进行分解,可以得到: 其中交叉项的数学期望为(利用数学期望的叠代法则): 因此均方误差为: 为了使得均方误差达到最小,则有: 此时最优预测的均方误差为: 211*|1)]|([)(t t t t t X Y E Y E Y MSE +++-= End 我们以后经常使用条件数学期望作为随机变量的预测值。 4.1.2 基于线性投影的预测 由于上述条件数学期望比较难以确定,因此将预测函数的范围限制在线性函数当中,我们考虑下述线性预测: 如此预测的选取是所有预测变量的线性组合,预测的优劣则体现在系数向量的选择上。 定义4.1 如果我们可以求出一个系数向量值α,使得预测误差)(1t t X Y α'-+与t X 不相关: 则称预测t X α'为1+t Y 基于t X 的线性投影。 定理4.2 在所有线性预测当中,线性投影预测具有最小的均方误差。

时间序列分析法原理及步骤(精)

时间序列分析法原理及步骤 ----目标变量随决策变量随时间序列变化系统 一、认识时间序列变动特征 认识时间序列所具有的变动特征, 以便在系统预测时选择采用不同的方法 1》随机性:均匀分布、无规则分布,可能符合某统计分布(用因变量的散点图和直方图及其包含的正态分布检验随机性, 大多服从正态分布 2》平稳性:样本序列的自相关函数在某一固定水平线附近摆动, 即方差和数学期望稳定为常数 识别序列特征可利用函数 ACF :其中是的 k 阶自 协方差,且 平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋于 0, 前者测度当前序列与先前序列之间简单和常规的相关程度, 后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。实际上, 预测模型大都难以满足这些条件, 现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。 二、选择模型形式和参数检验 1》自回归 AR(p模型

模型意义仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量互相独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性的比你更造成的困难用 PACF 函数判别 (从 p 阶开始的所有偏自相关系数均为 0 2》移动平均 MA(q模型 识别条件

平稳时间序列的偏相关系数和自相关系数均不截尾,但较快收敛到 0, 则该时间序列可能是 ARMA(p,q模型。实际问题中,多数要用此模型。因此建模解模的主要工作时求解 p,q 和φ、θ的值,检验和的值。 模型阶数 实际应用中 p,q 一般不超过 2. 3》自回归综合移动平均 ARIMA(p,d,q模型 模型含义 模型形式类似 ARMA(p,q模型, 但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用 ARMA(p,q模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中 d (差分次数一般不超过 2. 模型识别 平稳时间序列的偏相关系数和自相关系数均不截尾,且缓慢衰减收敛,则该时间序列可能是 ARIMA(p,d,q模型。若时间序列存在周期性波动, 则可按时间周期进

时间序列分析与预测论文

对1950-2009年的新疆社会消费品零售总额的时间序列分析与预测 利用1950-2009年的新疆社会消费品零售总额(记为:save,单位:万元) 的时间序列数据进行分析,建立时间序列ARIMA模型,并预测未来10年的社会 消费品零售总额。 表1 1950-2009年的新疆社会消费品零售总额 数据来源:《新疆统计年鉴2010》,《新疆五十年》 模型应用 data a; input date cost; cards; 1950 21920 1951 29023 1952 36646 1953 43198 1954 52216 1955 61379 1956 71464

1957 85578 1958 92490 1959 110526 1960 119059 1961 106780 1962 105454 1963 100837 1964 105406 1965 112970 1966 121349 1967 129530 1968 122971 1969 131318 1970 132306 1971 137958 1972 143416 1973 154676 1974 158035 1975 168486 1976 181377 1977 193457 1978 218865 1979 247796 1980 293590 1981 340739 1982 364133 1983 413324 1984 461439 1985 573842 1986 638981 1987 723913 1988 886986 1989 981497 1990 1043041 1991 1215180 1992 138**** **** 1683737 1994 1971086 1995 2536475 1996 2953597 1997 3104197 1998 3275210 1999 3473958 2000 3744999

时间序列分析方法第资料章范文预测

第四章 预 测 在本章当中我们讨论预测的一般概念和方法,然后分析利用),(q p ARMA 模型进行预测的问题。 § 预期原理 利用各种条件对某个变量下一个时点或者时间阶段内取值的判断是预测的重要情形。为此,需要了解如何确定预测值和度量预测的精度。 4.1.1 基于条件预期的预测 假设我们可以观察到一组随机变量t X 的样本值,然后利用这些数据预测随机变量1+t Y 的值。特别地,一个最为简单的情形就是利用t Y 的前m 个样本值预测1+t Y ,此时t X 可以描述为: 假设*|1t t Y +表示根据t X 对于1+t Y 做出的预测。那么如何度量预测效果呢?通常情况下,我们利用损失函数来度量预测效果的优劣。假设预测值与真实值之间的偏离作为损失,则简单的二次损失函数可以表示为(该度量也称为预测的均方误差): 定理 使得预测均方误差达到最小的预测是给定t X 时,对1+t Y 的条件数学期望,即: 证明:假设基于t X 对1+t Y 的任意预测值为: 则此预测的均方误差为: 对上式均方误差进行分解,可以得到: 其中交叉项的数学期望为(利用数学期望的叠代法则): 因此均方误差为: 为了使得均方误差达到最小,则有: 此时最优预测的均方误差为: 211*|1)]|([)(t t t t t X Y E Y E Y MSE +++-= End 我们以后经常使用条件数学期望作为随机变量的预测值。 4.1.2 基于线性投影的预测 由于上述条件数学期望比较难以确定,因此将预测函数的范围限制在线性函数当中,我们考虑下述线性预测: 如此预测的选取是所有预测变量的线性组合,预测的优劣则体现在系数向量的选择上。 定义 如果我们可以求出一个系数向量值α,使得预测误差)(1t t X Y α'-+与t X 不相关: 则称预测t X α'为1+t Y 基于t X 的线性投影。 定理 在所有线性预测当中,线性投影预测具有最小的均方误差。 证明:假设t X g '是任意一个线性预测,则对应的均方误差可以分解为: 由于t X α'是线性投影,则有:

第13章时间序列分析和预测

第13章时间序列分析和预测 三、选择题 1.不存在趋势的序列称为()。 A. 平稳序列B. 周期性序列 C. 季节性序列D. 非平稳序列 2.包含趋势性、季节性或周期性的序列称为()。 A. 平稳序列B. 周期性序列 C. 季节性序列D. 非平稳序列 3.时间序列在长时期内呈现出来的某种持续向上或持续下降的变动称为()。A. 趋势B. 季节性C. 周期性D. 随机性 < 4.时间序列在一年内重复出现的周期性波动称为()。 A. 趋势B. 季节性C. 周期性D. 随机性 5.时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动称为()。A. 趋势B. 季节性C. 周期性D. 随机性 6.时间序列中除去趋势、周期性和季节性之后的偶然性波动称为()。A. 趋势B. 季节性C. 周期性D. 随机性 7.从下面的图形可以判断该时间序列中存在()。 A. 趋势B. 季节性C. 周期性D. 趋势和随机性 8.增长率是时间序列中()。 … A. 报告期观察值与基期观察值之比 B. 报告期观察值与基期观察值之比减1后的结果 C. 报告期观察值与基期观察值之比加1后的结果 D. 基期观察值与报告期观察值之比减1后的结果 9.环比增长率是()。 A. 报告期观察值与前一时期观察值之比减1 B. 报告期观察值与前一时期观察值之比加1 C. 报告期观察值与某一固定时期观察值之比减1 D. 报告期观察值与某一固定时期观察值之比加1 10.定基增长率是()。 , A. 报告期观察值与前一时期观察值之比减1

B. 报告期观察值与前一时期观察值之比加1 C. 报告期观察值与某一固定时期观察值之比减1 D. 报告期观察值与某一固定时期观察值之比加1 11.时间序列中各逐期环比值的几何平均数减1后的结果称为 ( )。 A. 环比增长率 B. 定基增长率 C. 平均增长率 D. 年度化增长率 12.增长1个百分点而增加的绝对数量称为 ( )。 A. 环比增长率 B. 平均增长率 C. 年度化增长率 D. 增长1%绝对值 * 13.判断时间序列是否存在趋势成分的一种方法是 ( )。 A. 计算环比增长率 B. 利用回归分析拟合一条趋势线 C. 计算平均增长率 D. 计算季节指数 14.指数平滑法适合于预测 ( )。 A. 平稳序列 B. 非平稳序列 C. 有趋势成分的序列 D. 有季节成分的序列 15.移动平均法适合于预测 ( )。 A. 平稳序列 B. 非平稳序列 C. 有趋势成分的序列 D. 有季节成分的序列 16.下面的哪种方法不适合于对平稳序列的预测 ( )。 # A. 移动平均法 B. 简单平均法 C. 指数平滑法 D. 线性模型法 17.下面的公式哪一个是均方误差 ( )。 A.n Y E Y i i i ∑???? ???-100 B. n E Y i i ∑- C. () n E Y n i i i ∑=-12 D. ()n E Y n i i i ∑=-1 18.通过对时间序列逐期递移求得平均数作为预测值的一种预测方法称为 ( )。 A. 简单平均法 B. 加权平均法 C. 移动平均法 D. 指数平滑法 19.指数平滑法得到t+1期的预测值等于 ( )。 A. t 期的实际观察值与第t+1期指数平滑值的加权平均值 @ B. t 期的实际观察值与第t 期指数平滑值的加权平均值 C. t 期的实际观察值与第t+1期实际观察值的加权平均值 D. t+1期的实际观察值与第t 期指数平滑值的加权平均值 20.在使用指数平滑法进行预测时,如果时间序列有较大的随机波动,则平滑系数α的取值 ( )。 A. 应该小些 B. 应该大些

时间序列分析与预测论文

对1950-2009年的新疆社会消费品零售总额的时间序列分析与预测 利用1950-2009年的新疆社会消费品零售总额(记为:save,单位:万元)的时间序列数据进行分析,建立时间序列ARIMA模型,并预测未来10年的社会消费品零售总额。 表1 1950-2009年的新疆社会消费品零售总额 数据来源:《新疆统计年鉴2010》,《新疆五十年》 模型应用 dataa; input date cost; cards; 1950 21920 195129023 1952 36646 195343198 195452216 1955 61379 1956 71464 1957 85578

1958 924901959 110526 1960 119059 1961 106780 1962 105454 1963 100837 1964105406 19651129701966121349 1967 129530 19681229711969 131318 1970 132306 1971 137958 1972 143416 1973 154676 1974158035 1975 168486 1976 181377 1977193457 1978 2188651979 247796 1980 293590 1981340739 1982 364133 1983413324 1984 461439 1985 573842 1986638981 19877239131988 8869861989 981497 1990 1043041 19911215180 199213824521993 1683737 19941971086 1995 2536475 1996 2953597 1997 3104197199832752101999 3473958 2000 3744999 2001 4063487

时间序列分析-降水量预测模型

课程名称: 时间序列分析 题目: 降水量预测 院系:理学院 专业班级:数学与应用数学10-1 学号: 87 学生姓名:戴永红 指导教师:__潘洁_ 2013年 12 月 13日

1.问题提出 能不能通过以前的降水序列为样本预测出2002的降水量? 2.选题 以国家黄河水利委员会建站的山西省河曲水文站1952年至2002年51年的资料为例,以1952年至2001年50年的降水序列作为样本,建立线性时间序列模型并预测2002年的降水状态与降水量,并与2002年的实际数据比较说明本模型的具体应用及预测效果。资料数据见表1。 表1 山西省河曲水文站55年降水量时间序列

3.原理 模型表示 均值为0,具有有理谱密度的平稳时间序列的线性随机模型的三种形式,描述如下: 1、()AR p 自回归模型:1122t t t p t p t ωφωφωφωα-------=L 由2p +个参数刻画; 2、()MA q 滑动平均模型:1122t t t t q t q ωαθαθαθα---=----L 由2q +个参数刻画; 3、(,)ARMA p q 混和模型: 11221122t t t p t p t t t q t q ωφωφωφωαθαθαθα----------=----L L (,)ARMA p q 混和模型由3p q ++个参数刻画; 自相关函数k ρ和偏相关函数kk φ 1、自相关函数k ρ刻画了任意两个时刻之间的关系,0/k k ργγ= 2、偏相关函数kk φ刻画了平稳序列任意一个长1k +的片段在中间值11,t t k ωω++-L 固定的条件下,两端t ω,t k ω+的线性联系密切程度。 3、线性模型k ρ、kk φ的性质 表2 三种线性模型下相关函数性质 模型识别

统计学之时间序列分析在经济预测中的应用

《时间序列分析》案例

案例名称:时间序列分析在经济预测中的应用内容要求:确定性与随机性时间序列之比较设计作者:许启发,王艳明 设计时间:2003年8月

案例四:时间序列分析在经济预测中的应用 一、案例简介 为了配合《统计学》课程时间序列分析部分的课堂教学,提高学生运用统计分析方法解决实际问题的能力,我们组织了一次案例教学,其内容是:对烟台市的未来经济发展状况作一预测分析,数据取烟台市1949—1998年国内生产总值(GDP)的年度数据,并以此为依据建立预测模型,对1999年和2000年的国内生产总值作出预测并检验其预测效果。国内生产总值是指一个国家或地区所有常住单位在一定时期内生产活动的最终成果,是反映国民经济活动最重要的经济指标之一,科学地预测该指标,对制定经济发展目标以及与之相配套的方针政策具有重要的理论与实际意义。在组织实施时,我们首先将数据资料印发给学生,并讲清本案例的教学目的与要求,明确案例所涉及的教学内容;然后给学生一段时间,由学生根据资料,运用不同的方法进行预测分析,并确定具体的讨论日期;在课堂讨论时让学生自由发言,阐述自己的观点;最后,由主持教师作点评发言,取得了良好的教学效果。 经济预测是研究客观经济过程未来一定时期的发展变化趋势,其目的在于通过对客观经济现象历史规律的探讨和现状的研究,求得对未来经济活动的了解,以确定社会经济活动的发展水平,为决策提供依据。 时间序列分析预测法,首先将预测目标的历史数据按照时间的先后顺序排列,然后分析它随时间的变化趋势及自身的统计规律,外推得到预测目标的未来取值。它与回归分析预测法的最大区别在于:该方法可以根据单个变量的取值对其自身的变动进行预测,无须添加任何的辅助信息。 本案例的最大特色在于:它汇集了统计学原理中的时间序列分析这一章节的所有知识点,通过本案例的教学,可以把不同的时间序列分析方法进行综合的比较,便于学生更好地掌握本章的内容。 二、案例的目的与要求 (一)教学目的 1.通过本案例的教学,使学生认识到时间序列分析方法在实际工作中应用的必要性和可能性; 2.本案例将时间序列分析中的水平指标、速度指标、长期趋势的测定等内容有机的结合在一起,以巩固学生所学的课本知识,深化学生对课本知识的理解; 3.本案例是对烟台市的国内生产总值数据进行预测,通过对实证结果的比较和分析,使学生认识到对同一问题的解决,可以采取不同的方法,根据约束条件,从中选择一种合适的预测方法; 4.通过本案例的教学,让学生掌握EXCEL软件在时间序列分析中的应用,对统计、计量分析软件SPSS或Eviews等有一个初步的了解; 5.通过本案例的教学,有助于提高学生运用所学知识和方法分析解决问题的能力、合作共事的能力和沟通交流的能力。 (二)教学要求 1.学生必须具备相应的时间序列分析的基本理论知识; 2.学生必须熟悉相应的预测方法和具备一定的数据处理能力; 3.学生以主角身份积极地参与到案例分析中来,主动地分析和解决案例中的问题; 4.在提出解决问题的方案之前,学生可以根据提供的样本数据,自己选择不同的统计分析方法,对这一案例进行预测,比较不同预测方法的异同,提出若干可供选择的方案;

相关文档