数学建模中时间序列详细说明.docx
- 文档编号:9432886
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:25
- 大小:504.22KB
数学建模中时间序列详细说明.docx
《数学建模中时间序列详细说明.docx》由会员分享,可在线阅读,更多相关《数学建模中时间序列详细说明.docx(25页珍藏版)》请在冰豆网上搜索。
数学建模中时间序列详细说明
数学建模中时间序列i羊细说明
基于Excel的时间序列预测与分析
1时序分析方法简介
时间序列相关概念
1.1.1时间序列的内涵以及组成因素
所谓时间序列就是将某一指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。
如经济领域中每年的产值、国民收入、商品在市场上的销量、股票数据的变化情况等,社会领域中某一地区的人口数、医院患者人数、铁路客流量等,H然领域的太阳黑子数、月降水量、河流流量等等,都形成了一个时间序列。
人们希望通过对这些时间序列的分析,从中发现和揭示现象的发展变化规律,或从动态的角度描述某一现象和其他现象之间的内在数量关系及其变化规律,从而尽可能多的从中提取出所需要的准确信息,并将这些知识和信息用于预测,以掌握和控制未來行为。
时间序列的变化受许多因素的影响,有些起着长期的、决定性的作用,使其呈现出某种趋势和一定的规律性;有些则起着短期的、非决定性的作用,使其呈现出某种不规则性。
在分析时间序列的变动规律时,事实上不可能对每个影响因素都一一划分开來,分别去作精确分析。
但我们能将众多影响因素,按照对现象变化影响的类型,划分成若干时间序列的构成因素,然后对这儿类构成要素分别进行分析,以揭示时间序列的变动规律性。
影响时间序列的构成因素可归纳为以下四种:
(1)趋势性(Trend),指现象随时间推移朝着一定方向呈现出持续渐进地上升、
下降或平稳的变化或移动。
这一变化通常是许多长期因素的结果。
(2)周期性(Cyclic),指时间序列表现为循环于趋势线上方和下方的点序列并持续一年以上的有规则变动。
这种因素是因经济多年的周期性变动产生的。
比如,高速通货膨胀时期后面紧接的温和通货膨胀时期将会使许多时间序列表现为交替地出现于一条总体递增地趋势线上下方。
(3)季节性变化(Seasonalvariation),指现象受季节性影响,按一固定周期呈现出的周期波动变化。
尽管我们通常将一个时间序列中的季节变化认为是以1年为期的,但是季节因素还可以被用于表示时间长度小于1年的有规则重复形态。
比如,每日交通量数据表现出为期1天的“季节性”变化,即高峰期到达高峰水平,而一天的其他时期车流量较小,从午夜到次口清晨最小。
(4)不规则变化(Irregularmovement),扌旨现象受偶然因素的影响而呈现出的不规则波动。
这种因素包括实际时间序列值与考虑了趋势性、周期性、季节性变动的估计值之间的偏差,它用于解释时间序列的随机变动。
不规则因素是由短期的未被预测到的以及不重复发现的那些影响时间序列的因素引起的。
时间序列一般是以上儿种变化形式的濫加或组合出现的(如图。
图季节型序列图含有季节与趋势因素的序
列
1.1.2时间序列的分类
根据其所研究的依据不同,可有不同的分类:
(1)按所研究的对象的多少来分,有一元时间序列和多元时间序列。
如某种商品的销售量数列,即为一元时间序列;如果所研究对象不仅仅是这一数列,而是多个变量,如按年、月顺序排序的气温、气压、雨量数据等,每个时刻对应着多个变量,则这种序列为多元时间序列。
(2)按时间的连续性可将时间序列分为离散时间序列和连续时间序列两种。
如果某一序列中的每一个序列值所对应的时间参数为间断点,则该序列就是一个离散时间序列;如果某一序列中的每个序列值所对应的时间参数为连续函数,则该序列就是一个连续时间序列。
(3)按序列的统计特性分,有平稳时间序列和非平稳时间序列两类。
所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。
平稳序列的时序图直观上应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及无周期特征;从理论上讲,分为严平稳与宽平稳两种。
相对的,时间序列的非平稳性,是指时间丿子列的统计规律随着时间的推移而发生变化。
(4)按序列的分布规律来分,有高斯型(Guassian)和非高斯型时间序列(non-
Guassian)
时间序列分析概述
时间序列分析是一种广泛应用的数据分析方法,它研究的是代表某一现象的一串随时间变化而又相关联的数字系列(动态数据),从而描述和探索该现象随时间发展变化的规律性。
时间序列的分析利用的手段可以通过直观简便的数据图法、指标法、模型法等来分析,而模型法应用更确切和适用也比较前两种方法复杂,能更本质地了解数据的内在结构和复杂特征,以达到控制与预测的目的。
时间序列分析方法包括:
(1)确定性时序分析:
它是暂时过滤掉随机性因素(如季节因素、趋势变动)进行确定性分析方法,其基本思想是用一个确定的时间函数〉,=/(/)来拟合时间序列,不同的变化采取不同的函数形式来描述,不同变化的龛加采用不同的函数盜加来描述。
具体可分为趋势预测法(最小二乘)、平滑预测法、分解分析法等;
(2)随机性时序分析:
其基本思想是通过分析不同时刻变量的相关关系,揭示
其相关结构,利用这种相关结构建立自回归、滑动平均、自回归滑动平均混合模型来来对时间仔列进行预测。
为了对时间序列分析方法有一个比较全面的了解,现将时间序列分析方法归纳如下:
确定性时间序列分析
由的介绍,我们知道时间序列的变动是长期趋势变动、季节变动、循环变动、不规则变动的耦合或叠加。
在确定性时间丿宇列分析中通过移动平均、指数平滑、最小二乘法等方法来体现出社会经济现象的长期趋势及带季节因子的长期趋势,预测未來的发展趋势。
1.3.1移动平均法
通过对时间序列逐期递移求得平均数作为预测值的一种方法叫移动平均法,它是对时间序列进行修匀,边移动边平均以排除偶然因素对原序列的影响,进而测定长期趋势的方法。
其简单的计算公式为:
预测值二最后〃个值的平均
其中:
〃二被认为是与预测下一个时期相关的最近的时期数
采用Excel进行移动平均时,在【数据分析】选项中选择【移动平均】,并在对话框中输入数据区域和移动见间隔即可。
说明:
"的选择:
采用移动平均法进行预测,用來求平均数的时期数〃的选择非常重要,这也是移动平均的难点。
因为〃取值的大小对对所计算的平均数的影响较大。
当〃=1时,移动平均预测值为原数据的序列值。
当"二全部数据的个数时,移动平均值等于且为全部数据的算术平均值。
显然,"值越小,表明对近期观测值预测的作用越重视,预测值对数据变化的反应速度也越快,但预测的修匀程度较低,估计值的精度也可能降低。
反之,"值越大,预测值的修匀程度越高,但对数据变化的反映程度较慢。
不存在一个确定时期"值的规则。
一般"在3〜200之间,视序列长度和预测
目标情况而定。
一般对水平型数据,〃值的选取较为随意;一般情况下,如果考虑到历史上序列
中含有大量随机成分,或者序列的基本发展趋势变化不大,贝川应取大一点。
对于具有趋
势性或阶跃性特点的数据,为提高预测值对数据变化的反应速度,减少预测误
差,"值取
较小一些,以使移动平均值更能反映目前的发展变化趋势。
一般"的取值为3〜15。
具体取值要看实际情况,可由均方差MSE来评价
(MSE的概念在第3节“预测方法的评估”中介绍)。
1.3.2指数平滑法
指数平滑法是对过去的观测值加权平均进行预测,使第/+1期的预测值等于f期的实际观测值与第「期指数平滑值的加权平均值,即
预测值二Q(上期值)+(1-a)(上次预测值)
一次指数平滑法预测模型为:
町广©1+(1-刃览
(1-1)
其中:
—一第/期预测值;
儿一一第f期的实际观测值;
a——平滑系数,且0vavl。
将—=©_2+(l-a)M,・2
Mz=叫+(1-讪_3代入(1-1)式中,可得:
陆=£a(l-G)b-f-0
(1-2)
公式(1-2)中各项系数和为:
a+a(\-a)+■■■+a(\-a)'~l+(l-6z/=a-~-—+(l_a)
1-(1-a)
当时,(1-q『tO,系数和Tl。
所以,可以说M是「期以及以前各期观察值的指数加权平均值,观察值的权数
按递推周期以儿何级数递减,各期的数据离第f期越远,它的系数愈小,因此它对
预测值的影响也越小。
公式(1T)稍作变换可得:
M+i=M+a(y-MJ
(1-3)
可见,是f期的预测值必加上用&调整的f期的预测误差(卩-必)。
因此,
简单指数平滑法用于预测实际上是根据本期预测误差对本期预测值作出一定的调整后得到的下一个预测值,即:
新的预测值二老的预测值x老预测值的误差
对老预测值所作的调整的幅度视&的大小而定。
说明:
平滑系数Q的选择:
&的取值对平滑效果影响很大,Q越小平滑效果越显着.&取值的大小决定了
在平滑值中起作用的的观察值的项数的多少,当。
取值较大时,各观察值权数的递减
速度快,因此在平滑值中起作用的观察值的项数就较少;而当&取值较小时,各观察值权数的递减速度很慢,因此在平滑值中起作用的观察值的项数就较多。
如果用移动平均数与指数平滑法相比,要使两者具有相同的灵敏程度,移动平均数〃的取值与指数平滑法中&的取值有如下关系:
/7-11一a
〒—a
当a取值〜之间时,如果要使移动平均具有相应的灵敏程度,则N的取值为:
a
n
39
19
9
~6
当a取值较小时,指数平滑法的平滑能力较强,而a取值较大时,模型对现象
变化的反应速度较快。
一般来说&取值的大小应当视所预测对象的特点及预测期的长短而定。
一般情况下,观测值呈较稳定的水平发展,&值取〜之间;观测值波动较大时a,值取〜之间;观测值呈波动很大时,a值取〜之间。
采用Excel进行指数平滑预测步骤如下:
1、选择在【数据分析】选项中选择【指数平滑】;
2、在【输入区域】中输入数据区域;
3、在【阻尼系数】输入l-a的值(注:
阻尼系数=1-6.);
4、在【输出区域】中选择预测结果输出位置;单击【确定】即可。
1.3.3趋势预测
(1)线性趋势预测模型:
y,=a+bt
用最小二乘法求待定参数“、方决定于标准方程组:
j工y=-2?
工刃/"W-(Z?
『]
[工0=+b》厂a=y-bt
趋势预测的误差可用线性回归中的估计标准误差来衡量。
公式为:
⑵二次曲线趋势预测模型:
yt=a^bt^ct2
根据最小二乘法推导待定参数d、/八C•的标准方程组:
+莎,宀迄尸,
(3)指数曲线趋势预测模型:
y,=abr,其中"、/?
为未知数。
在这里必须要把指数先通过变量代换转化为直线趋势才能用最小二乘法来求参数,即:
两边取对数lnX=ln"+“nb,再根据直线形式的常数确定方法,可求得ln“、lnb,最后取反对数得到"、"的值。
从总体上来说,确定性时序分析刻画了序列的主要趋势是直观简单、便于计算,但是比较粗略的,不能严格反映实际的变化规律,为了严格反映时序的变化必须结合随机时序分析法进一步完善对社会经济现象的分析以便进行决策。
随机性时间序列分析
1.4.1平稳随机时间序列分析
在随机性时间序列分析中,分为(宽)平稳时序分析和非平稳时序分析。
平稳随机过程其统计特性(均值、方差)不随时间的平移而变化,在实际中若前后的环境和主要条件都不随时间变化就可以认为是平稳过程(宽平稳过程),具有(宽)平稳特性的时序称平稳时序。
平稳时序分析主要通过建立白回归模型(AR,AutoregressiveModels)>滑动半均模型(MA,MovingAverageModels)和自回归滑动平均模型(ARMA,AutoregressiveMovingAverageModels)分析平稳的时间序列的规律,一般的分
析程序可用下面框图表示:
⑴自回归模型AR(p)
如果时间序列X左=1,2,…)是平稳的且数据之间前后有一定的依存关系,即乙与前面XzX”X“有关与其以前时刻进入系统的扰动(白噪声)无关,具有p阶的记忆,描述这种关系的数学模型就是p阶自回归模型可用来预测:
=(p\X+02乙_2+…++a{(1-
4)
0,®,…©是自回归系数或称为权系数;①为白噪声,它对/产生的响应,它本身就是前后不相关的序列,类似于相关回归分析中的随机误差干扰项,其均值为零,方差为的白噪声序列。
上面模型中若引入后移算子3,则可改为:
(1-殆-3込——20,比=q(1-
5)
记讽3)=(1-00-輕3200')
则(1-4)可写成
0⑻X—
(1-6)
称卩(8)=0为亦(p)模型的特征方程。
特征方程的?
个根2,0=1,2,-,P)被称为的
特征根。
如果卩个特征根全在单位圆外,即
|2y|>Ij=l,2,…丿
(1-7)
则称AR(”)模型为平稳模型,(1-7)被称为平稳条件。
由于是关于后移算子B的多项式,因此如?
@)模型是否平稳取决于参数…g
(2)滑动平均模型MA(g)
如果时间序列X「(f=l,2,…)是平稳的与前面Xi,X“,-*r无关与其以前时刻进入系统的扰动(白噪声)有关,具有q阶的记忆,描述这种关系的数学模型就是q阶滑动平均模型可用来预测:
Xt=a,-Oxa,_}+O2at_2+■■■+(1-
8)
上面模型中若引入后移算子B,则可改为:
&=(1-酬-空2-…-空%
⑶自回归滑动平均模型armaM
如果时间序列/(f=l,2,…)是平稳的与前面X“X一2,…X"有关且与其以前时刻进入系统的扰动(白噪声)也有关,则此系统为自回归移动平均系统,预测模型为:
x,-(Pxx.-x+02X*+…+伟*初=勺-也“+&厲_2+•••+%—(1-9)
即Q_b(P\_b沁叫)=(1-qb-qqbi>h
1.4.2非平稳时间序列分析
在实际的社会经济现象中我们收集到的时序大多数是呈现出明显的趋势性或周期性,这样我们就不能认为它是均值不变的平稳过程,要用模型来预测应是要把趋势和波动综合考虑进来,是它们的叠加。
用模型来描述:
10)
仏表示X,中随时间变化的均值(往往是趋势值),岭是X,中剔除丛后的剩余部分,表示零均值平稳过程,就可用自回归模型、滑动平均模型或自回归滑动平均模型来拟合。
要解模型乙=耳+匕,分以下两步:
(1)具体求出耳的拟合形式,可以用上面介绍的确定性时序分析方法建模,求出耳,得到拟合值,记为几。
(2)对残差序列进行分析处理,使之成为均值为零的随机平稳过程,再用平稳随机时序分析方法建模求出r;,通过反运算,最后可得X’=A+Y,o
22007年国内生产总值的预测
根据上面讨论的时字分析的方法,本文将之综合应用到对实际数据的分析预测中。
本文选取1978-2006历年国内生产总值作为时序数据,进行建模并预测。
我们从画出的走势图(如图知道这一时间序列是具有明显趋势且不含有周期性变化经济波动序列,即为非平稳的时间序列,对此序列进行建模预测需要用上面介绍的非平稳时间序列分析方法。
采用模型:
(2-1)
2XIOOOi
历年国内生产总值时间序列图
从图形(图)中我们可以判断出国内生产总值的确定趋势是按指数趋势发展
的,因此儿可以用趋势方程表示:
“=“/『,其中4"为待定参数。
利用1978〜2006年数据及利用对国内生产总值的趋势进行拟合,对指数曲线
线性化,即两边取对数lg丛=lga+rlgb,在Excel中进行对其进行回归分析,结果
见表。
于是,可得如下估计模型与拟合图,如图所示。
lg=3.4499+0.06561R2=0.9878
(2-2)
SUMMARYOUTPUT
回归统计
MultipleRRSquareAdjustedRSquare标准误差观测值
29
方差分析
df
SS
MS
F
Significance
F
回归分析残差总计
1
27
2S
Coefficients
标准误
差
tStat
P-value
Intercept
XVariable1
表
t
lg“
lg几
!
IgA
1
16
2
17
3
18
4
19
5
20
6
21
7
22
8
23
9
24
10
25
11
26
12
27
13
28
14
29
15
30
图指数曲线线性化拟合图
从统计量炉=0.9878来看,模型通过了检验,且拟合图中可以看出实际值与拟合值很接近,说明国内生产总值是符合指数长期趋势的。
再把模型(2-2)取反对数得:
fl,=2817.757036x1.16294(/,
(2-3)
根据拟合的“值,这里求出残差序列Yl={X,-pt}f数据见表,残差序列图如图所示。
表
年份
国内生产总值
预测A
值
年份
国内生产总值
预测几
值
197
8
199
3
197
9
199
4
198
0
199
5
198
199
1
6
198
2
199
7
198
3
199
8
198
4
199
9
198
5
200
0
198
6
200
1
198
7
200
2
198
8
200
3
198
9
200
4
199
0
200
5
199
1
200
6
199
2
200
7
3IJIJIJU
图残差序列散点图
观察残差序列的散点图可知,该序列有很大的波动性,可认为是非平稳的。
将残差序列1;(t-1,2,……,29)进行差分使其平稳化,观察其差分散点图如
图所示,可认为:
2次差分后序列是平稳的,即令
(2-
▽乙=乙一2乙“+乙.2(『=34…,29)
4)
得到序列他}。
从而我们可以认为{叱}是平稳的O
图差分后散点图
将序列{叱}零均值化:
由数据求得西二,令
u;=W,-W
(2-5)
得到序列{叫},从而算出序列{叫}的样本白相关函数以与样本偏相关函数玄一结果如表如图所示。
从自相关一偏自相关图可以看出,介随着比的增大而衰减,有拖尾现象,而偏相关函数九在k=2就落人随机区(在零附近波动),且如|v嘉=0.3714,则可认为叽在k>2是截尾的。
所以初步判断残差序列为AR
(2)模型。
k
A
Pk
k
A
A
1
16
2
17
3
18
4
19
5
20
6
21
7
22
8
23
9
24
10
25
11
26
12
27
13
28
14
29
15
30
U
25=
25;
K
22■
22
19
■
唾
16
•
■
B
C
16
13
c
13
=i
后
11
4
4=
1
11
图自相关函数图偏相关函数
注:
偏相关函数的计算是用SPSS软件来实现得到的。
因为Excel中计算很繁
琐,有一定的困难。
设模型为
(2-6)
需要估计002的值,得出解如下:
©+0.8502^2=0.8502=1.0715
0.8502^,+仇=0.6507=[仏=-0.2603
代入(2-6)式,乂⑵模型为
w(=1.0715比_]_0.2603+%
由特征方程卩(8)=0可得:
1-1.07153+0.2603矿=0
解此方程得特征根力=2.6863,/U=1.4300
由|人|>1,|刘>1,则可判断此模型为平稳的乂⑵模型。
由表得到/0=E(wt)~=.35
9pP
S=%-2>必=%1-工冏0
>=|)=•
二.35XX+X
三49
为了检验模型合理性,计算残差J=叱-陀的自相关函数(如表。
就=01叱7-02叱・2(=5,6,…,29
表
1
叫
A
/
A
3
17
4
18
5
19
6
20
7
21
8
22
9
23
10
24
11
25
12
26
13
27
14
28
15
29
16
30
根据残差分析检验方法,由八=25,取皿=6<殳,构造统计量:
4
Z26=^25-p2(k)计算°(灯,k=l,2,…,6
表
k
pg
心)
1
2
3
4
5
6
则可得工°2伙)=,/26=25x0.1045=2.6025
查才分布表,当加=6时,z2o.oi=44.314,才005=37.652
因为/6=2.6025<37.652,我们可认为仏}为白噪声序列,所以所建的模型是合适的。
由从⑵序列的预测公式:
两=1.0715-0.2603wt_2+a,
当/=30时,%)=1.0715x(-22968.6090)一0.2603x22558.0549=-30482.72
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 时间 序列 详细 说明