原创R语言对EUR和USD外汇数据进行时间序列分析Word文档下载推荐.docx
- 文档编号:16240353
- 上传时间:2022-11-21
- 格式:DOCX
- 页数:16
- 大小:73.15KB
原创R语言对EUR和USD外汇数据进行时间序列分析Word文档下载推荐.docx
《原创R语言对EUR和USD外汇数据进行时间序列分析Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《原创R语言对EUR和USD外汇数据进行时间序列分析Word文档下载推荐.docx(16页珍藏版)》请在冰豆网上搜索。
建模思路
传统法建模的基本思想是:
认为事物的发展具有稳定性和类推性。
传统法建模模型包括趋势模型分析法和指数平滑法,根据时间序列的历史资料可以采用定性和定量相结合的方法描述出这种确定型的趋势,并预测将来的发展变化。
绘制时间序列图
收集历史资料,加以整理,编成时间序列,并根据时间序列绘成统计图。
时间序列分析通常是把各种可能发生作用的因素进行分类,传统的分类方法是按各种因素的特点或影响效果分为四大类:
(1)长期趋势;
(2)季节变动;
(3)循环变动;
(4)不规则变动。
从时间序列图形来看,序列有明显趋势,所以该序列一定不是平稳序列。
因为原序列为非平稳序列,所以选择一阶差分继续分析
2)Decomposethetimeseriesdataintotrend,seasonalityanderrorcomponents.(10points)
开始分解季节性时间序列。
一个季节性时间序列中会包含三部分,趋势部分、季节性部分和无规则部分。
分解时间序列就是要把时间序列分解成这三部分,然后进行估计。
对于可以使用相加模型进行描述的时间序列中的趋势部分和季节性部分,我们可以使用R中的“decompose()”函数来估计。
这个函数可以估计出时间序列中趋势的、季节性的和不规则的部分,而此时间序列须是可以用相加模型描述的。
“decompose()”这个函数返回的结果是一个列表对象,里面包含了估计出的季节性部分,趋势部分和不规则部分,他们分别对应的列表对象元素名为“seasonal”、“trend”、和“random”。
plot(birthcomponents)
要剔除某个趋势时(我们就去掉季节因素),我们可以运用减法去掉该因素,下图就是去掉季节性因素后的修正序列。
seasonal
看图中的横轴lag表示滞后阶数,纵轴表示对应各阶的相关系数,0阶滞后表示对自己的自相关系数,所以一般对应的相关系数值为1,再看图中上下的蓝色虚线内为95%置信区间,若lag>
0对应的相关系数均在该区间内则表示该变量自相性问题不严重
3)指数平滑法
指数平滑法(ExponentialSmoothing,ES)是布朗(RobertG..Brown)所提出,布朗认为时间序列的态势具有稳定性或规则性,所以时间序列可被合理地顺势推延;
他认为最近的过去态势,在某种程度上会持续到未来,所以将较大的权数放在最近的资料。
一次指数平滑法
平滑是用得最多的一种。
简单的全期平均法是对时间数列的过去数据一个不漏地全部加以同等利用;
移动平均法则不考虑较远期的数据,并在加权移动平均法中给予近期资料更大的权重;
而指数平滑法则兼容了全期平均和移动平均所长,不舍弃过去的数据,但是仅给予逐渐减弱的影响程度,即随着数据的远离,赋予逐渐收敛为零的权数。
也就是说指数平滑法是在移动平均法基础上发展起来的一种时间序列分析预测法,它是通过计算指数平滑值,配合一定的时间序列预测模型对现象的未来进行预测。
其原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均。
简单指数平滑法。
简单指数平滑适用于可用相加模型描述,并且处于恒定水平和没有季节变动的时间序列地短期预测。
简单指数平滑法提供了一种方法估计当前时间点上的水平。
为了更加准确的估计当前时间的水平,我们使用alpha参数来控制平滑,alpha的取值在0-1之间。
当alpha越接近0,临近预测的观测值在预测中的权重就越小。
从该图中可以看出整个曲线处于大致不变的水平,且随机变动在整个时间序列范围内也可以认为是大致不变的,所以该序列可以大致被描述为一个相加模型,因此我们可以使用简单指数平滑法进行预测。
我们采用R中的HoltWinters()函数,为了能够使用HoltWinters中的指数平滑,我们需要进行参数设置:
beta=FALSE和gamma=FALSE,预测结果如下图:
此外我们可以画出预测值和实际值,看看预测效果:
Holt-Wintersexponentialsmoothingwithouttrendandwithoutseasonalcomponent.
Call:
Smoothingparameters:
alpha:
0.02143061
beta:
FALSE
gamma:
Coefficients:
[,1]
a-0.000467163
HoltWinters()告诉我们alpha参数的估计值约为0.02143061,非常接近0,说明该序列比较平稳,默认情况下HoltWInters仅会给出原始时间序列所覆盖时期内的预测,预测值存在房子名为为fitted的变量中,我们可以通过rainseriesforecasts$fitted来获取这些值。
plot(hm)
从之前的alpha和上图,可见我们预测的过于平滑,R提供了样本预测误差平方和(SSE)来衡量预测效果。
可以通过rainseriesforecasts$SSE来获取该值。
hm$SSE
[1]0.02047227
4)ARIMA法
ARIMA法建模的基本思想是:
将预测对象随时间推移而形成的数据序列视为一个随机序列,即除去个别的因偶然原因引起的观测值外,时间序列是一组依赖于时间t的随机变量,构成该时序的单个序列值虽然具有不确定性,但整个序列的变化却又一定的规律性。
然后我们绘制自相关图和偏自相关图对序列进行进一步的检测
从上面的图中我们可以发现自相关系数在滞后一期之后,很快录入到置信区间之内,因此可以认为该序列平稳
从偏相关系数的置信区间来看,由于相关系数都在置信区间之内,因此可以认为该序列平稳
对平稳序列做自相关分析得到的自相关函数(ACF)和偏自相关函数(PACF),由图中可看出序列的自相关值和偏自相关值很快就落入置信区间,表明序列的趋势已经基本消除,而且自相关值在一阶截尾,偏自相关值也在二阶后接近截尾
Predictivemodel:
ARIMAmodelspredict
然后检测序列的平稳性和独立性,这里我们使用的是Box-Ljungtest
Box-Ljungtest
data:
z
X-squared=12.827,df=10,p-value=0.2335
由于p值大于0.05,因此我们接受原假设认为该数列独立,即原数列为白噪声序列
然后我们对序列进行单位根检测,如果序列不存在单位根,那么该数列是平稳序列
AugmentedDickey-FullerTest
Dickey-Fuller=-7.0775,Lagorder=8,p-value=0.01
alternativehypothesis:
stationary
由于p值大于0.05,因此我们接受原假设认为该数列平稳
从上面的自相关图和偏相关图,我们可以看到该模型为arima(1,0,0)
Thisisforecast7.3
因此建立模型之后对该序列进行预测
plot(forecast(x,h=12))
在预测之后,我们可以得到该序列的预测置信区间,深蓝色的区域是95%的置信区间,而且蓝色的区域代表90%的置信区间。
从置信区间的范围来看,该序列趋向于平稳
然后我们可以得到该模型的误差
MERMSEMAEMPEMAPE
Trainingset1.821957e-070.0057908090.003226522106.8062278.8997
MASEACF1
Trainingset0.6885243-0.001279645
从误差的表格来看,结果非常的理想.MAE是0.003226522,RMSE是0.005790809
然而预测时间序列没有一个准确的答案.即便误差越小模型越好,然而这也要看数据本身的特征
5)FitthedatawithappropriateARCHModels.
ARCH效应检验
滞后阶数的选折及均值方程的确定
lm(formula=Valuedata1~ones)
(Intercept)ones
0.0001039NA
residuals<
-ols$residuals
ARCHLM-test;
Nullhypothesis:
noARCHeffects
residuals
Chi-squared=19.265,df=1,p-value=1.138e-05
Chi-squared=55.919,df=5,p-value=8.447e-11
Chi-squared=81.331,df=12,p-value=2.299e-12
根据Chi-squared最小原则可以看出滞后1期为最优,故选择滞后阶数为1
残差序列自相关检验(日收益率的残差和残差平方自相关图)
从序列残差图中可以看出,相关系数基本落入蓝色虚线(95%置信区间)内,
即表明:
日收益率残差不存在显著的自相关。
而从残差平方图中可看出,相关系数都没落入蓝色虚线(95%置信区间)内,即表明:
日收益率的残差平方有显著的自相关,显示出ARCH效应
对残差平方做线性图
从残差平方线性图可以看出,回归方程的残差波动具有“成群”现象,
即:
波动在一些较长时间内非常小,在其他一些较长的时间内非常大,即具有明显的时间可变性和集簇性,这说明残差序列可能存在高阶
ARCH
效应,适合用
GARCH类模型来建模,而且可以观察到股指期货上市这一年的波动性明显减弱
对残差进行ARCH-LM检验(ARCH效应检验图)
图中可以看出,所有的圆圈都在线内,即在95%的置信区间内,说明残差具有ARCH效应,可以采用GARCH模型来拟合数据
GARCH(1,1)模型
设置garch模型参数
对模型进行拟合
从模型结果中可以看到系数为:
garch.fit11@fit$coef
omegaalpha1beta1
9.952008e-098.285543e-028.771638e-01
从模型结果中可以看到VAR为:
garch.fit11@fit$cvar
[,1][,2][,3]
[1,]2.529690e-13-1.960133e-10-5.372785e-10
[2,]-1.960133e-103.208472e-05-2.661675e-05
[3,]-5.372785e-10-2.661675e-055.221835e-05
时间序列图
条件标准偏差图
2个条件SD叠加的系列图
自相关函数观察图
自相关函数平方观察图
交叉相关图
残差图
条件标准偏差曲线
标准化残差图
ACF标准化残差图
ACF平方标准残差图
$r^2$和r之间的交叉相关图
标准化残差的分位数位数图
pleasewait...calculatingquantiles...
对此模型的残差进行检验,得到残差的自相关图和偏自相关图。
图形表明模型的残差都在置信区间范围内,已基本消除了自相关和偏自相关。
最终结论
综上分析可得出结论,利用该garch时间序列模型,garch模型既考虑了观测数据在时间序列上的依存性,又考虑了随机波动的干扰,从误差的角度来看,garch模型要优于指数平滑模型和arima模型,因此选用garch模型作为最优模型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 原创 语言 EUR USD 外汇 数据 进行 时间 序列 分析