基于SPSS的时间序列分析(转载自某大神)
通过分析序列做出合理的预测,提前把握未来的发展趋势,为经营决策提供依据,也是科学决策的前提。
时间序列分析:
时间序列是一组按时间顺序排列的数据序列。
时间序列分析是发现这组数据的变化规律,并用于预测的一种统计技术。
分析工具:
附加电源装置(Supplementary Power Supply Set的缩写)
实际案例:通过历史数据预测未来数据涉及到最简单的实践,重点是方法,不管数据多复杂,方法都是一样的。
如果已知前几年的月销量,预测未来的销量。
一.时间序列分析简介
时间序列分析有三个基本特征:
假设事物的发展趋势会延伸到未来。
预测所依据的数据是不规则的。
不考虑事物发展的因果关系
并非所有的时间序列都必然包含四个因素。比如《岁月》中的一首诗,可能不包含季节因素。
四个因素通常以两种方式结合起来:
四个因素相互独立,即时间序列由四个因素直接叠加而成,可以用相加模型表示。Y=T+S+C+I
四个因素相互影响。也就是说,时间序列是四个因素相互综合的结果,可以用乘法模型来表示:y = t * s * c * i。
其中,原始时间序列值和长期趋势可以用绝对数表示;季节变化、周期变化和不规则变化可用相对数(百分比变化)表示。
二、季节分解法
当我们预测一个时间序列时,要考虑将上述四个因素从时间序列中分解出来。
为什么要分解这四个因素?
分解后可以克服其他因素的影响,只考虑一个因素对时间序列的影响。
分解后,我们还可以分析它们之间的相互作用,以及它们对时间序列的综合影响。
剔除这些因素,时间序列之间的对比才能更好,从而更客观地反映事物的变化发展规律。
分解后的序列可用于建立回归模型,从而提高预测精度。
所有的时间序列都应该分解这四个因素吗?
通常我们考虑对季节因素进行分解,即从原始时间序列中去掉季节变化因素,生成由剩余三个因素组成的序列,以满足后续分析的需要。
为什么只分解季节因素?
时间序列中的长期趋势反映事物的发展规律,是重点研究对象;
由于其周期长,周期性变化可视为长期趋势的反映;
不规则变化通常不单独分析,因为它们不容易测量。
季节性变化有时会使预测模型误判为不规则变化,从而降低模型的预测精度。
综上所述,当一个时间序列具有季节变化的特征时,季节因素在预测值时会首先被分解。
步骤:
定义日期标签变量:也就是说,在分析序列的时间特征之前定义序列的时间。
了解序列的发展趋势:序列图,确定乘法或加法。
进行季节性因素分解
制作模型
分析结果的解释
预测
1,定义日期标签变量
时间序列的特点是数据是按照时间点的顺序排列的,所以在分析之前,SPSS需要知道序列的时间定义,然后才能分析时间特征。
根据源数据的格式选择,输入第一种情况的具体值。
源文件中生成了三个新变量。
2、了解层序发展趋势
日期型变量定义完成后,首先要了解时间序列的变化趋势,以便选择合适的模型。即模型是乘性的还是加性的是由序列图决定的。
变量是“销售数据”,时间线标签是“日期-–”,这是我们的自定义时间。
数据销售序列图
如何根据时序图判断模型的乘法或加法?
如果数列的季节性波动随着时间的推移越来越大,建议使用乘法模型。
如果数列的季节波动能基本保持不变,建议使用加法模型。
这个例子很明显:随着时间的变化,销售数据的季节性波动越来越大,用乘法模型会更准确。
3.季节因素分解
变量是“销售数据”,根据序列图,我们知道时间序列模型是乘法的。
系统会提示您生成四个新变量。
ERR(误差序列):时间序列中剔除季节性因素、长期趋势和周期性变化后剩下的序列,即原序列中不规则变化组成的序列。
SAS(季节因素修正序列):是去除原序列中季节因素后的修正序列。
SAF(季节因素):是从序列中分离出来的季节因素。变量值根据季节周期重复。例如,在这种情况下,季节周期是12个月,因此这些季节因素不是每12个月重复一次。
STC(长期趋势和周期性趋势):这是在原有序列中,由长期趋势和周期性变化组成的序列。
如图,周期为12个月,季节因素为12个月。
季节因素分解后的序列与原序列有什么区别?
用接收序列图的方法将原始序列与除季节因素外的三个序列(误差序列、季节因素修正序列、长期忽略和周期变化序列)进行比较。
要制作四个序列图,将有四个变量:
原始系列:使用变量“销售数据”;
错误序列:使用变量“err”;
学校序列后的季节因素:使用变量“SAS”
长期趋势和周期性变化系列:使用变量“STC”
蓝线:原始序列
紫线:长期趋势和周期性变化序列
浅棕色:季节因素修正序列
绿线:错误序列(不规则变化)
由于误差序列的数值很小,所以长期趋势和周期性变化序列(长期趋势+周期性变化)基本可以与季节因素修正序列(长期趋势+周期性变化+不规则变化,即误差)重合。
分别制作“季节因素SAF”序列图:
因为是“季节因素”序列图,所以只有一个变量“季节因素SAF”
我们可以看到,季节因素的周期是12个月,先下降,然后上升到第一个峰值,再略有下降,然后呈现明显的上升趋势,在第七个月达到峰值,然后一路下降,直到最后一个月,然后进入第二个周期。
通过对原始序列的季节分解,我们更好地把握了原始序列所包含的时间特征,从而选择合适的模型进行预测。
第三,专家建模法
预测时间序列有四个步骤:
画一个时间序列图来观察趋势
分析序列平稳性并进行平稳性处理。
时间序列建模与分析
模型评估和预测
平稳性主要是指时间序列的所有统计性质不会随着时间的推移而改变。
对于平稳时间序列,它具有以下特征:
均值和方差不随时间变化。
自相关系数只与时间间隔有关,与时间无关。
自相关系数是研究序列中不同时期的相关系数,即对时间序列计算当前和不同滞后时期的一系列相关系数。
稳定-差分法。
差异是指一个序列中两个相邻周期的数据之间的差异。
主要差异=Yt-Yt-1
二次差=(yt-yt-1)-(yt-1-yt-2)
具体的稳定化操作过程会由专家建模自动处理,我们只需要根据模型结果哼哼几个数量级的差分即可。
时间序列分析操作:
要分析所有变量,请选择销售数据。
专家建模器–条件,检查“专家建模器考虑季节性模型”。
选中“预测值”以生成预测值并保存模型。
时间序列分析结果的解释
该表显示了通过分析获得的最佳时间序列模型及其参数。最佳时间U型狩猎性能是ARIMA (0,1,1) (0,1,1)。
和自回归移动平均模型ARIMA(p,D,Q)
p:季节变动后序列的滞后期通常为0或1,很少大于1;
d对季节变化后的序列进行:D阶差分,取值通常为0,1或2;
Q:数列季节变动后的移动平均是Q次,一般取0或1的值,很少超过2;
p、d和q分别代表包含季节变化的序列的作用。
所以这个例子可以解释为剔除季节变化的序列和包含季节变化的序列的一阶差分和一阶移动平均相结合建立的时间序列模型。
该表主要以R-square或平稳R-square评价模型拟合程度,在使用多个模型时,通过比较统计找到最优模型。
由于原始变量有季节变化因素,平稳R-square更有参考意义,等于32.1%,拟合效果一般。
该表提供了更多的统计数据,可用于评估时间序列模型的拟合效果。
虽然平稳R平方只有32.1%,但“杨-博克什Q(18)”的统计显著性为P=0.706,大于0.05(此处P & gt0.05是预期结果),所以我们接受原假设,这个数列的残差符合随机分布,没有异常值,这也反映了数据的拟合效果是可以接受的。
时间序列应用预测:
来年是2016到12,可以手动输入。
这是来年的销售趋势。
如果想从全局观察预测趋势,可以把今年的趋势和之前的数据联系起来。
此时的变量应该是“原销售数量”和“2016年预测销售数量”。
结果如下:
您还可以查看表中的具体值: