实验spss中的时间序列分析

上传人:suij****uang 文档编号:181925449 上传时间:2023-01-18 格式:DOCX 页数:8 大小:241.80KB
收藏 版权申诉 举报 下载
实验spss中的时间序列分析_第1页
第1页 / 共8页
实验spss中的时间序列分析_第2页
第2页 / 共8页
实验spss中的时间序列分析_第3页
第3页 / 共8页
资源描述:

《实验spss中的时间序列分析》由会员分享,可在线阅读,更多相关《实验spss中的时间序列分析(8页珍藏版)》请在装配图网上搜索。

1、实验八spss11中的时间序列分析一、实验目的了解spss11中时间序列分析的简单方法二、实验原理介绍1.SPSS中时间序列分析简要介绍依时间顺序排列起来的一系列观测值称为时间序列,跟大部分的统计不同,这类资料的先后顺序是不能忽视的,更关键的是观测值之间不独立。因此,这类数据不能用普通的统计方法解决。时间序列分析(Timeseries)是专门用于分析这种时间序列资料的统计模型。它考虑的不是变量之间的因果关系,而是重点考察变量在时间方面的发展变化规律,并为之建立数学模型。时间序列分析的方法可以分为两大类:Timedomain和Frequencydomain。前者将时间序列看成是过去一些点的函数,

2、或者认为序列具有时间系统变化的趋势,它可以用不多的参数来加以描述,或者说可以通过差分、周期等还原成随机序列。后者则认为时间序列是由数个正弦波成分叠加而成,当序列的确来自一些周期函数集合时,该方法特别有用。不同的专业领域习惯用不同的方法:经济学习惯用Timedomain,而电力工程专家则对Frequencydomain更感兴趣。下面讲述的都是Timedomain由于时间序列模型的复杂性,它在spss中横跨了数据整理、统计分析和绘图三大部分,具体来说是: 预处理模块:包括用于填充序列缺失值的TransformIreplaceMissingValues过程,建立时间变量的Data|Definedat

3、es过程和将序列平稳化的Transform|CreateTimeSeries过程。 图形化观察/分析:时间序列在分析中高度依赖图形。Spss为其提供了特有的观察工具:序列图(SequenceChart)、自相关/偏自相关图(AutocorrelationFunction,ACF&AutocorrelationFunction,PACF)、交叉相关图(CrosscorrelationFunction,CCF)、周期图(Periodogram)和谱密度图(SpectralChart)。后三者被统一放置在Graphs|TimeSeries菜单中。分析模块:它们被统一放置在Analysis|TimeS

4、eries菜单中,共包括指数平滑法(ExponentialSmoothing过程)、自回归线性模型(Autoregressivemodel)、ARIMA模型和季节解构(SeasonalDecomposition)四种方法。2. 时间序列的建立和平稳化在对数据拟合时间序列模型前需要进行一系列的准备工作,首先,如果数据存在缺失值的话就要进行填补;第二,SPSS是不会自动将数据文件识别为时间序列的,必须要加以定义;第三,原始的时间序列往往要经过初步的计算(平稳化)才能更好的用于进一步分析。2.1缺失值的填补ReplaceMissingValues过程大多数时间序列模型都要求数据序列完整无缺,但这实际

5、上非常难以做到。当序列中存在缺失值时,显然不可能采用剔除的方法,因为这样会使得缺失值之后数据的周期发生错位在这种情况下就应当使用ReplayMissingValues过程对缺失值采用适当的方法进行填充,并将结果存入一个新变量。例子:打开数据文件gnp.sav,删除变量gnp在第8、14条记录中的数值,然后选择适当的缺失值填充方法对其进行填充。缺失值填充方法有好几种,但各有使用范围,现在gnp序列的规律并不清楚,为保险起见,我们只利用缺失值附近的数据进行填充。方法:Transform|ReplaceMissingValues图1图1中解释如下:NewVariable框:缺失值填充前后的变量对应列

6、表 Name框:存储填补序列的新变量名称Method下拉列表:可供选择的序列填充方法Seriesmean:全体序列的均数,默认值Meanofnearbypoints:相邻若干点的均数,在下方的Spanofnearbypoints单选框组中设置使用的相邻点数。 Medianofnearbypoints:相邻若干点的中位数,在下方的Spanofnearbypoints单选框中设置使用的相邻点数Linearinterpolation:线性内插,即缺失值相邻两点的均数,但如果缺失值是在序列的最前/最后,则无法被填充。 Lineartrendatpoint:该点的线性趋势,将记录号作为自变量,序列值作为

7、因变量进行回归,求得该点的估计值。Spanofnearbypoints单选框组:设置相应填充方法中需要使用的相邻记录数。Change:将所做得设定应用于相应变量2.2时间变量的定义一Definedates过程时间序列数据的一个明显的特点就是记录依时间排列。在SPSS中需要定义时间变量。只有在定义后,SPSS才承认该序列的诸如周期等时间特征。例:美国1947年第一季度到1970年第四季度的GNP在gnp.sav文件中,其中只有一个变量gnp记录着各季度的GNP值,请根据提供的时间范围为其定义时间变量。方法:对于这种时间序列数据,在数据输入时仅仅需要输入每个时间点上的具体数值而时间变量应当用专门的

8、过程来定义。在数据输入时即使直接输入时间变量,包括Season、Year,SPSS也不会自动认为它们是时间变量,从而无法进行时间序列分析。采用Data|Definedates过程来完成。图2下面对图2简单讲解如下:CasesAre框:提供了各种时间的组合供用户选择。序列的周期由时间组合的最小时间单位决定,如Years,quarters的周期是4FirstCaseIs框组:要求输入第一个数据(该数据可以是缺失值)的时间,根据CasesAre框中的选择不同,相应的内容也会有所变动。右侧会显示相应等级的周期数CurrentDates栏:在界面左下角,定义好周期后,如果再次进入该对话框,则会显示当前数

9、据的时间信息。上述操作后,数据文件中将加入两个新产生的时间变量year_、quarter.,分别代表年、季度,另有一个变量date_,表示大致的日期(由于信息不全,只能是大致的日期,并且是字符串变量)2.3时间序列的平稳化一CreateTimeSeries过程在时间变量定义完成后,时间序列就基本建成了。但是,并非随便建立一个序列就算万事大吉,时间序列分析都是建立在序列平稳的条件上的。一个平稳的随机序列过程有以下要求:均数不随时间变化;方差不随时间变化;自相关系数只与时间间隔有关,而与所处的时间无关。实际上大多数的时间序列都是不平稳的。在做时间序列分析时,首先就是识别序列的平稳性,并且把不平稳的

10、序列转化为平稳序列。CreateTimeSeries过程是SPSS用来对原始序列进行初步处理,以使序列达到平稳化的模块。它可以从原序列变量中通过差分、移动平均等变换同时计算一个或多个新序列,以帮助用户识别原序列的波动规律。若时间序列的正态性或平稳性不够好,在需要进行数据变换。常用有差分变换(利用transformICreateTimeSeries)和对数变换(利用TransformICompute)进行。对时间序列进行平稳性检验的图检验方法有时序图检验和自相关图检验。 时序图检验:根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范

11、围有界,无明显趋势及周期特征。 自相关图检验:平稳序列通常具有短期相关性。该性质用自相关系数来描述,就是随着延迟期数的增加,平稳序列的自相关系数会很快的衰减向零。(注:时间序列的自相关是指序列前后期数值之间的相关关系,对这种相关系数程度的测定是自相关系数)。如果在ACF图中,随着lag的增大,自相关系数不是迅速减少,则要考虑时间序列是否不平稳,是否有继续差分的必要。例:前面已经为数据gnp.sav建立了时间变量,现在对该序列进行平稳化。方法:时间序列分析的第一步一般先做一个观测值和时间的时序图。这对序列的整体印象和后面的分析都非常有帮助。点击菜单Graph|Sequence,仅仅把gnp变量选

12、择进入variable框中,把Year变量选择从此时序图中可以看到很明显的线性趋势(序列图是稳步上升的)和周期性(每年的图形有相似性,每年的第四季度总是最高)。这是跟序列平稳的要求相悖的。所以,首先要把不平稳的序列转变为平稳的序列。1方差平稳化:当序列的方差随着时间变化时,模型参数的点估计估计和预测也许不会出错,但是统计推断会有较大的影响。对数转换和平方根转换是使方差稳定的两种常用的方法,可以通过菜单项Transform丨Compute进行。2去除趋势:差分是去除趋势的有效办法,可以通过菜单项Transform丨CreateTimeSeries进行。对序列进行上述处理后,再对新生成的变量做时序

13、图,可以发现虽然序列还存在周期性(季节波动),但是趋势问题和方差不齐已经得到较好的解决。如果还希望去除季节波动,则可以对新生成的序列用季节差分TransformICreateTimeSeries的方法去除。差分会带来一个问题,就是序列开始的数据减少。差分次数越多,减少的数据越多。如果过度差分会使还原到原始序列的难度加大,这是需要尽量避免的。让上述时间序列平稳化的方法如下:首先,TransformICompute,对原始数据进行平方根转换。转换结束后在数据文件中新生成一列数据。然后对这新生成的一列数据,用TransformICreateTimeSeries进行差分。图3主要对图3中的functi

14、on下拉列表进行讲解,这是CreateTimeSeries过程的核心。通过不同的计算方法可以得到相应的新序列。 Difference:计算变量的一般差分(非季节性)。差分是序列平稳化时的常用手段,其作用是消除前后数据的依赖性。差分的次数可以在下方Order的框中指定。差分会损失数据,差分n次,则数据损失n个。 SeasonalDifference:季节性差分。差分的间距由数据的周期决定。没有定义周期的数据不能做季节性差分。差分n次,数据损失季节的n倍。 Centeredmovingaverage:中心移动平均,以当前值为中心,计算指定范围的均值。取移动平均的效果是把序列的噪声部分抵消,而把平滑

15、部分保留。 Priormovingaverage:前移动平均,计算当前值以前指定范围的数的均值。 Runningmedians:移动中位数,计算当前值为中心,一定范围的中位数。 Cumulativesum:累计和,以原序列的累积和为新序列 Lag:滞后值,所谓滞后就是让原序列往后滞留指定的Order Lead:提前值,和滞后相反,让原序列提前指定的Order。 Smoothing:计算原序列的T4253H平滑序列。3. 时间序列的图形化观察时间序列有特有的图形观察工具,分别是: SequenceChart:序列图,实际上是一种特殊的线图,但比一般的线图有更多适合时间序列特点的功能Autocor

16、relationChart:做单个序列,任意滞后(包括负的滞后,也就是超前)的自相关和偏自相关图。ACF和PACF是描述单个时间序列的重要工具。 Cross-CorrelationsChart:交叉相关图,做两个或两个以上的时间序列,任意滞后的交叉相关图。互相关函数(Cross-correlationFunction,CCF)是分析两个序列关系的有力工具。无论何时使用互相关函数来了解两个序列之关系时,必须确信两个序列是平稳的(即,每个序列的均值和方差在整个序列中大概一样)。原因是如果序列值随时间上升或下降,总可以把二者串起来,以至于即使两个序列毫不相关,但也显得高度相关。 SpectralCh

17、art:周期图和谱密度图,在谱分析时给出一个或多个序列的周期图和谱密度图。谱图和自相关图实质上是相同的,包含的是相同的信息,只不过表现形式不同。后面的三种是专用的时间序列图,被统一放在了GraphITimeSeries菜单中,它们对选择某些时间序列分析的统计模型的参数,以及对模型的残差评估尤其重要。序列图在Graph|Sequence菜单项。这些图形的一般界面中,有Variables框,用于选入要作图的序列变量,可以是多个序列。TimeAxisLabels框:选入作为横轴标签的时间变量,如果缺失则用序号作为横轴单位。Transform框组:提供了一些时间序列分析中常用的变量变换方法,有自然对数

18、变换、差分、季节差分三种,如果效果不好则需要用CreateTimeSeries模块中的内容。下方的Currentperiodicity栏会显示当前序列的周期数。自相关系数是序列和自身的提前或滞后序列间的相关系数。如果滞后为1,则是1阶自相关系数,滞后为2则为2阶自相关系数。自相关系数回答几个相邻数据的相关性。如果一阶自相关系数大,可以知道相邻时垫支存在较强相关性。二阶自相关系数大则说明相隔两个时点的值也密切相关。但是高阶的自相关是否真的非常重要呢?是它的确有意义,还是因为低阶自相关系数较大才引起高阶自相关系数也大呢?如果建立一个由以前值预测现在值的回归模型,需要包括多少个以前值?偏自相关函数(

19、PACF)就是用于回答这个问题的oPACF是从高阶开始,逐个检验每阶的偏相关系数是否有意义,直到第一个有意义的为止。这时的阶数就是模型中应该包含的最大阶数。MaximumNumberoflags:指定需要计算自相关和偏相关的最大的滞后数lag。根据经验lag=20就够了,或者比该序列的最大周期大一些。时间序列分析4.1季节解构一SeasonalDecomposition过程季节解构模块是用于分析有季节变化的时间序列的工具。它的基本思想是一个时间序列的信息可以来自四个方面:线性趋势、季节变化、循环变化和误差。而这四种信息可以通过乘法模型组合,也可以通过加法模型组合。根据模型结构的不同,季节解构分

20、解信息的方法也不同。季节解构模块要求序列无缺失值,或者已经用适当的方法弥补。例:用美国1947年1月到1969年12月住宅建筑的数据nrc.sav为例,对序列nrc2进行季节解构分析方法:选择菜单Analyze|TimeSeries|SeasonalDecomposition,如下图进行设置图4下面对图4中的设置做简单的介绍。Variable框:选入需要分析的变量Model单选框组:用于选择模型的种类,有两个选择:相乘模型(Multiplicative)和相加模型(Additive)。 MovingAverageWeight单选框组:决定计算移动平均数的方法Allpointequal:以季节因

21、素的长度为长度计算均数,所有的记录权重一样。当周期长度为奇数时多选。 Endpointweightedby0.5:以周期长度1作为长度计算移动均数。两端的数的权重取0.5,中间的权重都是1。当周期长度为偶数时多选。Displaycasewiselisting:要求输出计算的完整结果,包括计算的全部过程。Output窗口中的部分输出结果如下:ResultsofSEASONprocedureforvariableNRC2.Multip1icativeModel.CenteredMAmethod.Period=12.DATE_MovingNEC2averagesRatios(*100)Seasona

22、lfactors(*100)SeasonallyadjustedseriesSmoothedtrendcycleIrregularcomponentJAN1947556.00082.454674.319696.777.968FEB1947528.00074.369709.970680.1711.044MAR1947545.00083.051656.225670.907.978APR1947607.00093.947646.109670.412.964MAY1947701.000102.634683.011686.318.995JUN1947785.000111.043706.936721.34

23、9.980JUL1947874.000834.792104.697114.171765.517771.256.993AUG1947950.000858.292110.685114.710828.172833.449.994SEP19471006.000881.542114.118112.841891.524907.646.982原序列经过以周期为长度的移动平均后得到的值已经去除了季节因素和误差,仅仅包含线性趋势、循环变化。所以上图的Ratios就是包含季节和误差的。(注意此模型为乘法模型)。求整个序列相同月份的Ratios的平均数并扣除误差成分就得到相应月份的季节因子(Seasonalfact

24、ors)o其中误差是通过求各个月份Ratios的均数的均数得到的。然后原序列扣除季节因子就得到季节调整后的序列(Seasonaladjustedseries)。最后还给出了平滑了循环因素的序列和不规则成分的大小。分析结果以新变量的形式加在数据文件后面,可以用于进一步的分析,比如做时序图。4.2ExponentialSmoothing过程指数平滑法用序列过去值的加权均数来预测将来的值,并且给序列中近期的数据以较大的权重,远期的数据给以较小的权重。理由是随着时间的流逝,过去值的影响逐渐减小。指数平滑发只适合于影响随时间的消逝呈指数下降的数据。指数平滑法适用于呈水平发展的序列。对于上升的数据,预测总

25、是偏低;下降的数据,预测总偏高。对于有上升或下降趋势的序列可以通过差分使序列平稳化,对于有季节变化的数据可以用季节差分处理。使用菜单AnalyzeITimeSeriesIExponentialSmoothing。最后SPSS会根据我们的操作,按照最优的原则将预测值和预测误差值存为新变量。据此就可以做出原始值和预测值的线图,进行比较。例:数据文件sales.sav中存储的是某公司1992年1季度到2000年4季度的销售资料,请用指数平滑法分析预测将来4个季度,即2001年4个季度的销售额。4.3ARIMA过程ARMA模型一自回归滑动平均模型一是一族时间序列模型。是二十世纪70年代后应用最广泛的时

26、间序列模型。两个特殊情况是自回归模型和滑动平均模型。ARIMA模型建模的基本步骤可以分为4步:序列的平稳性:使原序列满足ARMA模型平稳可逆的要求模型识别:主要是通过读ACF、PACF和CCF把握模型的大致方向,为目标序列定阶,提供几个粗模型以便进一步分析完善参数估计和模型诊断:参数估计是对识别阶段提供的粗模型参数估计并假设检验,做模型的诊断。预测:这是模型实际应用价值的体现模型识别和参数估计及模型诊断的过程往往是一个模型逐渐完善的过程,需要不断修正最初的选择。ACF、PACF和CCF是描述序列特征的必备工具。仔细研究时间序列的相关情况是ARMA模型必经之路。在选择模型时根据就是ACF、PACF和CCF三、实验任务1通读教案,大致了解SPSS11中时间序列分析的基本步骤和其中所能进行的时间序列分析。2.使用gnp.sav做时间序列分析的前期准备工作。(1) 缺失值的填补:自己去掉几个值,然后使用缺失值填补过程,去掉缺失值(2) 定义时间变量:年、季度(3) 时间序列的平稳化:使用transformICreateTimeSeries和TransformICompute(4) 时间序列的图形化观察。为gnp.sav中的数据做统计图,观察序列的趋势

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!