时间序列分析方法及R语言实现-12(实际应用文本).doc

 2024-03-21 01:17:21  阅读 0

时间序列分析方法及R语言实现-12 文档信息属性:F-,doc格式,文本3605字。 品质优良,价格实惠,欢迎下载! 适用:作为内容写作的参考文案,可以解决如何写作、正确写作格式、内容提取等相关任务。 内容正文 时间序列分析方法和R语言实现 - 12 时间序列分析方法和R语言实现时间序列分析概述时间序列是将某个统计指标的值按时间顺序排列而成的序列。 时间序列分析是对时间序列进行编制和分析,根据时间序列所反映的发展过程、方向和趋势进行类比或延伸,从而预测未来一段时间或未来可能达到的水平。未来几年。 在食品安全领域,时间序列分析可用于预测食源性疾病的发病率,实现食源性疾病暴发的预警; 可用于预测食品抽检合格率,实现食品质量安全预警。 时间序列分析的前提是假设事物的过去持续到未来。 这个前提包含两层含义:一是不会出现突然的跳跃变化,并且会以比较小的速度前进;二是不会出现突变。 其次,过去和现在的现象可以预示当前和未来活动的发展和变化趋势。 这就决定了一般情况下,时间序列分析方法对于短期和近期的预测更为有效。 但如果延伸到更远的未来,就会出现很大的排尿限制,导致预测值与实际值偏差很大。 糟糕的决策。 时间序列数据的变化存在不规律性。 时间序列中每个观测值的大小是影响变化的各种因素同时作用的综合结果。

从这些影响因素的大小和方向变化的时间特征来看,这些因素引起的时间序列数据的变化分为四种类型。 趋势:某个变量随时间发展或自变量发生变化,表现出相对缓慢、长期的连续上升、下降,并保持同一性质,但变化的幅度可能不相等。 (3)随机性:个体的变化是随机的,但整体的变化在统计上是有规律的。 (4)综合性:实际的变化是几种变化的叠加或组合。 预测时,尽量过滤掉不规则变化,突出趋势性和周期性变化。 图5-1是2010-2015年某省伤寒时间序列分解图,从上到下展示了伤寒序列的全面性、周期性、趋势性和随机性。 从图中可以看出,时间序列并不存在上升趋势,而是具有一定的季节性,即夏季高,冬季低。 图5-1 某省伤寒病时间序列分解图 () p = (d) pt = ts (p, = 12, start = 2010) 平稳序列建模 平稳性是时间序列分析中一个非常重要的概念。 一般时间序列如果是平稳的,需要同时满足以下两个条件: 1)均值函数是常数函数。 2)自协方差函数只与时间滞后有关,与时间点无关。 有两种方法可以证明一个序列是否是平稳序列。 一是观察时间序列图。 平稳序列的时间序列图一般在某个常数值附近随机波动,且波动范围有边界。

,另一个是ADF单位根检验,其原假设是序列非平稳。 示例:图5-2的ADF检验结果中,p值小于 ,因此拒绝原假设,选择备择假设,即此时序列平稳。 图5-2 2010-2015年某省伤寒系列ADF单位根平稳性检验结果图。目前常用的平稳时间序列是自回归移动平均模型( ),简称ARMA),其中AR是自回归、p 回归项数; MA 是移动平均线,q 是移动平均线项数。 ARMA模型分为三类:AR模型(​​)、MA模型()和ARMA模型()。 AR模型AR是一种自回归模型,它使用自身作为回归器,即使用过去时期的观测值来预测当前时期的值。 方程可以写为: 其中,序列Yt-p是t时期的过去无法解释的序列。 每个时期的新信息独立于观察。 从方程可以看出,Yt的观测值是其自身阶次滞后项和新息项εt的线性组合。 MA模型 MA模型利用过去各个时期的随机干扰或预测误差的线性组合来表达当前的预测值。 方程表示为:Yt,εt-1,εt-2,...,得到εt-q的平均权重,权重移动到εt+1,εt,εt-1,...,εt- q+1得到Yt+1,并向前移动以获得预测值。

εt, εt-1, εt-2, εt-3,..., εt-q白噪声序列需要满足三个条件: (et)=0(et)=a^2(et,es)=0 (其中t表示序列的均值为0,方差为常数,协方差为0,是一个纯随机序列,如果一个序列是纯随机的,则意味着它的每一次新的变化都是无迹可循的,从中找不到任何线索,预测有用的信息,一旦发现某个序列是纯随机序列,就说明这个序列中没有可以挖掘的有用信息,就可以停止分析了。通常使用Ljung-Box检验,简称LB检验,LB检验的由来 假设被检验的序列是纯随机序列,例:图5-4对伤寒序列进行LB检验,发现p值小于0,说明该序列不是白噪声序列,可以进一步提取序列中的信息。 图5 -4 2010年某省伤寒序列LB检测结果to 2015 (log(NROW(train))), type"Ljung-Box")*train 是伤寒序列ARMA模型的训练集 ARMA模型是一个自回归移动平均混合模型,简单描述一下ARMA和之前的介绍,我们可以知道这个模型部分由AR组成,部分由MA组成,阶数不同。 该方程表示如下: 非平稳序列建模。 时间序列分析通常针对平稳序列。 非平稳时间序列模型往往是通过适当的变换(如差分和对数)将非平稳序列转换为平稳序列后建立的。 ARMA 模型。

如果通过差分使序列稳定,然后进行ARMA建模,这种模型称为微分自回归移动平均模型ARIMA(p,d,q),其中p是自回归项的数量; q 是移动平均项。 12月份某食源性疾病发病率时间序列图呈现出明显的趋势。 为了消除趋势,首先对数据进行一阶差分。 如一阶差分后的时间序列图第二张图所示,序列的趋势基本被消除了。 但季节性仍然存在,季节周期为12。因此,对一阶差分后的序列进行12步季节差分,得到序列的折线图,如第三张图所示。 此时可以发现序列的趋势性和周期性已经消除,基本处于稳定状态。 进一步,通过ADF单位根测试序列的平稳性。 p值小于 ,拒绝原假设,选择备择假设,即此时序列平稳。 图5-5 1962年至1975年某地区某种食源性疾病发病率的差异过程()(, alt="") #平稳性检验:平稳序列模式识别现已发展出ARIMA(p,d,q)该模型可以应用于平稳和非平稳时间序列。 一般建模过程如下:首先,必须判断序列的平稳性。 对于非平稳序列,可以进行差分,确定差分阶数d,变换为平稳序列(见)? 接下来,对平稳序列进行 ARMA 建模。 建模的第一步是查看自相关系数和偏相关系数的特征,确定模型的阶数,并确定p和q。

?估计模型中的未知参数φ、θ。 最后对模型的残差进行白噪声检验以确定模型。 如果多个模型通过测试,则选择均方根误差(RMSE)或AIC最小的模型。 以上就是接下来几节的主要内容。 本节主要介绍ARIMA模型p,通过自相关和偏自相关分析图可以确定q的准确阶数。 图5-6总结了ARMA模型ACF(自相关函数)和PACF(偏自相关函数)的一般特征。 图 5-6 ARMA 模型 ACF 和 PACF 的一般特征 AR (p) MA (q) ARMA (p, q) ACF 拖尾滞后 q 拖尾截断 拖尾 PACF 滞后 p 举例说明 ACF 和 PACF,图表 5-7显示了时间序列滞后 40 相关函数图 (ACF) 和偏自相关函数图 (PACF)。 首先考虑季节自相关特性,考察以周期长度为单位的12阶、24阶等的自相关系数和部分延迟。 自相关系数,自相关图显示延迟的 12 阶自相关系数明显非零,但延迟的 24 阶自相关系数落在 2 倍标准差的范围内。 偏自相关图显示,12 阶延迟和 24 阶延迟的偏自相关系数明显不为零。 因此,季节自相关特征可以认为是自相关系数的截断和部分自相关系数的拖尾。 此时,周期为12步的ARMA(0, 1)12模型提取了微分序列的季节自相关信息。

然后考虑序列12阶以内的自相关系数和偏自相关系数的特点,确定短期相关模型。 相关系数图和偏自相关系数图显示了12阶以内的自相关系数和偏自相关系数,没有表现出明显的趋势,因此无法判断ARMA模型中的p。 图5-7 序列的自相关函数图和偏自相关系数 相关函数图《时间序列分析方法及R语言实现-12》文档来源于网络,由本人编辑。 本着保护作者知识产权的原则,仅供学习交流,禁止商业用途。 如有侵犯作者权利,请在站内留言或给我留言联系我,我会尽快删除。 感谢您的阅读,无需下载!

标签: 序列 模型 平稳

如本站内容信息有侵犯到您的权益请联系我们删除,谢谢!!


Copyright © 2020 All Rights Reserved 京ICP5741267-1号 统计代码