[Day4] 时间序列预测界的 OG:白话解释 ARIMA 组成模型及步骤

(努力更新、连载中)

前一篇我们盘点、简述了所要介绍的时间序列预测统计模型,
第四篇我们要重点认识统计模型的经典、时间序列预测界的 OG(元老)—— ARIMA (AutoRegressive Integrated Moving Average)

有鉴於网路也有很多教学,不论是理论、公式、使用套件等等,不过他们都分散在各处,可能看了一篇,还是不太知道全局;所以我的这篇的目的是用白话解释 ARIMA 里面用到的模型、以及它怎麽进行预测的,要怎麽做参数最佳化。

ARIMA 模型组成

ARIMA (Autoregressive integrated moving average)

  • ARMA(p, q) = AR(p) + MA(q)
  • I(d):先计算 differencing,d = 计算 d 次 differencing
    • 目的:从原始时序资料中产生稳定性高 (stationary) 的序列,平均、变异数、自相关系数随时间仍一致

何谓确认时序的 stationarity?

  • 时序的分布不会随着时间变化变动,例如:平均、变异数不会随时间变动;如果时序分布会一直变动,就很难使用 ARIMA 这样的统计方法做预测
  • Stationary 的种类
    • SSS (Strong-sense stationary):较少用
    • WSS (Weak-sense stationary):较常用

第一顺位统计量 (mean)
第二顺位统计量 (autocovariance):covariance of 2 RVs from the same time series
Covariance: unscaled correlation

  • 0:两 RV 完全独立、不相关
  • 0 :两 RV 正相关

  • <0:两 RV 负相关

当 p, q = 0; d = 1 => l(1) 则称为 random walk,代表无法透过过去时序预测未来
实例:Log return, Holt's Winter
从原始时序资料产生训练集: rolling window

参数选择 p, d, q

选择顺序 d -> q -> p

  • ACF
  • PACF
    Auto ARIMA(更现代的方法自动参数选择)

ARIMA 变形

  • SARIMA
  • SARIMAX

ARIMA 成效指标

  • AIC
  • BIC

? volidity clustering
使用 ADF Test (Augmented Dickey-Fuller Test)
给定:虚无假说 the TS is non-stationary、替代假说 the TS is stationary
Input:time series
Output: p-value
Action: 是否推翻虚无假说
如何用 ADF Test 最佳化参数 d?
概念:不断做 differencing 直到该时序(TS) stationary (ex: p-value < 0.05)


<<:  内部稽核与外部稽核功能面分析

>>:  webkit的inline play设定

【day15】DashboardFragment X Firestore搜寻

今天要来带大家看一下搜寻资料,Firestore最简单的方式就是直接透过get()来拿到资料,但是...

[Day15] 策略最佳化模组改造(4)

既然期货那边在找到历史资料的资讯源之前还没办法动作,就先回来把最佳化的部分做收尾。 Day14制作的...

沟通这回事:工具软件篇

前言 前几天介绍了在沟通当中相当於是「心法」的部分,今天来谈点具体看得到的东西,也作为沟通系列的结尾...

3. STM32-GPIO初探

Open Drain (漏极开路)与 push-pull(推挽) 介绍 Open Drain 输出为...

[Day11] TS:什麽!型别也有样板字串(Template Literal Types)?

这是我们今天要聊的内容,老样的,如果你已经可以轻松看懂,欢迎直接左转去看我同事 Kyle 精彩的文...