机器学习之时间序列模型
一、時間序列概念
在生產和科學研究中,對某一個或一組變量x(t)進行觀察測量,將在一系列時刻t1, t2, …, tn (t為自變量)按照時間次序排列,并用于解釋變量和相互關系的數學表達式。在相等的時間間隔內收集到的不同時間點的數據集合我們稱之為時間序列,這種有時間意義的序列也稱為動態數據,被用來預測長期的發展趨勢。這樣的動態數據在自然、經濟及社會等領域都是很常見的。如在一定生態條件下,動植物種群數量逐月或逐年的消長過程、某證券交易所每天的收盤指數、每個月的gnp、失業人數或物價指數等等。
二、時間序列與回歸問題的區別
1.時間序列跟時間相關,而回歸模型的假設是:觀察結果之間相互獨立,不存在依賴關系。
2.時間序列,隨著時間的變化會出現上升或下降,也可能會出現季節性波動。
三、時間序列模型
(一)使用ARIMA模型,要求數據具有平穩性。
平穩性:要求經由時間序列所得到的你和缺陷在未來的一段時間內仍能順著現有的形態‘慣性’的延續下去,序列的均值和方差不發生明細的變化。
平穩性分為嚴平穩和弱平穩:
嚴平穩:分布不隨時間的改變而改變。如白噪聲(正太分布),無論如何取,期望都是0方差為1.
弱平穩:期望與相關系數(依賴性)不變。某時刻t的值Xt依賴于他過去的信息。
(二)差分法:時間序列在t與t-1時刻的插值(一階差分)
(三)常用的時間序列模型有
1.AR模型(Autoregressive model:自回歸模型)
2.MA模型(moving average model:滑動平均模型)
3.ARMA模型(Auto-Regressive and Moving Average Model:自回歸滑動平均模型)
4.ARIMA模型(Autoregressive Integrated Moving Average Model:自回歸積分滑動平均模型)
1.AR模型(Autoregressive model:自回歸模型)
描述當前值與歷史值之間的關系,用變量自身歷史數據對自身進行預測。
自回歸模型必須滿足平穩性要求。
限制:用自身數據進行預測,必須具有平穩性,必須具有自相關性,如果相關系數小于0.5,不宜采用,只適用于預測和自身前期相關的現象。
2.MA模型(moving average model:滑動平均模型)
關注自回歸模型中的誤差累加項,能有效消除預測中的隨機波動。
3.ARMA模型(Auto-Regressive and Moving Average Model:自回歸滑動平均模型)
前兩者的結合
4.ARIMA模型(Autoregressive Integrated Moving Average Model:自回歸積分滑動平均模型)
**原理:**將非平穩的時間序列轉化為平穩的時間序列后,將因變量僅對它的滯后值及隨機誤差項現值和滯后值進行回歸所建立的模型
ARIMA(p,d,q):p為自回歸項,MA為平均移動,q為平均移動項數,d為時間序列成為平穩時所做的差分次數。
四、模型參數選定
1.p、q值選定
自相關函數AFC:
有序的隨機變量序列與其自身相比較,自相關函數反映了同一序列在不同時序的取值之間的相關性
pk的取值范圍[-1,1]
偏自相關函數(PACF)
五、ARIMA建模流程:
1.將序列平穩(差分法確定d)
2.p和q階數確定:ACF與PACF
3.ARIMA(p,d,q)
六、模型評估標準:
可輸出最合適的p、q
模型殘差檢驗:
殘差是否平均值為0 且方差為正太分布
QQ圖:線性即正太分布
七、時間序列模型應用
LSTM模型分析及對時序數據預測的具體實現(python實現)
基于小波變換的時間序列預測,Python實現,來自雪球
總結
以上是生活随笔為你收集整理的机器学习之时间序列模型的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 接触昆仑通态,MCGSE初步使用
- 下一篇: vue-plugin-hiprint v