时间序列的异常值处理
生活随笔
收集整理的這篇文章主要介紹了
时间序列的异常值处理
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
問題描述:開盤價的日收益率出現了異常值,9000多倍,什么原因導致?
答案:如圖所示:由于開盤價出現了異常,價格為0.01;導致以此價格為基礎計算的相關指標均異常;如果要還原真值,如果用均值與中位數均不合理,個人有兩個方案還原,方案一、前后的值取中間值,即前一個開盤價格與后一個開盤價格的均值;方案二、由于開盤價與收盤價相關性非常強,且正相關,補值的價格=當日收盤價格/昨日收盤價*昨日開盤價
?
?結論:替換異常值或缺失值在時間序列數據中,由于特征值取值具有連續性,所以用附近的數據計算補充有更好的效果,比均值和中位數效果要好;補值的根本是要盡可能接近真實值;
?
進一步分析發現:
?
?
查看類似開盤價格與收盤價格的異常,如圖用圖形顯示的話,直接畫出走勢圖,更直接了當,效果更好;
僅管該值是真實情況出現的,但由于樣例過少,本人仍然覺得替換掉效果較好,可使用前后值均值計算得出;
總結
以上是生活随笔為你收集整理的时间序列的异常值处理的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: kaggle竞赛--房价预测详细解读
- 下一篇: 梯度下降中的学习率的作用