【深度学习】深度学习之LSTM
LSTM是深度學習領域一個非常受歡迎的模型,它被用以解決各種各樣的問題。在交通領域,LSTM被廣泛應用于道路、航空、鐵路等各個方面的研究,例如基于LSTM建立車輛跟馳模型,利用LSTM進行短期交通流預測,公交車到站時間預測、共享單車需求預測、鐵路客運量預測以及航空延誤預測等等。本周,交通科研Lab將對LSTM的基礎理論進行介紹,并以航空延誤預測為例講解如何建立LSTM模型。
今天先為大家介紹一下LSTM模型的相關理論。
注:以下內容是對書籍、博客以及論文中的相關介紹的整理。
LSTM網絡的全稱是“Long Short Term Memory networks”,中文名叫“長短期記憶網絡”,是一種改進版的RNN。所以,在介紹LSTM之前,先來了解一下RNN。
RNN
在實際生活中,我們所面臨的很多問題都是具有順序性的。比如說,你在閱讀文章的時候,都是通過聯系上文來理解你當前看到的詞的真正含義。但是傳統的人工神經網絡并不會根據先前信息來對之后的信息進行推斷。RNN(Recurent Neural Networks,遞歸神經網絡)彌補了這一缺陷,它將神經元的輸出再接回神經元的輸入,使其具有“記憶力”,從而可以解決具有順序性的問題。如下圖所示,右圖是將左圖按照時間點展開得到的結果,圖中共有3個時間點,依次是“t-1”“t”“t+1”。
圖注
X是神經網絡的輸入,是t時間點神經網絡的輸入;
O是神經網絡的輸出,是t時間點神經網絡的輸出;
(U,V,W)是神經網絡的參數,在展開圖中W是t-1時間點的輸出,但是作為t時間點的輸入。
S是隱藏狀態,代表著神經網絡的“記憶”。在展開圖中是t時間點神經網絡的隱藏狀態,它是當前時間點的輸入、前一個時間點的隱藏狀態以及參數U和W共同評估的結果。
然而,世界上沒有十全十美的事物……RNN也不例外,雖然它有“記憶力”,但是,他的“記憶力”有點差。如果相關信息和當前預測的位置間隔很小,RNN可以學會使用先前信息,如果位置間隔很大,RNN就記不住了……為此深度學習專家Schmidhuber提出了LSTM模型。
LSTM
emmmm接下來有請哪吒給大家介紹一下LSTM模型!
感謝小爺~小爺講的正是我想說的~
以上就是本期LSTM相關理論講解的全部內容,下期將為大家介紹如何建立LSTM模型來預測航空延誤。
emmm你們還有什么要補充或者要糾正的嗎?歡迎大家來后臺留言~
注:以上所用圖片均來源于網絡。
編輯:莊楨
往期精彩回顧適合初學者入門人工智能的路線及資料下載(圖文+視頻)機器學習入門系列下載中國大學慕課《機器學習》(黃海廣主講)機器學習及深度學習筆記等資料打印《統計學習方法》的代碼復現專輯 AI基礎下載機器學習交流qq群955171419,加入微信群請掃碼:總結
以上是生活随笔為你收集整理的【深度学习】深度学习之LSTM的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Python】Pandas数据挖掘与分
- 下一篇: 梳理百年深度学习发展史-七月在线机器学习