文献记录(part67)--基于决策树模型重用的分布变化流数据学习
學習筆記,僅供參考,有錯必糾
關鍵詞:機器學習 , 分布變化 , 流數據 , 模型重用 , 集成學習 , 動態環境
基于決策樹模型重用的分布變化流數據學習
摘要
在很多真實應用中 , 數據以流的形式不斷被收集得到 . 由于數據收集環境往往發生動態變化 ,流數據的分布也會隨時間不斷變化 . 傳統的機器學習技術依賴于數據獨立同分布假設 , 因而在這類分布變化的流數據學習問題上難以奏效 .
本文提出一種基于決策樹模型重用的算法進行分布變化的流數據學習 . 該算法是一種在線集成學習方法 : 算法將維護一個模型庫 , 并通過決策樹模型重用機制更新模型庫 . 其核心思想是希望從歷史數據中挖掘與當前學習相關的知識 , 從而抵御分布變化造成的影響 . 通過在合成數據集和真實數據集上進行實驗 , 我們驗證了本文提出方法的有效性.
引言
機器學習技術在諸多領域得到了廣泛應用 , 包括圖像、視頻、語音、文本處理等 [1~3] . 傳統的機器學習技術假定數據分布是恒定的 , 但數據收集的環境通常是開放動態的 , 因而數據分布恒定這一假設往往難以滿足 . 特別在諸如天氣預測、股票價格預測、語音識別等真實應用場景中 , 數據以流的形式不斷被在線得到 , 隨著時間不斷累積 , 數據分布往往會隨著收集環境的動態變化而不斷變化 . 傳統的機器學習算法及理論依賴于數據同分布假設 , 難以適用于這類分布不斷變化的流數據問題 . 因而 , 針對分布變化的流數據 , 如何設計性能良好且有理論保障的學習算法是非常重要的課題.
首先需要明確的是 ,
總結
以上是生活随笔為你收集整理的文献记录(part67)--基于决策树模型重用的分布变化流数据学习的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java中间件技术有哪些(Java技术栈
- 下一篇: 文献记录(part68)--K- 近邻分