端到端的含义,统计学习、机器学习和深度学习的区别与联系
什么是端到端(end-to-end)
端到端通俗來說就是不需要進行特征提取,輸入的是原始的數據,輸出的就是最后的結果。
經典機器學習方式是以人類的先驗知識將raw數據預處理成feature,然后對feature進行分類。分類結果十分取決于feature的好壞。所以過去的機器學習專家將大部分時間花費在設計feature上。那時的機器學習有個更合適的名字叫特征工程(feature engineering)
隨著深度學習神經網絡的發展,讓網絡自己學習如何抓取feature效果更佳。由于多層神經網絡被證明能夠耦合任意非線性函數,通過一些配置能讓網絡去做以前需要人工參與的特征設計這些工作,然后配置合適的功能如分類、回歸。而現在神經網絡可以通過配置layers的參數達到這些功能,整個輸入到最終輸出無需太多人工設置,從raw data 到最終輸出指標。于是興起了表征學習(representation learning),自編碼器就是表征學習的一個例子。這種方式對數據的擬合更加靈活。
端到端(end to end)的優缺點
通過縮減人工預處理和后續處理,盡可能使模型從原始輸入到最終輸出,給模型更多可以根據數據自動調節的空間,增加模型的整體契合度。
但是,由于端到端的特征提取依賴于隱層模型,其相比較傳統機器學習方法來說解釋性弱,趨于黑盒子過程。
這里就引出了基于端到端的深度學習、機器學習和統計學習的關聯和區別。
統計學習,機器學習與深度學習概念的關聯與區別
簡單總結來說:
1、機器學習與統計學習有較大的重疊,或者說機器學習是建立在統計學習的基礎之上;
2、統計學習是theory-driven,對數據分布進行假設,以強大的數學理論支撐解釋因果,注重參數推斷(Inference);
3、機器學習是data-driven,依賴于大數據規模預測未來,弱化了收斂性問題,注重模型預測(Prediction);
4、深度學習是機器學習的一個子領域,特征提取更依賴于隱層模型,解釋性弱,趨于黑盒子。
如下圖所示,統計學習、機器學習、深度學習是一個包含又交叉的關系:
(圖片轉自網絡)
對于人工智能領域來說,所謂人工智能可以理解為能夠感知、推理、行動和適應的程序。而機器學習屬于人工智能的子領域,指能夠隨著數據量的增加不斷改進性能的算法。深度學習又是機器學習的一個子領域,指利用多層神經網絡從大量數據集中進行學習的技術。
References
http://jacoxu.com/statisticandmachinelearning
https://blog.csdn.net/happyhorizion/article/details/100607429
總結
以上是生活随笔為你收集整理的端到端的含义,统计学习、机器学习和深度学习的区别与联系的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用数据增强技术提升模型泛化能力
- 下一篇: 人脸识别及对比_没有“色彩对比可及性的神