Titanic: Machine Learning from Disaster-kaggle入门赛-学习笔记
生活随笔
收集整理的這篇文章主要介紹了
Titanic: Machine Learning from Disaster-kaggle入门赛-学习笔记
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Titanic: Machine Learning from Disaster
機器學習系列(3)_邏輯回歸應用之Kaggle泰坦尼克之災
? ? ? ? 1.如果缺值的樣本占總數比例極高,可能就直接舍棄了,作為特征加入的話,可能反倒帶入noise,影響最后的結果了;
? ? ? ? 2.如果缺值的樣本適中,而該屬性非連續值特征屬性(比如說類目屬性),那就把NaN作為一個新類別,加到類別特征中;
? ? ? ? 3.如果缺值的樣本適中,而該屬性為連續值特征屬性,有時候會考慮給定一個step(比如這里的age,可以考慮每隔2/3歲為一個步長),然后把它離散化,之后把NaN作為一個type加到屬性類目中;
? ? ? ? 4.有些情況下,缺失的值個數并不是特別多,那也可以試著根據已有的值,擬合一下數據,補充上。
?
總結
以上是生活随笔為你收集整理的Titanic: Machine Learning from Disaster-kaggle入门赛-学习笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HHT变换基本理论-学习笔记
- 下一篇: 人工智能之知识图谱-学习笔记