过拟合的原因以及解决办法
1、什么是過擬合?
欠擬合是指模型沒有能夠很好的表現(xiàn)數(shù)據(jù)的結(jié)構(gòu),而出現(xiàn)的擬合度不高的情況。?
過擬合是指模型過分的擬合訓(xùn)練樣本,但對(duì)測試樣本預(yù)測準(zhǔn)確率不高的情況,也就是說模型泛化能力很差。如下圖所示:?
?
左邊的結(jié)果過度擬合訓(xùn)練樣本,導(dǎo)致過擬合。
2、過擬合的原因?
(1)數(shù)據(jù)特征的角度?
數(shù)據(jù)噪聲導(dǎo)致的過擬合:噪聲具有一定的隨機(jī)性與欺騙性,如果把噪聲作為有效信息的話,將會(huì)導(dǎo)致過擬合。?
缺乏代表性樣本導(dǎo)致的過擬合:訓(xùn)練數(shù)據(jù)集不能很好的反應(yīng)整體分布可能會(huì)導(dǎo)致過擬合;訓(xùn)練數(shù)據(jù)集較小,但模型過度細(xì)化會(huì)導(dǎo)致過擬合。?
(2)模型的角度?
由于模型過度復(fù)雜,使得模型對(duì)訓(xùn)練數(shù)據(jù)擬合較好,但同時(shí)擬合了噪聲或者與目標(biāo)不相關(guān)的信息導(dǎo)致了過擬合。?
3、過擬合、欠擬合的解決方法?
過擬合的可能解決方法:?
a、減少特征:刪除與目標(biāo)不相關(guān)特征,如一些特征選擇方法?
b、正則化:正則化會(huì)保證每個(gè)特征有一定的效用,不會(huì)使某一特征特別重要。
?c、得到更多的訓(xùn)練樣本
?d、遷移學(xué)習(xí)-----可以解決由于訓(xùn)練數(shù)據(jù)較小引起的過擬合。
?
欠擬合可能的解決方法:?
a、選擇更復(fù)雜的模型?
b、增加新特征,如特征構(gòu)建
?
?
?
總結(jié)
以上是生活随笔為你收集整理的过拟合的原因以及解决办法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Recurrence along Dep
- 下一篇: CAD不支持实时调试