机器学习套路三步走
機(jī)器學(xué)習(xí)的套路
- 1.model如何對(duì)現(xiàn)實(shí)的場(chǎng)景進(jìn)行抽象
- 2.model如何對(duì)參數(shù)進(jìn)行求解
- 3.model的效果如何評(píng)價(jià)
1.抽象
例如線性回歸,就是認(rèn)為預(yù)測(cè)變量y和特征X之間存在線性關(guān)心,老掉牙的例子就是房?jī)r(jià)和地區(qū)收入,人口密度等等的線性關(guān)系
線性回歸的數(shù)學(xué)假設(shè)有兩個(gè)部分:
1. y的預(yù)測(cè)值是數(shù)據(jù)特征的線性變換。這里的參數(shù)是一組系數(shù)。而y的系數(shù)和數(shù)據(jù)特征的線性組合。
2.y的預(yù)測(cè)值和實(shí)際值之間存在一個(gè)誤差,這個(gè)誤差是符合正太分布的
2.參數(shù)求解
參數(shù)求解每個(gè)模型都不一樣,一般通用的就是SGD和各種變種
還以上面的線性回歸為例,求解的參數(shù)就是y=Wx中的W
3.評(píng)價(jià)
評(píng)價(jià)模型的效果好不好,均方誤差,logloss等等
上面的線型模型因?yàn)榧僭O(shè)預(yù)測(cè)值和實(shí)際值的誤差是符合正太分布,所以一般用均方誤差
總結(jié)
第一步抽象很重要,第二步作為普通人主要是使用現(xiàn)成的算法進(jìn)行參數(shù)求解,第三步往往已經(jīng)在實(shí)際的生產(chǎn)環(huán)境中確定了模型的評(píng)價(jià)標(biāo)準(zhǔn)
一般的經(jīng)驗(yàn)是在用一個(gè)模型對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練的時(shí)候,如果訓(xùn)練集上欠擬合,可能是模型的表征能力不行對(duì)應(yīng);如果在測(cè)試集上過(guò)擬合,那可能就是模型的表征能力太強(qiáng),噪聲都被學(xué)習(xí)了。至于模型的迭代和改進(jìn)這又是另一個(gè)問(wèn)題了。
轉(zhuǎn)載于:https://www.cnblogs.com/peinwu/p/10070191.html
總結(jié)
- 上一篇: django HttpResponse的
- 下一篇: switch使用中遇到的问题