半监督训练-思想与代码实践
生活随笔
收集整理的這篇文章主要介紹了
半监督训练-思想与代码实践
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
以IEEE-CIS-Fraud-Detection比賽為例
半監督訓練思想:
test集沒有標簽,咋辦呢?
train集先建立一個model,Score要求在0.95以上;
把該model預測得到的test的標簽值isFraud賦值給test.
這樣,test集的isFraud就有了類別標簽,上述的這種打標簽的方式,稱為"偽標簽"。
?
然后,把train和打了"偽標簽的test集縱向拼接在一起,訓練一個新的model.
用這個新的model去預測test集,這樣預測的結果,會讓你在LB上的效果有一定的提升,
當然,別指望提升幾個百分點, 提升幾個千分點、萬分點還是有可能的。
?
代碼如下(可能會需要16G內存以上的電腦才能跑):
https://github.com/appleyuchi/TPU_GPU_Code/blob/master/偽標簽法.ipynb
?
?
總結
以上是生活随笔為你收集整理的半监督训练-思想与代码实践的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 处理 read_csv 报错 OSErr
- 下一篇: dataframe的drop無效