日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

GBDT+LR

發(fā)布時(shí)間:2025/4/5 编程问答 22 豆豆
生活随笔 收集整理的這篇文章主要介紹了 GBDT+LR 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

GBDT + LR 模型融合在之前的推薦系統(tǒng)中很常見,甚至現(xiàn)在有的廠子也在用這一套東西,畢竟每個(gè)廠子的業(yè)務(wù)不同數(shù)據(jù)不同,所以不同的算法模型效果也會(huì)參差不齊

13年左右的時(shí)候,業(yè)界訓(xùn)練模型主要有兩條路:

? ? 大規(guī)模特征 + 線性模型(Goole,Baidu)

? ? 中小規(guī)模特征 + 非線性模型(Yahoo,Bing,Taobao)

之前很多人都會(huì)用到LR,是因?yàn)長R是線性模型,可以并行處理大量數(shù)據(jù),但是缺點(diǎn)也是同樣顯著,就是需要大規(guī)模的特征;人工處理大量的特征并不能保證會(huì)帶來效果上的提升,因此如何自動(dòng)組合、挖掘特征是一個(gè)重要的問題。

挖掘特征目前主要有兩條路:

?1、FM系列->通過隱變量的形式,挖掘特征之間的組合關(guān)系

?2、樹系列-> GBDT,Xgboot,lightGBM

今天給大家說一下樹系列的組合特征挖掘

GBDT是樹系列的一個(gè)模型,拆開來看就是 梯度(G)? + 集成(B) + 決策回歸樹(DT)

首先它是由一顆決策回歸樹(DT)為單位組成的,這里要注意是回歸樹不是分類樹,兩者有區(qū)別,例如預(yù)測(cè)的是身高、年齡這種連續(xù)的用回歸樹,如果出現(xiàn)是否點(diǎn)擊,是否聊天這種屬于分類

其次它是一個(gè)集成(B)的樹,它是一個(gè)串行的結(jié)構(gòu)和隨機(jī)森林不同,隨機(jī)森林是并行結(jié)構(gòu),為什么說它是串行結(jié)構(gòu),是因?yàn)樗鼤?huì)先讓第一個(gè)樹先學(xué)習(xí),假如你的目標(biāo)值是10,第一個(gè)樹只學(xué)到9,那么還有殘差為1沒有學(xué)到,第二顆樹的目標(biāo)值是1而不是10,直到最終學(xué)習(xí)到的值小于閾值,停止學(xué)習(xí)

最后說一下梯度(G),說白了它就是往殘差逐漸減小的方向?qū)W習(xí)

LR模型大家應(yīng)該比較清楚啦,它就是一個(gè)線性函數(shù)?w1x1+w2x2+......,之后外面套一個(gè)sigmoid函數(shù),把最終的數(shù)值映射到0-1之間,目的學(xué)的是w1,w2.....wn這些參數(shù)

GBDT + LR:

說白了就是兩步,

第一步把數(shù)據(jù)輸入到gbdt輸出的是每條數(shù)據(jù)對(duì)應(yīng)一個(gè)向量,如下圖所示

第二步把向量輸入到LR分類模型,獲取結(jié)果

代碼實(shí)現(xiàn):

導(dǎo)入相應(yīng)包

加載數(shù)據(jù),預(yù)處理

設(shè)置參數(shù),輸出實(shí)驗(yàn)結(jié)果:

現(xiàn)在大量的數(shù)據(jù)業(yè)務(wù)會(huì)出現(xiàn)很多高維度離散數(shù)據(jù),很多網(wǎng)上的帖子說之所以現(xiàn)在很多樹模型并不適用,是因?yàn)榇髷?shù)據(jù)高維離散特征,樹模型比較容易過擬合,其實(shí)以目前我的觀點(diǎn)來看,我并不完全贊同這種說法:

1、感覺很多樹模型并不適用的主要原因是沒有深度模型效果好

2、很多深度模型會(huì)加上正則項(xiàng)來控制過擬合,但是在非線性模型樹中,你主要就是調(diào)整樹的深度和個(gè)數(shù),通過訓(xùn)練集和測(cè)試集合的效果的差值來評(píng)判是否是過擬合,一般來說訓(xùn)練集AUC 和測(cè)試集AUC 之差大于3%,表示過擬合

3、現(xiàn)在很多公司都在用xgboost,lightgbm這種模型神器,很大一部分原因就是公司業(yè)務(wù)不同,數(shù)據(jù)不同,所以不同模型效果不同

很多公司都會(huì)測(cè)試各種模型,比較那個(gè)模型比較好

?

參考:

1、http://quinonero.net/Publications/predicting-clicks-facebook.pdf

2、https://www.jianshu.com/p/96173f2c2fb4

3、https://blog.csdn.net/weixin_41362649/article/details/83184422

4、https://blog.csdn.net/weixin_41362649/article/details/82803279

5、https://blog.csdn.net/weixin_41362649/article/details/82080198

?

總結(jié)

以上是生活随笔為你收集整理的GBDT+LR的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 久久午夜场 | 色视频导航 | 91视频网址 | 久久99成人 | 国产精品一区二区三区四区视频 | 久久久久亚洲日日精品 | 国产精品中文无码 | 一级做a爰片久久毛片潮喷 天天透天天干 | 成人软件在线观看 | 涩涩视屏 | 亚洲一区av | 麻豆av网址 | 91久久一区二区三区 | 久久yy| 久热久色 | 欧美成人hd | 日韩怡春院| 日本一级黄色录像 | 视频三区在线 | 男男gay羞辱feet贱奴vk | 亚洲人体av | 69久久精品| 老司机性视频 | 香港三级在线视频 | 成人免费视频国产免费网站 | 亚洲自拍偷拍一区二区 | 精品国产黄 | 一区二区网 | 日日夜夜操操操 | 一级aaaa毛片 | 竹菊影视一区二区三区 | 一区二区三区韩国 | 国产人妖在线播放 | 日本丰满少妇裸体自慰 | 女同激情久久av久久 | 美国黄色一级大片 | 欧美日韩中文在线 | 一级成人黄色片 | 国产免费视频 | 男女午夜视频在线观看 | 日韩欧美国产一区二区 | 最近中文在线观看 | 精品国产乱码一区二区三 | 国产精品无套 | 裸体喂奶一级裸片 | 中文无码日韩欧 | 国产乱淫av片免费 | 四季av日韩精品一区 | 男人添女人下部高潮视频 | 久久激情免费视频 | 久国久产久精永久网页 | 亚洲成人精品久久久 | 四虎色播 | 亚洲成人av免费在线观看 | 精品国产专区 | 成人av手机在线 | 中文字幕亚洲欧美日韩 | av动漫免费观看 | youjizz日本人| 蜜桃av在线免费观看 | 深爱开心激情 | 青青草原在线免费 | 91视频色版 | 波多野结衣亚洲 | 毛片毛片毛片毛片毛片毛片毛片毛片毛片 | av撸撸在线 | 国产情侣久久 | 69毛片 | 亚洲操操操 | 91免费在线视频观看 | 可以在线观看的黄色 | 欧美干 | 91操操操 | 都市豪门艳霸淫美妇 | 自拍超碰 | 亚洲国产精品成人av | 青草青草视频 | avxx| 五十路中出 | 青青草草视频 | a一级黄色片 | 97午夜| 在线干 | 18色av| 国产人妻精品一区二区三区不卡 | 亚洲精品传媒 | 成人在线视频网站 | 日本成人三级 | 欧美精品一级二级 | 亚洲超碰av | 偷自在线 | 鲁大师私人影院在线观看 | 青青草97国产精品麻豆 | 国v精品久久久网 | 日韩福利一区 | 艳妇臀荡乳欲伦交换电影 | 欧美黄色免费观看 | 午夜免费视频 | 免费成人在线观看视频 |