入坑推荐系统,拿这个开源项目练手
如果說互聯網的目標就是連接一切,那么推薦系統的作用就是建立更加高效的連接了。
不得不說抖音的推薦系統,太厲害了。刷了啥,立刻記住你的偏好,推薦相似內容,一不小心 2 小時就過去了,讓人欲罷不能,要么日活 6 億呢。
其實“推薦系統”從沒像現在這樣,影響著我們的生活。除了抖音、快手這類短視頻,還有網購時,天貓、京東會為你推薦商品;想看看資訊,頭條、知乎會為你準備感興趣的新聞等等。
?
而驅動這些巨頭進行推薦服務的,都是基于深度學習的推薦模型。
?
想起 2019 年阿里的千人千面系統,促成了天貓“雙 11” 2684 億成交額。假設通過改進商品推薦功能,使平臺整體的轉化率提升 1%,就能在 2684 億成交額的基礎上,再增加 26.84 億。這就是推薦工程師的最牛的地方,也是為啥人能拿百萬年薪的原因。
?
但在一個成熟的推薦系統上,找到提升的突破點并不容易——不能滿足于協同過濾、矩陣分解這類傳統方法,而要建立起完整的“深度學習推薦系統”知識體系,加深對深度學習模型的理解,以及大數據平臺的熟悉程度,才能實現整體效果上的優化。
?
所以假期除了刷抖音,我又重新看了看《深度學習推薦系統》這個專欄,2 刷有不少新的啟發。作者王喆,Roku 推薦系統架構負責人,也是咱圈里的大佬,一直深耕在推薦系統、計算廣告領域,經驗非常豐富。他之前出過同名的書,豆瓣評分?9.3,相當高。
?
當年我看書的時候,就感覺實踐太少,偏模型原理。所以在聽說王喆開了個實踐專欄時,第一時間就訂閱了,跟著學下來,受益匪淺。讓我完整地把推薦系統的原理捋了一遍。下面王喆總結的「核心知識圖譜」,建議收藏。
最重要的是,實操性特別強。王喆特地為了這個專欄,開發了一個開源項目「 SparrowRecsys」,能讓你親手嘗試,搭建一套完整的深度學習推薦系統(下面有詳細介紹,賊有意思)??梢哉f是書的實踐版本,里面加入了更多技術細節的實現和討論。
?
毫不夸張的說,這個專欄讓我對深度學習推薦系統的認知,提升到了一個新高度,所以很想把它推薦給你,掃碼免費試讀????
?
限時秒殺+口令「happy2021」
到手僅 ¥89 ,原價?¥129
新用戶到手僅?¥59.9
?
?
王喆這課,為啥值得買?
?
先來說說這個 SparrowRecsys 推薦系統。王喆把它叫做“麻雀推薦系統”,取“麻雀雖小、五臟俱全”之意,它利用了開源的 movielens 數據集,搭建起了包括:
Spark、Flink 特征工程
TensorFlow 深度學習模型訓練
TensorFlow Serving 模型服務
Redis 在線特征數據庫
Jetty Server 推薦服務器
JS 前端實現
?
以上這些在內的,一整套深度學習推薦系統。不說它能支撐起一個中大型公司的推薦系統,但是毫無疑問,它可以成為一個工業級推薦系統的種子項目。而這一切,都能在課程里,一步步嘗試搭建起來。
?
最后你實現的推薦系統會是這個樣子????
?
SparrowRecSys的首頁
?
SparrowRecSys的相似電影推薦頁
?
在這些前端頁面的背后,是你能實現的一個又一個深度學習模型:
?
對于電影的相似推薦功能,王喆會使用各種 Embedding based 的方法,比如 item2vec,graph embedding 等等。
對于推薦功能,會基于 TensorFlow 實現Embedding MLP,Wide&Deep,NerualCF,Two Towers,DeepFM,DIN 等等深度學習模型,然后使用 TensorFlow serving 去進行模型服務。
對于召回層、排序層這些推薦邏輯,也會全盤在基于 Jetty 的推薦服務器中實現。
?
整個項目整體的技術架構是下面這個樣子的:
?
SparrowRecSys的技術架構
?
是不是感覺很牛。其次,專欄本計劃是 30 講,生生寫到 43 講,補充討論了很多熱門的問題。在這里貼 15 個專欄里討論的問題,看專欄留言區的討論,感覺收獲更大。
?
?
最后說說,他是怎樣講解這門課程的?
整體遵循了經典推薦系統的框架,分為 6 部分,學懂了,實現一個工業級的深度學習推薦系統,不成問題,簡單介紹下:
?
基礎架構篇:講要從 0 開始實現的推薦系統, Sparrow RecSys 的主要功能和技術架構,也會用到 Spark、Flink、TensorFlow 等業界最流行的機器學習和大數據框架。
?
特征工程篇:討論推薦系統會用到的特征,以及主要的特征處理方式,并將其實踐在 Spark 上。此外,還有深度學習中非常流行的 Embedding、Graph Embedding 技術,并帶你實現 Sparrow Recsys 中的相似電影推薦功能。
?
線上服務篇:帶你搭建一個推薦服務器,包括服務器、存儲、緩存、模型服務等模塊和相關知識,涉及 Jetty Server, Spark、Redis 的使用。
?
推薦模型篇:深度學習推薦模型的原理和實現方法,包括 Embedding+MLP ,Wide&Deep,PNN 等深度學習模型的架構和 TensorFlow 實現,以及注意力機制、序列模型、增強學習等相關領域的前沿進展。
?
效果評估篇:效果評估的主要方法和指標,建立起包括線下評估、線上 AB 測試、評估反饋閉環等整套的評估體系,真正能夠用業界的方法,而不是實驗室的指標來評價一個推薦系統。
?
前沿拓展篇:講 YouTube、阿里巴巴、微軟、Pinterest 等一線公司的深度學習應用,幫你追蹤業界發展的最新趨勢。
目錄也放這兒了????
?
可以說,王喆老師的書也好,課也好,從未叫人失望過,而且他人也特別 nice,經常在專欄下面跟讀者留言互動,這種耐心和責任心,真不是一般人有的。
?
????掃碼免費試讀
限時秒殺+口令「happy2021」
到手僅?¥89?,原價?¥129
新用戶到手僅?¥59.9
沒計劃的學習,都只是作秀。與其花時間找一堆資料,還不如有計劃的消化一個系統的課,更值。
?
????點擊「閱讀原文」,新用戶?¥59.9 就能拿下。
總結
以上是生活随笔為你收集整理的入坑推荐系统,拿这个开源项目练手的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 长春塑料打包站有几家,在线等?
- 下一篇: java信息管理系统总结_java实现科