手淘促活那些事儿 | 智能投放算法框架助力用户增长
導讀:本文主要介紹以手淘促活為目的的全鏈路智能投放算法框架,該框架目前接入以 Pagani 為核心的全鏈路運營平臺,首先使用用戶意圖識別算法圈選出目標人群,然后借助物料智能推薦和權益動態面額等算法實現全鏈路上用戶的個性化觸達干預。本文以 2019 年春節期間手淘促活項目為例,具體地介紹權益智能投放框架的設計思路和實際應用。
一、背景:春節手淘促活
由于快遞物流、商家打烊等因素,春節是電商的淡季。對于手淘來說,在春節期間,用戶的活躍程度有明顯的下滑, DAU 出現一段時間的低谷。通過算法提前預測春節期間活躍度會發生下降的預警人群,配合不同階段的用戶運營干預(在節前預熱期結合春節“吃喝玩樂”的場景,算法個性化推薦相應的虛擬權益;春節期間通過 PUSH 消息每日推送提升來訪率),可以有效地促進用戶回訪、扼制用戶活躍度的降低。
如圖,通過對近兩年春節前后的 DAU 的變化趨勢進行統計分析,我們發現,春節對 DAU 的影響持續以除夕為中心的近一個月的時間(從臘月十六到正月十五左右),而傳統春節放假的 7 天是 DAU 的最低谷( 18 年除夕晚有春晚紅包加持除外)。
根據以上分析結果,可定義出模型預測的關鍵的時間節點。在節前,通過算法預測,從臘月十六到正月十五的春節30天期間,活躍度會發生下降的“降級預警人群”,在整個活動期對“降級預警人群”進行有針對性的用戶運營干預,而在進行干預時,又可以通過推薦算法,結合用戶的意圖識別,進行權益的個性化承接。
二、全鏈路智能投放算法框架
?
如圖所示,權益智能投放算法框架,主要包括意圖識別、權益推薦兩個功能模塊:
意圖識別:
解決“是否發”的問題,側重點在于“圈人”,給什么樣的用戶發放權益;
對于春節促活項目的具體訴求,通過用戶的來訪意圖模型,提前預測無來訪的用戶,在站內通過支付成功頁等場景的權益觸達提前干預,站外通過PUSH消息等渠道進行權益觸達和召回。
權益推薦:
解決“發什么”的問題,給用戶發放什么樣的權益;
拿到圈選的人群后,需要對人進行“千人千面”的權益個性化承接。
三、算法模塊
3.1 意圖識別
意圖識別,根據用戶畫像和歷史行為,預測用戶未來某一時間段內、某種行為(如用戶的來訪、點擊、收藏、加購、購買等)的發生的概率。
對于用戶增長來說,大部分情況下,運營的干預目標往往不是單一的,而是“既要、又要、還要、也要“的。對于運營的一個干預策略,目標是多樣性的,需要考慮來訪率、次日留存率、瀏覽轉化率、成交轉化率、ROI等不同的目標如何權衡和綜合優化。
針對不同的干預目標,構造樣本數據和搭建多意圖的訓練體系:
LABEL選取和樣本構造:
根據不同的優化目標,加工數據,選用不用的LABEL和抽取樣本,如領取率LABEL對應權益是否領取,核銷率LABEL對應權益是否核銷,成交轉化率對應用戶是否有下單支付等;
用戶意圖體系構建:
訓練用戶來訪、點擊、收藏、加購、購買等不同的意圖評分模型;
**意圖模型日常評估:
**
- 用戶購買意圖:AUC = 0.83,F1 score = 0.76
- 用戶來訪意圖:AUC = 0.86,F1 score = 0.78
- 用戶點擊意圖:AUC = 0.76,F1 score = 0.88
- 用戶加購意圖:AUC = 0.80,F1 score = 0.64
- 用戶收藏意圖:AUC = 0.88,F1 score = 0.58
具體到春節用戶無來訪的預測問題來說,核心就是用戶來訪意圖的預測。以 2017 年春節期的數據作為訓練集, 2018 年春節期的數據作為測試集,評估數據如下:
?
3.2 權益推薦
權益推薦,解決用戶的權益個性化承接的問題,綜合考慮用戶的權益偏好和敏感度、各類權益的目標人群和庫存量、平臺的補貼成本等,實現用戶、商家、平臺的三方共贏。
手淘春節促活項目,是全鏈路智能投放框架首次應用于購后發放權益,由于初次上線且投放時間較短,算法需要快速迭代和提升效果。推薦算法經過冷啟動、引入CTR模型、 Thompson Sampling 調權等 3 輪迭代,快速優化和提升了點擊率和核銷率。
? 3.2.1 冷啟動策略
冷啟動的策略設計主要包含兩部分:
1、ε-Greedy算法
解決冷啟動問題和優化系統 E&E 問題的最基礎、簡捷的方法。其基本思路為:在 (0, 1) 之間選擇一個較小的ε值,然后以ε的概率選擇流量,從權益底池中進行隨機推薦,即完成勘探Exploration的功能,以 1 - ε 的概率選擇流量,基于先驗信息設計的決策樹推送權益,即利用現在已有的先驗信息完成開發Exploitation的功能。
**2、基于先驗信息設計決策樹
**
在上線初期,權益底池中的各類優惠券還沒有曝光、點擊信息時,可以根據用戶的基礎畫像信息,以及用戶在站內已有的瀏覽、加購、購買等行為的信息,作為設計決策樹時的一部分先驗信息。
? 3.2.2 CTR模型
權益推薦模塊,相比于用戶意圖識別,增加了“權益”這個實體,因此在特征的設計上需要更多的考慮權益維度、用戶和權益的交叉特征等。可以說用戶意圖識別是一個偏用戶洞察理解的問題,而權益個性化則是一個典型的推薦問題。
如圖所示,在特征的設計上,主要包括用戶維度特征、權益維度特征,以及用戶和權益的交叉特征:
用戶維度特征的設計,與用戶意圖識別模塊基本類似,可以復用用戶的基礎特征、行為特征。而在權益維度,則需要更多地考慮權益本身的差異,通過標題、面額、所屬二方業務、權益所映射的類目 ID ,以及歷史的領取率、核銷率更細致地刻畫不同權益的差異性。同時,將用戶的特征與權益的特征進行交叉,來學習不同畫像的用戶在指定權益上的偏好。
點擊率預估模型選取的是 XFTRL 。XFTRL 是基于阿里的 eXtreme Parameter Server 平臺開發的高性能異步 ASGD FTRL 算法,能夠支持千億規模的特征和長時間連續增量訓練。
2017年,阿里巴巴推薦算法團隊和計算平臺 PAI 團隊合作打造了 eXtremeParameter Sever 機器學習平臺(XPS),廣泛全流量運行在手機淘寶的猜你喜歡、生活研究所、飛豬旅行和天貓推薦等大數據場景,取得了較好的效果。
FTRL 是一種 Online Learning Optimizer ,原始的 FTRL 的具體資料可以參考論文: Mcmahan, H. Brendan , et al. "Ad click prediction: a view fromthe trenches." Proceedings of the 19th ACM SIGKDD internationalconference on Knowledge discovery and data mining ACM, 2013.
XFTRL 算法是對經典線性算法 FTRL 的擴展,是為了解決大規模數據下 FTRL 的一些缺點而提出的。集團內的多數場景對于用戶行為時效性要求很高,實時/準實時學習可以充分利用實時日志數據,快速更新模型來適應用戶最新行為,更好地強調近期樣本的重要性,可以實時快速迭代,快速反應線上變化。
利用上線初期積累的3天的樣本訓練模型,測試集評估 AUC 僅達 0.61 。另外,在分析時發現各個二方權益的曝光量差異較大,且長尾的二方權益的量很小,因此在短時間內優化算法, E&E 機制的設計就至關重要。
? 3.2.3 E&E 優化
長尾 item 在推薦系統中很少或沒機會展示,導致 CTR 預估不準,需要探索性給他們創造一些機會,但不能給系統帶來太大損失,這就是 E&E 問題。針對 E&E 的問題,我們選取了比較經典的 Thompson Sampling 算法進行 explore 。
湯普森采樣(Thompson Sampling)基于貝葉斯思想,全部用概率分布來表達不確定性。
- 假設每個 item 有一個產生回報的概率p,我們通過不斷試驗來估計一個置信度較高的概率 p 的概率分布。
- 假設概率p的概率分布符合beta(wins,lose)分布,它有兩個參數: wins, lose, 每個 item 都維護一個 beta 分布的參數。每次試驗選中一個 item ,有回報則該 item 的 wins 增加 1 ,否則 lose 增加 1 。
- 每次選擇 item 的方式是:用每個 item 現有的 beta 分布產生一個隨機數b,選擇所有 item 產生的隨機數中最大的那個 item 。
湯普森采樣算法的核心在于確定 Beta 分布的參數,以表征后驗的 ctr ,如下圖所示,為湯普森采樣擬合后驗 ctr 的分布曲線:
?
湯普森采樣代碼實現比較簡單,在 Java 中可以基于 math3.distribution.BetaDistribution 包快速實現。在計算廣告和推薦領域應用的效果與 UCB(Upper Confidence Bound ,一種基于估計的置信區間設計的E&E優化策略)相比 competitive to or better ,且對于數據延遲反饋、批量數據反饋更 robust 。
四、實驗效果
整個春節促活項目,包括意圖識別“圈人” 和權益推薦的 “個性化承接”兩部分, 因此AB實驗設計上,包括圈人的干預桶與空桶的對比(衡量干預帶來的活躍度提升和DAU增量),和權益個性化承接算法桶與隨機桶的對比(衡量權益個性化算法的效能)。
手淘促活整體AB指標 (干預桶對比空桶)
- 干預桶日均來訪率提升1.2%
- 干預桶人群活躍度未下降的用戶比率提升1.42%
權益個性化AB指標(算法桶對比隨機桶)
- 領取率提升40%
- 核銷率提升100%
五、對未來的期望
更完備的數據鏈路:
- 數據是算法的核心驅動力,完備的數據鏈路至關重要。目前有一部分場景的埋點和數據鏈路尚未打通,比如進入二方承接頁的數據的回撈的問題,后續是重點推動和解決的。
引入”供需平衡“的分配機制:
- 在多供給物料混排時,綜合考慮供需關系,從博弈論和機制設計的角度考慮整個系統,設計供給與需求之間的游戲規則,進一步提升活躍用戶在鏈路核心節點的轉化率;
沉淀用戶生命期有效算法干預策略:
- 依靠現有的用戶增長權益智能發放體系,沉淀各生命期用戶算法干預組合策略。
原文鏈接
本文為云棲社區原創內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的手淘促活那些事儿 | 智能投放算法框架助力用户增长的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【从入门到放弃-Java】并发编程-线程
- 下一篇: 干货!看云原生时代阿里云的四个“最”