客户挽留:信用卡客户流失管理
一、客戶流失管理過程
業(yè)務目標:預測客戶流失的概率和挽留的價值-->
數(shù)據(jù)準備:數(shù)據(jù)決定結(jié)果-->
流失預警:哪些客戶即將流失-->
客戶價值:哪些客戶更值得挽留-->
分客群挽留策略:收益和成本的平衡-->業(yè)務目標
?
二、目標理解
需要對客戶的銷卡行為和價值進行預測,制定差異化的挽留策略,實現(xiàn)收益和成本的最佳平衡。
典型聚類問題,將客戶按銷卡概率和客戶價值分為四類:
1. 價值高、銷卡概率低
2. 價值低、銷卡概率低
3. 價值高、銷卡概率高
4. 價值低、銷卡概率高
?
三、數(shù)據(jù)準備
1. 設定目標變量Y:客戶銷卡概率、客戶價值
2. 設定時間窗口,因為要預測,自變量X應該在應變量之前預測才有意義,變量Y取半年內(nèi)客戶提出銷卡請求,自變量在應變量之前一年,如圖
?
3. 設計預測變量(自變量X)
- 身份特征:性別、年齡、職業(yè)、學歷...
- 行為習慣:消費頻次、購物類型、活躍度
- 信用歷史:信貸產(chǎn)品逾期、拖欠、還款情況
- 產(chǎn)品偏好:產(chǎn)品數(shù)量、產(chǎn)品類型、渠道喜好
- 客戶關(guān)系:持卡時長、投訴次數(shù)、營銷響應、社交特征
- 生活形態(tài):居住環(huán)境、網(wǎng)絡行為標簽、公共數(shù)據(jù)標簽
4.準備數(shù)據(jù)寬表
按客戶ID準備好包含目標變量(Y)和預測變量(X)的寬表
四、流失傾向預測
典型分類問題,使用Logistic回歸算法
1. 數(shù)據(jù)預處理非常重要,需要進行粗分類,比如某個變量的取值有100個,則將100個取值進行分組合并,減少變量取值的個數(shù)。原則是:組內(nèi)應變量差別小,組間應變量差別大。
2. 計算分組變量的WOE和IV值(帥選變量依據(jù))
粗分類后,全部變量為類別變量,需計算WOE和IV值了解分組結(jié)果對應變量的顯著性
WOE(Weigh Of Evidence)
IV(Information Value): 體現(xiàn)自變量對目標變量的顯著性影響,一般來說IV在0.1到0.5直接表明變量X與目標變量有一定的相關(guān)性
3. 共線性檢查
檢查WOE分組變量之間的相關(guān)性,對具有相關(guān)性的一批變量,可選其中的一個變量作為代表,這樣可以減少變量的個數(shù)。
指標:方差膨脹因子VIF(Varience Inflation Factor),VIF=1/(1-Rsquare)
- 0<VIF<5:存在較弱共線性
- 5<=VIF<10:存在較強共線性
- VIF>=10:存在強共線性
4. 模型訓練:顯著性檢驗
使用SAS Proc Logistic處理,一是得出與目標變量顯著相關(guān)的自變量,一是模型對訓練數(shù)據(jù)預測一致性百分比
5. 模型評估
運用驗證集數(shù)據(jù),根據(jù)模型訓練計算出來的模型,進行打分。
首先,按預測概率P從大到小進行排序,將全部客戶分為若干組,然后計算每組客戶的實際銷卡率、平均預測概率(實際上是準確率)、累計銷卡率(ROC曲線)、KS、提升度
1)實際銷卡率vs平均預測概率曲線(準確率曲線)
二曲線重合度越高,則模型的準確度越高,曲線陡峭下降,說明模型的區(qū)分能力強,能夠?qū)撛诘匿N卡客戶鎖定在較小的范圍內(nèi),曲線平滑,說明模型穩(wěn)定,無過擬合問題。
2)累計銷卡率(ROC曲線)
體現(xiàn)模型覆蓋銷卡客戶的能力,建設將客戶隨機等分20組,則每組應該還該5%的銷卡客戶,如果打分最高的5組客戶(占客戶總量的25%),覆蓋了75%的銷卡客戶,說明只要針對這25%的客戶進行挽留,就能獲得全部客戶挽留75%的效果
?
3)KS:累計銷卡率-累計未銷卡率
用于評價模型的區(qū)分度,KS在30%-60%之間,則說明模型具有較強的區(qū)分度,如果KS過高,需要檢查變量的設計是否存在問題,或者運用跟多的驗證集檢查過擬合情況。
4)LIFT:提升度
相對不使用模型,運用模型能夠縮小目標客戶分布范圍的能力,即使用模型累計銷卡率/隨機情況累計銷卡率,如將客戶隨機等分20組,最高預測概率組有累計23%的銷卡率,提升率為23%÷5%=4.6
?
五、潛在客戶價值預測
預測數(shù)值,是典型的慧谷問題,線下回歸是最常用的算法。這里用了Logistic回歸和線性回歸相結(jié)合方法,先用Logistic回歸預測客戶為高價值的概率Ph,再將Ph作為預測變量與其他變量X一起建立線性回歸模型。
1. 高價值概率Ph預測:認為根據(jù)客戶價值劃分為兩組,高價值客戶和低價值客戶,方法有二八法則,價值最高的20%的客戶定義為高價值客戶,也可以繪制Value分布圖,將拐點作為劃分依據(jù)。
然后按照流失傾向預測的方法進行建模。
2. 客戶價值數(shù)值預測
線性回歸模型,變量X一般為數(shù)值型變量,對于離散型變量,通常選擇其他方法選擇最有影響力的變量劃分客戶群,為每個客戶群分別建立線性回歸模型?;蛘咴诟邇r值概率Ph預測時轉(zhuǎn)化為WOE變量。
3. 模型評估
兩項指標:
1)R方:體現(xiàn)預測變量X對目標變量Y的解釋能力,介于0~1之間,越接近1,模型的擬合度越好。模型擬合度好并不代表在實際應用時能夠準確預測,也可能存在過擬合,所以R方是聘雇模型的必要條件,但不是充分條件。
2)擬合曲線:
根據(jù)驗證集的預測結(jié)果,對比客群預測值和實際值,這樣的對比很有說服力。通常根據(jù)預測值從高到低等分20組,繪制魅族平均預測值和實際值,繪制擬合曲線。曲線解讀方法包括曲線擬合程度,陡峭程度、光滑性等。
?
六、客戶細分:差異化營銷服務的基礎
兩個模型建立之后,已經(jīng)可以預測未來哪些客戶更可能流失以及其潛在客戶價值高低,需要做的是識別最值得挽留的客戶,有效的分配營銷資源
?
以上內(nèi)容來自《SAS金融數(shù)據(jù)挖掘與建模:系統(tǒng)方法和案例解析》第六章
?
總結(jié)
以上是生活随笔為你收集整理的客户挽留:信用卡客户流失管理的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 沿黄生态旅游公路品牌宣传口号文案30句
- 下一篇: 离散概率分布与期望