日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

信用评分卡模型的理论准备

發布時間:2025/3/21 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 信用评分卡模型的理论准备 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄

  • 0 前言
  • 1 構建評分卡的整個流程圖
  • 2 信息值 IV(Information Value)和 證據權重 WOE(Weight of Evidence)
    • 2.1 WOE 定義
    • 2.2 IV 定義
    • 2.3 IV的極端情況
  • 3 評分卡構建
    • 3.1 評分卡刻度
    • 3.2 基于Logistic的評分卡構建
    • 3.3 其它算法評分卡構建(保留觀點)
  • 4 模型穩定性PSI(Population Stability Index)
    • 4.1 穩定性監測
    • 4.2 PSI計算
  • 參考資料:

?

正文

0 前言

評分卡模型最早是用在銀行審批用戶申請貸款的環節。不過,由于近年來小貸的盛行,越來越多的公司開始基于自己平臺的用戶數據來構建評分卡模型。銀行信用評分卡一般分為兩類:

  • 申請評分卡,對新貸款申請進行篩選并判斷其違約風險;
  • 行為評分卡,對審批通過的貸款賬戶進行覆蓋整個貸款周期的管理。
  • 在介紹評分卡的構建過程之前,我們首先引入一個標準信用卡的格式示例,這樣可以有一個直觀的概念。


    其中,485是模型計算的基礎分值,39,36,38分別是Age,TAR,ES變量取值所在評分區間或類型的得分,將它們相加就得到了該用戶在所建評分卡的最后總得分。

    本篇文章主要介紹評分卡構建中的幾個主要概念,以及在構建評分卡過程中遇見的些許問題,目的也是為了方便自己日后查閱。對于樣本的數據處理過程和代碼實現并沒有涉及。

    1 構建評分卡的整個流程圖

    該流程中各個步驟的順序可以根據具體情況的不同進行調整,也可以根據需要重復某些步驟。

    2 信息值 IV(Information Value)和 證據權重 WOE(Weight of Evidence)

    2.1 WOE 定義

    介紹 IV 的計算方法之前,首先要明白 WOE 的概念,因為 WOE 是計算 IV 的基礎。標準評分卡的創建也可以不采用WOE轉換,引入WOE的目的并不是為了提高模型質量。

    如上,變量ResStatus為類別變量,有三種類別:屋主、其他、承租人。表中計算了這個變量的每種類別對應目標變量所占的正常和違約的人數,正常占全部正常的比例(正常的分布)和違約占所有違約的比例(違約的分布),然后計算每個類別對應的 WOE 。

    WOE 的定義如下:

    ?

    WOEi=ln[Bad?DistributioniGood?Distributioni]WOEi=ln?[Bad?DistributioniGood?Distributioni]


    WOEi=ln(Bi/BTGi/GT)WOEi=ln?(Bi/BTGi/GT)


    其中Bi,BT,Gi,GTBi,BT,Gi,GT?分別為第?ii?類中違約用戶數量、總的違約用戶數量、第?ii?類中正常用戶數量、總的正常用戶數量。

    需要記住的是,對于類別?ii,正常和違約的分布分別定義為:

    ?

    Good?Distributioni=Number?of?GoodiTotal?Number?of?GoodGood?Distributioni=Number?of?GoodiTotal?Number?of?Good


    Bad?Distributioni=Number?of?BadiTotal?Number?of?BadBad?Distributioni=Number?of?BadiTotal?Number?of?Bad

    如果括號內的比值小于1, WOE 為負值;反之為正值。上面表中ResStatus變量為類別型變量,同樣的定義和計算方法也適用于連續型變量,但對于連續型變量計算 WOE 之前,需要先將變量分段(bin)。

    從上式中可以發現,WOEiWOEi?為第?ii?類中違約與正常的比率與整個樣本中違約與正常比率的比值的對數。因此,其目的是衡量第?ii?類對違約與正常的比率的影響程度。|WOEi||WOEi|?越大,說明此類別更能區分違約與正常用戶,|WOEi||WOEi|?越小,此類別區分違約與正常不明顯。

    通常,對連續型變量進行分箱計算WOE之后,其各個分箱的WOE值應該呈現一個單調趨勢。當然,有時連續性變量的WOE也有可能呈現一個U型趨勢(比如在上面前言中評分卡的變量Age)。不管如何,首先都要從業務上能給出一個合理的解釋,否則,這個變量很可能沒法放到我們最后創建的評分卡中。

    2.2 IV 定義

    IV 是用來衡量自變量對目標變量的影響程度的指標。

    ?

    IVi=(Bi/BT?Gi/GT)?ln(Bi/BTGi/GT)IVi=(Bi/BT?Gi/GT)?ln?(Bi/BTGi/GT)

    ?

    IV=∑iIViIV=∑iIVi

    IV 值是 WOE 的加權求和,在?IViIVi?的表達式中分為兩個部分,可以認為,前一部分表示此分組在全部數據中所占比例,后一部分則表示此分組區分違約與正常用戶的能力。IViIVi?由兩部分的值共同決定,也就決定了最后的?IVIV。

    2.3 IV的極端情況

    IV 依賴 WOE,如果在分箱后的某個分組對應的違約或者正常的用戶數為0,則這個分組對應?WOEi=∞WOEi=∞?,相應的?IVi=+∞IVi=+∞?,而此時這樣分組是沒有意義的。解決方法如下:

  • 如果此分組在所有樣本中所占比例比較大,則可考慮將此變量的分組單獨作為一條規則,作為模型的前置條件或補充條件;
  • 如果此分組在所有樣本中所占比例比較小,可重新對變量進行分組,使這種現象不再發生;
  • 可以將分組中的數據0用1代替,使計算有意義。
  • 3 評分卡構建

    3.1 評分卡刻度

    對于任意一個用戶,將其被估計的違約概率表示為 p,則估計的正常概率為 1-p,則可以得到:

    ?

    Odds=p1?pOdds=p1?p

    評分卡設定的分值刻度可以通過將分值表示為 Odds 對數的線性表達式來定義。如下表示:

    ?

    Score=A?Blog(Odds)Score=A?Blog(Odds)

    其中,A 和 B 為常數。上式中負號可以使得違約概率越低,得分越高。
    Logistic 回歸模型計算 Odds 如下:

    ?

    log(Odds)=β0+β1x1+?+βpxplog(Odds)=β0+β1x1+?+βpxp

    其中,β0,β1,?,βpβ0,β1,?,βp?由 Logistic 模型擬合給出。

    常數 A 和 B 通常被稱為補償和刻度,它們的值可以通過將兩個已知或者假設的分值帶入?Score=A?Blog(Odds)Score=A?Blog(Odds)?中得到。通常,需要兩個假設:

    • 在某個特定的比率設定特定的預期分值?P0P0;
    • 指定比率翻番的分數(PDO,Point-to-Double Odds)。

    首先,設定比率為?θ0θ0?的特定點的分值為?P0P0。然后,比率為?2θ02θ0?的點分值為?P0?PDOP0?PDO。帶入得到兩個等式:

    ?

    P0=A?Blog(θ0)P0=A?Blog(θ0)

    ?

    P0?PDO=A?Blog(2θ0)P0?PDO=A?Blog(2θ0)

    解上述兩個方程中的常數 A 和 B, 可以得到:

    ?

    B=PDOlog(2)B=PDOlog(2)

    ?

    A=P0+Blog(θ0)A=P0+Blog(θ0)

    例如,假設想要設定評分卡刻度使得比率為 1:60(違約與正常)時的分值為600分,PDO = 20。然后計算出 B = 28.85, A = 481.89,于是計算得分公式為:

    ?

    Score=481.89?28.85log(Odds)Score=481.89?28.85log(Odds)

    3.2 基于Logistic的評分卡構建

    最終,評分卡的分值可以寫成下列形式:

    ?

    Score=A?B(β0+β1x1+?+βpxp)Score=A?B(β0+β1x1+?+βpxp)

    變量?x1,?,xpx1,?,xp?為自變量對應 WOE,可以進一步寫成:

    ?

    Score=A?B???????????β0+(β1ω11)δ11+(β1ω12)δ12+??+(βpωp1)δp1+(βpωp2)δp2+????????????Score=A?B{β0+(β1ω11)δ11+(β1ω12)δ12+??+(βpωp1)δp1+(βpωp2)δp2+?}

    其中,ωijωij?是第?ii?個變量對應的第?jj?個類別上的 WOE ,?δijδij?是二元變量,表示變量?ii?是否取第?jj?個值。 上式可重新寫為:

    ?

    Score=(A?Bβ0)?(Bβ1ω11)δ11?(Bβ1ω12)δ12?????(Bβpωp1)δp1?(Bβpωp2)δp2??Score=(A?Bβ0)?(Bβ1ω11)δ11?(Bβ1ω12)δ12?????(Bβpωp1)δp1?(Bβpωp2)δp2??

    其中,A?Bβ0A?Bβ0?為基礎分值,而下面每一行對應的相應變量?x1,?,xpx1,?,xp?的得分。

    3.3 其它算法評分卡構建(保留觀點)

    從上面可以看到,基于Logistic的評分卡給予每個變量的每個分箱一個特定的分數,其目的是對評分卡做出一個合理的解釋,例如,如果客戶想提高自己的評分,可以通過提高評分卡中的某些指標的值,使之對應的分數提高就可以了。

    當然,還有其它一些算法可以幫助我們構建評分卡,比如:RandomForest, GBDT等。這些算法可以給出客戶的違約概率,但是構建的評分卡不能像Logistic那樣計算每個變量的分箱或類型得分,我們只能根據這個違約概率計算客戶的總評分。但依然要依據上面定義的評分刻度:

    ?

    Score=A?Blog(Odds)Score=A?Blog(Odds)

    其中,

    ?

    Odds=p1?pOdds=p1?p

    4 模型穩定性PSI(Population Stability Index)

    4.1 穩定性監測

    模型上線之后,要對實際運行情況進行監測,主要為兩個方面:

    用戶在模型中得分分布的穩定性:模型上線之后的真實數據得分分布(real data)和建模時訓練數據(train data)的得分分布比較;

    變量穩定性:模型上線之后的實際變量分布(real data)和建模時訓練數據分布(train data)比較。

    4.2 PSI計算

    首先對樣本A和樣本B得分按照同一標準分為幾個區間(類別型變量按類別分),計算樣本在每個區間上的占比。在每個區間上,將兩個樣本各自占比相除再取對數,然后乘以各自占比之差,最后將各個區間的計算值相加,最終得到PSI(類似于IV計算),如下:

    ?

    PSI=∑i(Ai/AT?Bi/BT)?ln(Ai/ATBi/BT)PSI=∑i(Ai/AT?Bi/BT)?ln?(Ai/ATBi/BT)

    • PSI < 0.1 樣本分布有微小變化
    • PSI 在 0.1 和 0.2 之間, 樣本分布有變化
    • PSI > 0.2 樣本分布有顯著變化

    重點關注 PSI > 0.2 的變量,說明此變量的分布在建模時與現在已經發生了顯著的變化,查找PSI變動的原因,并重新調整模型。

    ?

    總結

    以上是生活随笔為你收集整理的信用评分卡模型的理论准备的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 欧美一级xxx| 不卡一区二区三区四区 | 成人性生生活性生交全黄 | 日韩福利视频 | 少妇激情四射 | 亚洲精品午夜国产va久久成人 | 成人a毛片久久免费播放 | 久射网| 日本久久片 | 小柔的淫辱日记(h | 欧美日韩一区二区三区四区五区 | 欧美日韩在线播放 | 最近2018年手机中文字幕版 | 国产无码精品久久久 | 亚洲中文字幕久久无码 | 性生活在线视频 | 欧美综合激情网 | xxxx69国产 | 国产3级在线 | 麻豆91在线| 毛片免费视频 | 污污小视频| 色天使亚洲 | 日批在线视频 | 韩国女主播裸体摇奶 | 激情都市一区二区 | 国产在线观看精品 | 亚洲午夜网 | 欧美 日韩 国产精品 | 我我色综合 | 久久久嫩草 | 色视频在线免费观看 | 欧美日韩一区二区久久 | 香蕉久久国产 | 77777av | 任你躁av一区二区三区 | 老熟妇仑乱一区二区av | 北条麻妃在线一区二区 | 日一日射一射 | 射在线| 免费的性爱视频 | 中国成熟妇女毛茸茸 | 精品成人免费一区二区在线播放 | 日韩av免费| 欧美一级在线看 | 91免费观看网站 | 小珊的性放荡羞辱日记 | 干日本少妇首页 | 丰满人妻一区二区三区无码av | 91大神一区二区 | 一级性视频 | 美女激情网 | 性高潮免费视频 | 亚洲AV无码成人精品区明星换面 | 国产a级片视频 | 五月婷婷综合久久 | 一级黄色电影片 | 美日韩一区二区三区 | 99精品国产一区 | 久久av一区二区三 | 污版视频在线观看 | 99re视频在线播放 | 蜜桃传媒一区二区亚洲 | 亚洲天堂美女 | 亚洲天堂影视 | 日韩无套无码精品 | 99激情网| 熟睡侵犯の奶水授乳在线 | 日本免费三级网站 | 欧美日韩精品免费 | 亚洲一区色 | 激情国产在线 | 国产精品极品 | 草草屁屁影院 | 国产精品电影一区二区三区 | 中文字幕网站在线观看 | 亚洲一区二区在线 | 韩国日本美国免费毛片 | 99精品久久精品一区二区 | 激情五月激情综合网 | 国产精品久久久久久久久免费桃花 | 大桥未久中文字幕 | 国产精品无码久久久久一区二区 | 视频丨9l丨白浆 | 一区二区三区91 | 一区二区欧美日韩 | 精品日韩在线观看 | 欧美性视频在线 | 饥渴少妇伦色诱公 | 欧美第一页草草影院 | 天天干干天天 | 亚洲一区二区精品视频 | 日韩精品国产一区二区 | 亚洲视频免费播放 | 男女曰逼视频 | 精品丰满少妇一区二区三区 | 欧美aaa大片| 亚洲国产精品成人va在线观看 | 在线成人欧美 |