python在银行的应用案例_银行风控案例(python)
前言:
風險控制是挖掘中最為常見的應用,屬于監督學習的“分類器”使用案例。我們通過以往歷史數據判斷用戶違約的概率。本文使用了Logistic Regression 方法完成案例。
首先是基于個人借貸的場景,確定“違約”的定義: 根據新的Basel II Capital Accord(巴塞爾二資本協議),一般逾期90天算作違約。
風控模型開發流程
· 數據抽取
· 數據探索
· 建模數據準備
· 變量選擇
· 模型開發與驗證
· 模型部署
· 模型監督
import pandasas pd#pandas包
import numpy as np#numpy包
import matplotlib.pyplot as plt#畫圖包
import seaborn as sb#畫圖包
from sklearn.linear_model import LogisticRegression#隨機森林包
from sklearn.cross_validation import KFold,cross_val_score#交叉驗證包
from sklearn.metrics import confusion_matrix,recall_score,classification_report#混淆矩陣包
from sklearn.preprocessing import StandardScaler數據標準化處理
1.數據準備
數據來自Kaggle,cs-training.csv是有15萬條的樣本數據,違約(1):不違約(0)=0.06:0.94),字段解釋如下。
SeriousDlqin2yrs:超過90天或更糟的逾期拖欠
RevolvingUtilization Of UnsecuredLines:無擔保放款的循環利用:除了不動產和像車 貸那樣除以信用額度總和的無分期付款債務的信用卡和個人信用額度總額
Age:借款人年齡
NumberOfTime30-59DaysPastDueNotWorse:30-59天逾期次數
DebtRatio:負債比例
MonthlyIncome:月收入
Number Of OpenCreditLinesAndLoans:貸款數量
NumberOfTimes90DaysLate:90天逾期次數:借款者有90天或更高逾期的次數
NumberReal Estate Loans Or Lines:不動產貸款或額度數量:抵押貸款和不動產放款包 括房屋凈值信貸額度
Number Of Time 60-89Days PastDue Not Worse:0-89天逾期次數
NumberOfDependents:不包括本人在內的家屬數量
2.數據處理
2.1缺失值分析處理
traindata=pd.read_csv("C:/Users/Administrator/Desktop/CreditCard/CreditCard/cs_training.csv")#導入數據
traindata.drop_duplicates()#丟棄重復列
import missingno as msno#可視化分析缺失值包
sb.set(font_scale=2.0)
msno.matrix(traindata.sample(500),figsize=(16,7))
總結
以上是生活随笔為你收集整理的python在银行的应用案例_银行风控案例(python)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 前端如何实现音乐盒胶盘的转动_干货来袭!
- 下一篇: websocket python爬虫_p