风控系统场景分析
1. 背景
2. 數(shù)據(jù)獲取
2.1 數(shù)據(jù)庫(kù)從庫(kù)
2.2 數(shù)據(jù)同步
2.3 pingback
3. 規(guī)則
3.1 名單類
3.1.1 名單類型
3.1.2 名單類別
3.1.3 外部名單
3.2 規(guī)則引擎類
3.2.1 規(guī)則的實(shí)時(shí)性
3.2.2 規(guī)則的范圍
3.2.3 命中規(guī)則的后續(xù)處理
3.2.4 規(guī)則的條件
3.3 兩類規(guī)則對(duì)比
3.4 風(fēng)控顯示大屏以及告警
4 評(píng)分卡
4.1 評(píng)分卡的分類
4.2 評(píng)分卡的基本原理
5. 參考文章
6. 推薦閱讀
本文地址:https://www.cnblogs.com/hchengmx/p/15228092.html
1. 背景
風(fēng)控是一個(gè)非常大的概念,不同的領(lǐng)域?qū)︼L(fēng)控有不同的需求,像跟錢打交道的一些行業(yè),比如 電商、銀行、金融機(jī)構(gòu)對(duì)風(fēng)控的要求也就更多。
這篇文章就來(lái)簡(jiǎn)單介紹一下,風(fēng)控包括什么,以及設(shè)計(jì)一個(gè)風(fēng)控系統(tǒng)過(guò)程中,需要考慮什么?
電商風(fēng)控:風(fēng)控在電商行業(yè)代表是 “反擼羊毛”、“刷單”、“爆單”,“被盜號(hào)” 等
銀行放貸風(fēng)控:貸前調(diào)查來(lái)判斷 還款能力以及還款意愿,貸中審查來(lái)判斷 逾期風(fēng)險(xiǎn),貸后管理來(lái)判斷 催收反應(yīng)等
銀行信用卡:虛假商戶騙積分、信用卡提現(xiàn)等
卡組織:反欺詐、反洗錢、盜刷等
2. 數(shù)據(jù)獲取
一般來(lái)說(shuō),風(fēng)控的非實(shí)時(shí)數(shù)據(jù)采集,不能直接從線上的數(shù)據(jù)庫(kù)中讀取,這會(huì)把數(shù)據(jù)庫(kù)打死。主要的數(shù)據(jù)采集方式有從庫(kù)采集,日志采集和pingback三種方式。
2.1 數(shù)據(jù)庫(kù)從庫(kù)
主流數(shù)據(jù)庫(kù),如Hbase,Mysql都提供同步數(shù)據(jù)進(jìn)從庫(kù)的功能,幾個(gè)數(shù)據(jù)庫(kù)數(shù)據(jù)完全相同,主庫(kù)可以讀寫(xiě),從庫(kù)只讀,讀取從庫(kù)不會(huì)影響主庫(kù)操作。
2.2 數(shù)據(jù)同步
上游異步把數(shù)據(jù)送給風(fēng)控系統(tǒng),一種方式是通過(guò)上游系統(tǒng)主動(dòng)送,比如說(shuō)RocketMQ,上游完成數(shù)據(jù)采集后,把數(shù)據(jù)異步送給下游。
另外一種方式是通過(guò)日志采集,將風(fēng)控需要的數(shù)據(jù)輸出到日志中,風(fēng)控?cái)?shù)據(jù)對(duì)對(duì)接日志異步進(jìn)行采集。
2.3 pingback
Pingback指在頁(yè)面上埋入腳本來(lái)監(jiān)測(cè)用戶的操作,特別是點(diǎn)擊操作和鍵盤操作,將檢測(cè)到的用戶行為異步發(fā)送到服務(wù)器端。這可以偵測(cè)到用戶在頁(yè)面停留時(shí)間,鼠標(biāo)點(diǎn)擊的區(qū)域等信息,由此可以推斷用戶偏好,情緒等信息。 pingback的挑戰(zhàn)在于如何在服務(wù)器端應(yīng)對(duì)流量洪峰。pingback數(shù)據(jù)一般不直接入庫(kù),可以先寫(xiě)入Kafka,風(fēng)控系統(tǒng)對(duì)接Kafka來(lái)分析pingback數(shù)據(jù)。
3. 規(guī)則
規(guī)則是用來(lái)判斷一筆交易、一筆訂單是不是違反了系統(tǒng)中的已有規(guī)則,規(guī)則我認(rèn)為可以分為兩大類,一類是名單類的規(guī)則,一個(gè)是規(guī)則引擎類的規(guī)則。
這兩類規(guī)則的特點(diǎn)不同,也就擁有不同的技術(shù)方案。
3.1 名單類
名單類來(lái)說(shuō)相對(duì)比較簡(jiǎn)單,一個(gè)名單通常情況下包括 “名單類型 + 名單類別 + 名單唯一鍵 + 生效/失效時(shí)間”。
所以名單類的規(guī)則也通常是 實(shí)時(shí)計(jì)算的。
3.1.1 名單類型
名單類型包括:黑白灰三種名單。
黑名單:必須阻止
白名單:必須放行
灰名單:不是直接阻止,而是延遲交易,需要人工確認(rèn)后再?zèng)Q定放行不放行
3.1.2 名單類別
注冊(cè)登錄:手機(jī)號(hào)黑名單
銀行實(shí)時(shí)交易系統(tǒng):商戶黑名單、終端黑名單
商城系統(tǒng):IP黑名單
3.1.3 外部名單
除了公司內(nèi)部維護(hù)名單,在還可以引入一些外部名單加入名單。
聯(lián)合國(guó)安理會(huì)發(fā)布的恐怖分子制裁名單1
全國(guó)法院失信被執(zhí)行人名單信息公布與查詢2
中國(guó)裁判文書(shū)網(wǎng)3。
3.2 規(guī)則引擎類
在設(shè)計(jì)規(guī)則引擎的時(shí)候,需要考慮以下幾個(gè)方面。
3.2.1 規(guī)則的實(shí)時(shí)性
業(yè)務(wù)方首先需要確定規(guī)則的實(shí)時(shí)性需求,實(shí)時(shí)處理當(dāng)然是最好的,但是實(shí)時(shí)處理就對(duì)于系統(tǒng)的性能要求極高。大多數(shù)風(fēng)控系統(tǒng)也不會(huì)采取大量的實(shí)時(shí)處理,就算實(shí)時(shí)處理,也通常采用比較簡(jiǎn)單的規(guī)則,也有用準(zhǔn)實(shí)時(shí)處理 或者 非實(shí)時(shí)處理的,準(zhǔn)實(shí)時(shí)時(shí)效性沒(méi)有那么強(qiáng),可能幾分鐘或者幾小時(shí)再進(jìn)行處理。
實(shí)時(shí)性的系統(tǒng):聯(lián)機(jī)交易系統(tǒng),比如用戶A在凌晨給海外匯款,1個(gè)億的交易涉及到了反洗錢,要是不實(shí)時(shí)拒絕的話,這一個(gè)億可能就沒(méi)了。
準(zhǔn)實(shí)時(shí)處理:銀行貸款系統(tǒng),因?yàn)殂y行貸款系統(tǒng)并不需要說(shuō),立即給客戶反饋放不放款,但也不能太慢,就可以用準(zhǔn)實(shí)時(shí)處理。
3.2.2 規(guī)則的范圍
規(guī)則需要對(duì)于全網(wǎng)都生效嗎?還是只針對(duì)某些商戶類型、某些銀行卡、某個(gè)地區(qū)生效就行。
要是需要的話,在創(chuàng)建規(guī)則的時(shí)候,就需要添加一個(gè)屬性,范圍。
3.2.3 命中規(guī)則的后續(xù)處理
命中這個(gè)規(guī)則后,后續(xù)該執(zhí)行什么操作,有幾種選擇。
警告,拒絕掉這一筆交易,把這個(gè)賬戶加入黑名單。
3.2.4 規(guī)則的條件
且、或。
例子1:發(fā)生一筆消費(fèi),商戶類型為 大型超市 并且 (交易時(shí)間在 00:00 - 02:00 或者 22:00 - 23:59)
例子2:發(fā)生一筆交易,交易金額 > 10w元 并且 交易類型 != 消費(fèi)
這種規(guī)則就需要把報(bào)文中的某幾個(gè)字段取出來(lái),再判斷是不是滿足規(guī)則條件。常見(jiàn)的操作符包括 等于=,不等于!=,大于 >,小于 <,在某幾個(gè)值中 in,不在某幾個(gè)值中 out。
累計(jì)
上面的幾個(gè)例子,都是靜態(tài)的數(shù)據(jù),但系統(tǒng)中可能還存在動(dòng)態(tài)的數(shù)據(jù),某用戶當(dāng)月的消費(fèi)額,就要累計(jì)計(jì)算。
例子3:在銀行系的風(fēng)控中,統(tǒng)計(jì)一張卡在同一個(gè)終端下,連續(xù)交易的天數(shù),要是超過(guò)20天,就認(rèn)為是刷單。
例子4:在電商系統(tǒng)中,同一個(gè)賬號(hào)在同一個(gè)商戶下,過(guò)去30分鐘內(nèi),有超過(guò)5次購(gòu)買記錄,就認(rèn)為是刷單。
例子5:電商系統(tǒng)中,某用戶當(dāng)月的無(wú)門檻優(yōu)惠券超過(guò)10張,就認(rèn)為是系統(tǒng)bug。
以例3為例,這種規(guī)則的需要分為兩步:1. 把累計(jì)值算出來(lái),先統(tǒng)計(jì)連續(xù)交易的天數(shù) 2. 規(guī)則里面再配置,連續(xù)交易的天數(shù)是不是大于20,要是大于20,才算命中規(guī)則
數(shù)學(xué)表達(dá)式
在更復(fù)雜的一些風(fēng)控系統(tǒng)中,還會(huì)支持這樣的規(guī)則。涉及到了數(shù)學(xué)中的一些計(jì)算。
例子6:同一張卡在同一個(gè)商戶下當(dāng)月的消費(fèi)金額 占這張卡當(dāng)月所有消費(fèi)金額的 95%以上 并且 此張卡當(dāng)月消費(fèi)金額 > 10筆
例子7:統(tǒng)計(jì)某店鋪當(dāng)月的消費(fèi)筆數(shù) 和 它上個(gè)月的消費(fèi)筆數(shù),要是當(dāng)月的消費(fèi)筆數(shù) > 上月消費(fèi)筆數(shù)的10倍,就算命中規(guī)則
這就需要先把數(shù)值累計(jì)算出來(lái),再來(lái)判斷數(shù)學(xué)表達(dá)式的值是真是假。
3.3 兩類規(guī)則對(duì)比
名單數(shù)據(jù)在使用上的特點(diǎn):
使用頻率高,實(shí)時(shí)性要求高。各種名單匹配基本都需要在線上做實(shí)時(shí)計(jì)算。
數(shù)據(jù)粒度小,總量大小不一,但存儲(chǔ)空間需求都不高。大部分名單都是一些號(hào)碼表,幾個(gè)G的空間都能存儲(chǔ)。
更新頻率低。名單數(shù)據(jù)一般都比較穩(wěn)定,按天更新
在使用中,名單數(shù)據(jù)一般直接存儲(chǔ)在內(nèi)存中,或者使用內(nèi)存數(shù)據(jù)庫(kù)(Redis,Couchbase)
而規(guī)則引擎的特點(diǎn)
配置靈活,要支持基本字段的 且、或、非
復(fù)雜一點(diǎn)的,還需要支持累計(jì) 以及數(shù)學(xué)表達(dá)式
在使用中,規(guī)則引擎類的,會(huì)使用drools、Jess、ILog。
3.4 風(fēng)控顯示大屏以及告警
對(duì)于實(shí)時(shí)風(fēng)控來(lái)說(shuō),時(shí)效性比較重要。經(jīng)常會(huì)出現(xiàn) 某半個(gè)小時(shí)內(nèi),某個(gè)規(guī)則被集中命中,需要人工介入進(jìn)行進(jìn)一步的處理的情況。
要是確認(rèn)該用戶有違法操作,就需要把該用戶加入黑名單,或者進(jìn)行限流等操作,要是該規(guī)則配置要問(wèn)題,就需要對(duì)規(guī)則進(jìn)行及時(shí)下線的操作。
對(duì)于運(yùn)維人員就需要有一個(gè)風(fēng)控監(jiān)控大屏,來(lái)及時(shí)顯示什么規(guī)則被命中,統(tǒng)計(jì)某規(guī)則過(guò)去多長(zhǎng)時(shí)間內(nèi)的命中次數(shù)。
業(yè)界常見(jiàn)采用的方法是通過(guò),開(kāi)發(fā)代碼中命中規(guī)則以后,打印日志,監(jiān)控平臺(tái)再通過(guò)異步分析日志把數(shù)據(jù)以圖表的方式顯示出來(lái)。
4 評(píng)分卡
評(píng)分卡多用于貸款機(jī)構(gòu),通過(guò)對(duì)客戶實(shí)行打分制,以期對(duì)客戶有一個(gè)優(yōu)質(zhì)與否的評(píng)判。這種的風(fēng)控跟規(guī)則類的風(fēng)控不一樣,一個(gè)人過(guò)來(lái)貸款,他可能之前沒(méi)有在機(jī)構(gòu)貸過(guò)款,沒(méi)有任何歷史記錄參考,那怎么來(lái)決定放不放款給TA呢?
4.1 評(píng)分卡的分類
A卡 申請(qǐng)?jiān)u分卡(Application scorecard):用于貸前審批階段對(duì)借款申請(qǐng)人的量化評(píng)估
B卡 行為評(píng)分卡(Behavior scorecard):通過(guò)借款人的還款及交易行為,結(jié)合其他維度的數(shù)據(jù)預(yù)測(cè)借款人未來(lái)的還款能力和意愿
C卡 催收評(píng)分卡(Collection scorecard):當(dāng)借款人當(dāng)前還款狀態(tài)為逾期的情況下,預(yù)測(cè)未來(lái)這筆貸款變成壞賬的概率,由此衍生出 滾動(dòng)率、還款率、失聯(lián)率等細(xì)分的模型。
4.2 評(píng)分卡的基本原理
評(píng)分卡的核心,我理解就是通過(guò)評(píng)分,來(lái)判斷出來(lái) 什么是 “好客戶”、什么是 “壞客戶”。
構(gòu)建評(píng)分模型
通過(guò)幾個(gè)渠道來(lái)構(gòu)建評(píng)分模型
本公司其他平臺(tái),比如 臺(tái)賬系統(tǒng)、監(jiān)管系統(tǒng)、理財(cái)平臺(tái)等
人民銀行的征信系統(tǒng)
第三方合作機(jī)構(gòu)的系統(tǒng),比如其他商業(yè)銀行等
通過(guò)一系列建模,就得到類似于這樣的一張圖(建模細(xì)節(jié)和公式這篇文章不細(xì)講):
WOE(Weight of Evidence)叫做證據(jù)權(quán)重,IV(Information Value)叫做信息價(jià)值,是一組評(píng)估變量的預(yù)測(cè)能力的指標(biāo)。也就是說(shuō),當(dāng)我們想要拿出證據(jù)證明“年齡”這個(gè)變量對(duì)于違約概率是否有影響的時(shí)候,可以使用這個(gè)指標(biāo)評(píng)估年齡到底對(duì)違約概率的影響有多大。
下面表格展示的就是年齡、性別及婚姻狀況三個(gè)變量相關(guān)的好壞樣本數(shù)據(jù)以及計(jì)算出的對(duì)應(yīng)的WOE及IV值。WOE的計(jì)算公式是:ln[(違約/總違約)/(正常/總正常)]。比如對(duì)于年齡18~25的組別,WOE=In[(131/總違約樣本數(shù))/(1016/總正常樣本數(shù))]。根據(jù)WOE值,可以進(jìn)一步計(jì)算出IV值。
建模細(xì)節(jié)和公式這篇文章不細(xì)講了,具體可參考:
這一次,真正搞懂信用評(píng)分模型(上篇) - 知乎4
WOE信用評(píng)分卡--R語(yǔ)言實(shí)例_軍軍的專欄-CSDN博客5
打分
用戶的基本信息:學(xué)歷、年齡、婚否、是否有抵押物、年薪等進(jìn)行打分。最終看這個(gè)分?jǐn)?shù)在哪個(gè)區(qū)間,再來(lái)判斷 是否放款、放寬多少。
5. 參考文章
1. 聯(lián)合國(guó)安理會(huì)發(fā)布的恐怖分子制裁名單
2. 全國(guó)法院失信被執(zhí)行人名單信息公布與查詢
3. 中國(guó)裁判文書(shū)網(wǎng)
4. 這一次,真正搞懂信用評(píng)分模型(上篇)
5. WOE信用評(píng)分卡--R語(yǔ)言實(shí)例_軍軍的專欄-CSDN博客
6. 這一次,真正搞懂信用評(píng)分模型(之二) - 知乎
6. 推薦閱讀
如何看待拼多多出現(xiàn) 100 元無(wú)門檻優(yōu)惠券的漏洞?可能的技術(shù)原因是什么?羊毛黨行為是否具有法律風(fēng)險(xiǎn)? - 半佛仙人的回答 - 知乎
評(píng)分卡都看不懂,怎么能說(shuō)自己是做風(fēng)控的? | 人人都是產(chǎn)品經(jīng)理
支付風(fēng)控系統(tǒng)設(shè)計(jì):支付風(fēng)控場(chǎng)景分析(一) | 人人都是產(chǎn)品經(jīng)理
總結(jié)
- 上一篇: 简单使用BurpSuite及请求包、响应
- 下一篇: 喘息性支气管炎能不能吃西兰花