模型在風(fēng)控策略中用到什么細(xì)節(jié)?
編輯導(dǎo)語:風(fēng)控一般包含很多類型的規(guī)則,每個(gè)規(guī)則都是結(jié)合產(chǎn)品、業(yè)務(wù)基于經(jīng)驗(yàn)和數(shù)據(jù)分析產(chǎn)生出來的,模型在風(fēng)控中也有很大的作用;本文作者分析了模型在風(fēng)控策略里有什么使用細(xì)節(jié),我們一起來看一下。
模型:通過歷史樣本數(shù)據(jù),運(yùn)用數(shù)學(xué)算法,預(yù)測未來;我們通用的信用模型a卡就是根據(jù)客戶的申請數(shù)據(jù)字段,然后在權(quán)重上通過算法計(jì)算出來的系數(shù)的組合,得到相應(yīng)的預(yù)測概率(0-1之間),這就是最初的模型——它代表的是預(yù)測客戶發(fā)生逾期的概率,模型評分卡只是方便管理而轉(zhuǎn)化來的。
策略:即為了目標(biāo)的實(shí)現(xiàn),通過一系列的規(guī)則組合,而成為策略。
所以風(fēng)控會(huì)出現(xiàn)有很多的名詞:因子、規(guī)則、規(guī)則集、策略、策略集、事件等等。
風(fēng)控最基本的因素是因子,因子構(gòu)成規(guī)則,多個(gè)功能相似的屬性規(guī)則組成規(guī)則集,多個(gè)規(guī)則集再成為策略;例如反欺詐策略,準(zhǔn)入策略、額度策略、模型策略,這些組合成策略集,而整個(gè)策略集構(gòu)成了風(fēng)控的一個(gè)貸前審核事件。
大概介紹了風(fēng)控相關(guān)的一些概念,那模型在風(fēng)控屬于什么位置呢?
其實(shí)可以理解模型就是一個(gè)因子,他可以單作為一條規(guī)則,成為只有一個(gè)規(guī)則的規(guī)則集,一個(gè)策略集,一個(gè)事件;有伙伴們問規(guī)則、模型、策略,都是具體怎么使用的,怎么組合的,規(guī)則和模型的區(qū)別等等,熟悉上面的邏輯就大概清晰了。
另一個(gè)模型之所以在風(fēng)控中的有著重要地位,是由于模型通過多個(gè)規(guī)則因子(也就是蘊(yùn)含了更多的規(guī)則)組合而來,它代表一系列規(guī)則因子的風(fēng)險(xiǎn)預(yù)測能力;所以它比任何一條規(guī)則都具有很好的區(qū)分度,所以模型這個(gè)單一的因子,生成單一的規(guī)則,比起其他簡單規(guī)則在風(fēng)控中的地位高了很多。
話說回來,模型概率或分?jǐn)?shù)在風(fēng)控里回歸到一個(gè)因子,如何具體應(yīng)用呢?
一、選擇cutoff,即決策點(diǎn)
(模型決策表)
這個(gè)圖是根據(jù)模型衍生出的風(fēng)控策略決策表,當(dāng)我們的模型做出來了,我們是怎么選擇cutoff呢?
假如這個(gè)模型是做了拒絕演繹的模型,代表全部樣本的分布評分;我們先看bin_pdrate 從逾期78.57%單調(diào)下降到1.85%,模型的單調(diào)性很完美,ks為23,bin_rate是箱占比,整體上還是很正態(tài)分布的。
重要的我們看后兩列,這兩列是通過前幾列計(jì)算的在每個(gè)閾值點(diǎn)下的通過率和對應(yīng)的壞賬率,隨著通過率的降低,壞賬也隨著降低。
風(fēng)控往往有幾個(gè)KPI考核指標(biāo),如壞賬率;如果KPI不能大于7,我們選擇了大于680分,30.16%的通過率,這是一個(gè)簡單的選擇。
有的公司會(huì)復(fù)雜的計(jì)算每一行的盈利情況,然后根據(jù)盈利來決定cutoff選擇哪一個(gè)。
方法多種,有的可能30%的通過率達(dá)不到KPI,會(huì)選擇630-680之間的一部分客戶進(jìn)行人工審核、信審,或者再利用其它的數(shù)據(jù)模型進(jìn)行撈回,下面講下?lián)苹氐牟呗允侨绾问褂媚P偷摹?/p>
二、模型撈回之提高通過率,精細(xì)化風(fēng)險(xiǎn)評估
撈回就是被模型拒絕的一些相對不差的客戶用其它有區(qū)分度的模型進(jìn)行再次評估,達(dá)到提高通過率的效果。
(模型矩陣表)
拿我們常用的模型矩陣來說,這個(gè)與分群建模的思路是一樣的,上圖(圖中數(shù)據(jù)非真實(shí)模擬)中是通過矩陣壞賬的比例高低然后給與不同的額度。
在申請分660-679之中,我們通過芝麻分可以更好的再區(qū)分這個(gè)區(qū)間的人群風(fēng)險(xiǎn),做到精細(xì)化管理,在申請分660-679中我可以選擇芝麻分在大于680,額度為大于10000的的客戶進(jìn)行放款;因?yàn)檫@部分客戶的模型風(fēng)險(xiǎn)跟申請分大于680的同顏色的相同,這樣就可以根據(jù)模型矩陣來提高通過率。
三、多模型補(bǔ)漏之更合理地選擇客戶
(模型補(bǔ)漏策略)
在實(shí)際場景中,我們還會(huì)遇到另一種情況,就是我們模型的數(shù)據(jù)不是完全覆蓋的,有一定的缺失,一定的查得率,這時(shí)候往往不是一個(gè)模型可以解決問題的;因?yàn)槟悴荒芤驗(yàn)闆]有數(shù)據(jù)而拒絕,這時(shí)候往往需要過多個(gè)模型進(jìn)行互相補(bǔ)漏。
也就是說,如果有5個(gè)備用模型,在很大概率是可以決策任何一個(gè)用戶的借貸情況,模型的數(shù)據(jù)源越多,就可以覆蓋越多的客群,更大化的對客戶進(jìn)行合理的風(fēng)險(xiǎn)評估。
例如第一個(gè)模型A沒有數(shù)據(jù),則運(yùn)行模型B,按順序依次調(diào)取;一般模型運(yùn)用策略是最好的,覆蓋最高的放在前面。
四、多模型組合使用之整體風(fēng)險(xiǎn)穩(wěn)定
(模型組合表)圖表模型名稱敏感用字母替換
這個(gè)風(fēng)控模型不僅可以作為模型A-B Test使用,來測試新模型的效果(此表同時(shí)跑了8模型,每個(gè)模型分配不同的流量),然后對測試模型進(jìn)行效果評估。
另外,通過長時(shí)間的工作經(jīng)驗(yàn)積累,還可以將幾個(gè)有區(qū)分度的模型分流組合使用,整體效果會(huì)更好;原因主要是數(shù)據(jù)的穩(wěn)定性、數(shù)據(jù)的衰減性、市場等,往往多模型組合較單個(gè)模型使用,具有更穩(wěn)定的數(shù)據(jù)表現(xiàn)和更好的理想效果。
并不是我們認(rèn)為模型A是最好的,然后就全部流量給A,因?yàn)槎冀oA會(huì)存在很大的不確定性;例如數(shù)據(jù)源停供、數(shù)據(jù)源出現(xiàn)失真、數(shù)據(jù)源預(yù)測質(zhì)量明顯下降;這些現(xiàn)象,在實(shí)際工作中是經(jīng)常遇到的,事后發(fā)現(xiàn)就有些晚了。
反過來,通過幾個(gè)較好模型的組合,會(huì)發(fā)現(xiàn)有更穩(wěn)定、更理想的數(shù)據(jù)表現(xiàn),圖中無淘寶模型用了5個(gè)模型進(jìn)行組合。
五、模型日志的的重要性
(模型日志)
上文是簡要的一個(gè)模型使用變動(dòng)的所有記錄日志,這個(gè)一定要重視起來;我們工作中有很多需要回溯的時(shí)間,或者風(fēng)控表現(xiàn)滯后,往往再排查原因不能準(zhǔn)確的定位,就比較浪費(fèi)時(shí)間了,最后還可能找不到原因。
假如今天客群表現(xiàn)很差,我提前知道某天前改動(dòng)了模型的閾值,正好今天有表現(xiàn),這時(shí)候往往會(huì)很快的定位。
數(shù)據(jù)風(fēng)險(xiǎn)的變動(dòng)無外乎兩種,外部的客群和內(nèi)部的風(fēng)控,風(fēng)控日志的每個(gè)變動(dòng)都會(huì)帶來風(fēng)險(xiǎn)的變動(dòng)。
所以找任何原因從日志上下手是最方便的,他就像我們寫代碼的log日志,很好很方便,也很需要,直接告訴你病點(diǎn)在哪。
以上是模型具體使用的一些細(xì)節(jié),在如何選擇決策點(diǎn)、模型撈回、模型補(bǔ)漏、模型組合、模型日志上進(jìn)行具體的風(fēng)控實(shí)施。
希望可以給讀者在思路的一些幫助與完善,謝謝!
本文由 @FAL金科應(yīng)用研院 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 unsplash,基于 CC0 協(xié)議
- 目前還沒評論,等你發(fā)揮!