從事大數(shù)據(jù)征信行業(yè),你必須知道這些

7 評論 25329 瀏覽 105 收藏 11 分鐘

如題,若你從事大數(shù)據(jù)征信行業(yè),這些是必須知道的。

征信行業(yè)歷史起源

征信機(jī)構(gòu)始于19世紀(jì)30年代的美國。雛形是一些商業(yè)調(diào)研機(jī)構(gòu),服務(wù)民間或銀行借貸業(yè)務(wù),獲取信息途徑通過招募些調(diào)研人員去街巷走訪,然后逐漸形成規(guī)模及規(guī)范化。

作為起源之地,美國有3大征信機(jī)構(gòu)都有百年歷史,例如全國性3大個人征信機(jī)構(gòu)益博睿、艾荃法克斯、環(huán)聯(lián)。3大征信機(jī)構(gòu)數(shù)據(jù)源95%相同、覆蓋90%美國人??梢钥闯雒绹恼餍艛?shù)據(jù)覆蓋率是非常廣的。其征信服務(wù)覆蓋行業(yè)也非常多。在美國個人征信收到嚴(yán)格的監(jiān)管,監(jiān)管法律也非常健全,目前企業(yè)征信基本不受監(jiān)管。

中國征信行業(yè)歷史起源

在中國,最早的專職征信機(jī)構(gòu)是中華征信所,于1932年6月6日創(chuàng)辦。國內(nèi)征信行業(yè)快速發(fā)展基本是2003年后開始。在這一年中國人民銀行征信管理局也成立了。2017年6月個人信息安全法出臺,整個征信行業(yè)對數(shù)據(jù)的敏感性輸出做了很大調(diào)整,很多敏感信息接口都主動關(guān)停。

中國央行征信覆蓋情況

國內(nèi),央行征信數(shù)據(jù)其實(shí)只覆蓋了3.8億左右的自然人,覆蓋率非常低,還有幾億人只有簡單的身份數(shù)據(jù)。美國已達(dá)90%以上,因此在國內(nèi)單靠央行數(shù)據(jù)已經(jīng)不太符合創(chuàng)新型的互金行業(yè)信貸產(chǎn)品。從而催生了各式各樣的數(shù)據(jù)公司(包括備案的征信機(jī)構(gòu))嘗試將非央行征信的電商、社交等數(shù)據(jù)應(yīng)用于信貸風(fēng)控,例如京東白條。

中國個人征信行業(yè)查詢規(guī)模情況

無論國外還是國內(nèi),企業(yè)征信的發(fā)展都不如個人征信。從國內(nèi)央行征信查詢數(shù)據(jù)來看,2015年已達(dá)6.3億,這還只是央行體系內(nèi)的數(shù)據(jù)查詢量,可見征信行業(yè)市場可見還是非常巨大。以此類推,央行外的類征信數(shù)據(jù)市場規(guī)模應(yīng)該也是非常客觀。

中國個人征信行業(yè)備案情況

在國內(nèi)還沒有一家征信機(jī)構(gòu)獲得正式牌照。之前沸沸揚(yáng)揚(yáng)的8大征信機(jī)構(gòu)也只是屬于備案階段。國內(nèi)2016年底備案有134家機(jī)構(gòu),最新公布的數(shù)據(jù)其實(shí)只有133家征信機(jī)構(gòu)還在備案,經(jīng)過全面的初步調(diào)研,僅有20%不到的征信機(jī)構(gòu)是屬于有業(yè)務(wù)開展,其他的大多還在籌備和摸索階段。這些備案機(jī)構(gòu)屬于正規(guī)軍,市場上還有很多數(shù)據(jù)科技公司也在做征信業(yè)務(wù),但為了避開監(jiān)管,多打著“信貸風(fēng)控”等名號開展數(shù)據(jù)查詢的交易業(yè)務(wù)。而這些非正規(guī)軍卻非常有活力,各種創(chuàng)新的信貸模型產(chǎn)品層出不窮,具體哪些真的好用,還無法判斷。
后續(xù)將征信備案機(jī)構(gòu)及非備案機(jī)構(gòu)歸類為“大數(shù)據(jù)行業(yè)”機(jī)構(gòu)

中國征信行業(yè)數(shù)據(jù)主要類型

征信行業(yè)使用的數(shù)據(jù)主要包括傳統(tǒng)央行的征信數(shù)據(jù)及互聯(lián)網(wǎng)征信數(shù)據(jù)。

互聯(lián)網(wǎng)征信包含的數(shù)據(jù)主要涉及傳統(tǒng)央行的征信數(shù)據(jù)、經(jīng)營數(shù)據(jù),身份數(shù)據(jù)、社交數(shù)據(jù)、消費(fèi)/財(cái)務(wù)數(shù)據(jù)、乃至日?;顒訑?shù)據(jù)、特定場景下的行為數(shù)據(jù)等。嚴(yán)格來說互聯(lián)網(wǎng)征信數(shù)據(jù)大多數(shù)與個人信用是弱相關(guān)的,因此才有N中關(guān)系型算法來驗(yàn)證各種數(shù)據(jù)相關(guān)性來判斷個人信用可靠性。

傳統(tǒng)征信體系的征信(央行)由于體制和技術(shù)等原因使用多限于金融行業(yè),而互聯(lián)網(wǎng)金融平臺的大數(shù)據(jù)征信結(jié)果往往有在金融業(yè)外的更多應(yīng)用。

中國互聯(lián)網(wǎng)征信行業(yè)數(shù)據(jù)類型

互聯(lián)網(wǎng)征信數(shù)據(jù)使用的比較多的主要有個人身份信息(個人基本信息、教育學(xué)歷信息、駕駛證信息)、個人消費(fèi)相關(guān)數(shù)據(jù)(資產(chǎn)信息、興趣愛好、電商注冊行為),銀行持卡人數(shù)據(jù)(POS交易信息、個人借貸卡賬單信息、線上線下支付數(shù)據(jù)),互聯(lián)網(wǎng)用戶及行為信息(APP瀏覽數(shù)據(jù)、WEB瀏覽數(shù)據(jù)、地理位置信息),司法被執(zhí)行信息(裁判文書信息、履約被執(zhí)行信息、失信行為信息)、借貸黑名單高風(fēng)險客戶名單(傳統(tǒng)金融、互聯(lián)網(wǎng)金融)、航旅信息(出行頻率、票務(wù)信息)、位置信息(實(shí)時位置、常用地址、出行軌跡)等。 但掌握這些信息的企業(yè)基本屬于行業(yè)內(nèi)的巨頭,例如3大運(yùn)營商、京東、淘寶等。

大數(shù)據(jù)的風(fēng)控框架

基于國內(nèi)的征信行業(yè)大調(diào)研,基于大數(shù)據(jù)的風(fēng)控框架大致是這樣。一些枝節(jié)部分其實(shí)對應(yīng)了貸前中后使用到的一些大數(shù)據(jù)及大數(shù)據(jù)的來源。其中對應(yīng)不同環(huán)節(jié)使用的技術(shù)能力和數(shù)據(jù)源要求都不一樣。在P2P等高風(fēng)險行業(yè),使用多頭數(shù)據(jù)來做阻斷或獲客都可以。數(shù)據(jù)的使用不是一成不變,均要看行業(yè)、產(chǎn)品、風(fēng)險定價等靈活使用。在支付環(huán)節(jié),結(jié)合位置信息就成了反盜刷的功能。這里不一一舉例。

大數(shù)據(jù)風(fēng)控行業(yè)類型

圍繞大數(shù)據(jù)框架的整體思路發(fā)展,大數(shù)據(jù)風(fēng)控行業(yè)其實(shí)簡單來分有3種:個人/企業(yè)數(shù)據(jù)接口批發(fā)、個人/企業(yè)數(shù)據(jù)接口整合報(bào)告、個人/企業(yè)數(shù)據(jù)建模及分析系統(tǒng)。圖上均是行業(yè)內(nèi)比較知名的一些機(jī)構(gòu)。產(chǎn)品輸出方式:各類接口直接聯(lián)調(diào)調(diào)用、網(wǎng)頁版登錄查詢及管理、定制化風(fēng)控報(bào)告、聯(lián)合建模。

個人征信模型通用簡版思路

最后說下非全自動的個人征信模型簡版思路:首先需要接入各種各樣的數(shù)據(jù)源,這些數(shù)據(jù)源需要與業(yè)務(wù)需求符合,其次將各類裸數(shù)據(jù)拆分,根據(jù)業(yè)務(wù)類型及其他規(guī)則進(jìn)行特征提取,初步分類。然后,各類特征將根據(jù)不同算法逐一組合成對應(yīng)模型,應(yīng)用與不同業(yè)務(wù)場景。不同模型經(jīng)過機(jī)器學(xué)習(xí)(監(jiān)督學(xué)習(xí)及無監(jiān)督學(xué)習(xí))的方式,輸出相應(yīng)分值,給與各模型相應(yīng)的參考。最好還需要有經(jīng)驗(yàn)人士,根據(jù)得分進(jìn)行最后的決策。

補(bǔ)充

1. 銀行機(jī)構(gòu)等大型企業(yè)的信貸產(chǎn)品多以央行征信數(shù)據(jù)為主,非央行的大數(shù)據(jù)為輔。而消費(fèi)金融及P2P等機(jī)構(gòu),因?yàn)槊鎸Φ目蛻羧?、產(chǎn)品及風(fēng)險等原因,多以非央行大數(shù)據(jù)為主,基本不使用央行數(shù)據(jù)。

2. 國內(nèi)征信行業(yè)合作伙伴默認(rèn)征信系統(tǒng)有2套:央行征信系統(tǒng)和民間借貸征信系統(tǒng)。正常情況,銀行基本都接入了央行征信,因此銀行類客戶對自身信用記錄非常在意。但互金行業(yè)基本沒進(jìn)央行征信系統(tǒng),而是聯(lián)合成立了民間征信平臺。在民間借貸征信系統(tǒng)里,其實(shí)也會影響其借貸行為。特別是現(xiàn)在銀行的信貸產(chǎn)品及信用卡都開始使用多頭借貸這些數(shù)據(jù)輔助

3. 很多小貸公司卻只給多頭借貸名單上有還款能力的客戶借款

#專欄作家#

大數(shù)據(jù)獵人,微信公眾號:大數(shù)據(jù)獵人,人人都是產(chǎn)品經(jīng)理專欄作家。多年金融科技行業(yè)相關(guān)戰(zhàn)略研究、行業(yè)分析、商業(yè)模式及產(chǎn)品體系研究經(jīng)驗(yàn),擅長政府?dāng)?shù)據(jù)+企業(yè)數(shù)據(jù)+公開數(shù)據(jù)多源數(shù)據(jù)融合流通交易及應(yīng)用

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 個人ID lison1989

    來自廣東 回復(fù)
  2. 請問 貸款產(chǎn)品畫像分類中的權(quán)責(zé)分類 指的是什么?

    來自上海 回復(fù)
    1. 應(yīng)該想表述是否是抵押或純信用

      來自廣東 回復(fù)
  3. 滿滿的干貨,“N中關(guān)系型算法”有個錯別字,哈哈。

    來自上海 回復(fù)
    1. ??

      來自廣東 回復(fù)
  4. 干貨,受教了,最近在做政務(wù)信用平臺的業(yè)務(wù),一直在思考做這個的意義,看了樓主的帖子之后有了很多的想法

    來自陜西 回復(fù)
    1. ??

      來自廣東 回復(fù)